Untitled

개요


Reinforce Learning DQN 모델


# 구분 내용 비고
1 데이터 수집 및 Feature 선택 모델에 사용할 feature 선택 및 데이터 수집 예시 : 주문수, 클릭수, 거래액 등
2 환경 및 보상 정의 선택한 Feature(=Status, 상태)를 바탕으로 내부 환경 및 보상 정의 예시 : 거래액이 높아지면 긍정적인 보상을 준다. 가격을 높인다.
3 모델이 제공한 가격 선택 모델이 선택한 가격을 확인 후 제공 DQN 모델 사용
4 일정 시간 지난 후 상태 정보 확인 일정 시간이 지난 후 다시 내부 지표를 확인(status)하고 다시 가격을 제공받음. 이후 3, 4를 반복

모델 성능 평가


사용 기술


Python, Pytorch, GYM, SQL, Hadoop, Pyspark, Jenkins, Git