한국거래소 제2회 알고리즘 주식투자 경진대회
데이터 사이언스에서 주요한 데이터 타입은 크게 4가지가 있는것 같습니다.

1. 테이블 데이터
2. 시계열 데이터
3. 이미지 데이터
4. 자연어 데이터

입니다.

이 중 하나를 굳이 하나를  시계열 데이터에 특히 매력을 많이 느꼈습니다. 그리고 이때 마침 직장에서도 퇴사하고 졸업시기도 맞물려서 괜찮은 대회를 찾아보다 [한국거래소 제2회 알고리즘 주식투자 경진대회]에 참여하기로 합니다.

대회가 실제로 모델 로직 기반으로 한달간 검증을 진행하기에 data-leakage 문제는 없는 스타일 이었습니다

저는 예선에는 유사도 기반의 의사결정을 진행하는 모델을 구축 했습니다. 이전 프로젝트가 추천시스템을 구축하는 일이었기에 굉장히 유사도에 빠져있던 시기였습니다. 그렇기에 거시경제 지표 유사도로 현재와 유사한 시점을 찾고 현재와 유사한 시점에 많이 오른 / 내린 종목을 long / short 치는 방식으로 로직을 짯습니다.

운이 작용했지만 어찌되었든 안정적으로 본선에 진출할 수 있는 수익률을 얻을 수 있었습니다.

본선에서는 한국거래소의 유료데이터 활용이 가능해졌습니다. 또한 예선과 달리 포트폴리오 구축이 아닌 약 30일간 5000만원을 초기자금으로 실제 구매와 판매를 진행하는 파이썬 라이브러리를 구축 해야 했습니다.

이는 단순 종목 선택이 아닌

종목 선택 -> 종목별 구매 수량 ->  판매 종목 선택 -> 종목별 판매 기준 설립 및 이행 

을 해야했기에 꽤나 까다로웠습니다.

저는 유사도와 기울기를 기반으로 펀더먼탈한 지표를 평가하고 구매에 적용하며 판매에는 테크니컬한 지표를 활용하여 라이브러리를 구축 하였습니다. 이때 처음으로 활용가능한 라이브러리를 구축해본 경험이 이후 다양한 프로젝트에 도움이 된것 같습니다.

개인적으로 생각하기에 이미지나 자연어처리 말고 압도적인 성능의 모델이 없는 알고리즘 매매인 만큼 온전히 제가 원하는 로직을 구축하고 구현하는 재미가 있는 프로젝트였습니다.


kajei31

 

+ Recent posts