2019.03.12 (화)

  • 맑음동두천 3.6℃
  • 구름많음강릉 8.6℃
  • 맑음서울 5.2℃
  • 대전 6.3℃
  • 흐림대구 9.0℃
  • 맑음울산 8.5℃
  • 맑음광주 5.8℃
  • 맑음부산 8.9℃
  • 구름많음고창 5.6℃
  • 박무제주 9.2℃
  • 맑음강화 5.0℃
  • 맑음보은 5.7℃
  • 맑음금산 5.6℃
  • 맑음강진군 7.3℃
  • 구름많음경주시 5.9℃
  • 맑음거제 7.9℃
기상청 제공

기자가 만난 사람

금융과 데이터과학이 만나다

- 본교 경상대 금융 데이터 분석학회 ‘DART(Data Analysis Revolutionary Think)’


▲제14회 전국 대학생 증권파생상품 경시대회 수상 후 기념 사진을 촬영하고 있는 DART 회원들. 왼쪽부터 황범주(경상대 경제통상 11), 김홍재(경상대 경제통상 17), 하주형(경상대 경제통상 14), 정한욱(경상대 경제통상 16), 송재우(인문대 중어중문 13), 변호정(경상대 경영 15), 공다원(경상대 경영 15) 씨. (사진제공 : DART)


지난달 15일 한국거래소가 주최한 제14회 전국 대학생 증권파생상품 경시대회에서 여섯 팀이 수상을 했다. 이 중 두 팀은 본교 경상대 소속의 학술동아리인 DART 소속 학생들이었다. DART에서는 어떤 공부를 하고, 어떤 지향점을 가지고 있는지, DART 회원들과 함께 그들이 생각하는 ‘금융과 데이터 사이언스의 접목’에 대한 이야기를 나눠봤다●


Q. ‘금융 데이터 분석학회’라는 말이 다소 생소하게 느껴질 수도 있는데, 금융데이터란 무엇인가?

김홍재(경상대 경제 17, 이하 김): 데이터는 ‘정형적’이라는 선입견이 있다. 물론 정형 데이터도 많이 쓰지만, 최근에는 비정형 데이터까지 그 영역이 넓어지고 있는 중이다. 보통은 주식 수치, 가격, 거래량 등의 정형화된 지표 데이터들을 많이 사용한다. DART에서는 신입 학회원이 들어오면 정량적 지표를 사용하는 것을 넘어, 뉴스데이터 등의 비정형 데이터도 함께 사용하여 금융 분야에 대한 분석을 하는 것을 목표로 하고 있다.

하주형(경상대 경제 14, 이하 하): 최근 이슈 중 ‘빅데이터’가 주목을 받고 있지 않나. 기존에 은행이나 금융 증권 분야에서 비교적 적은 데이터를 활용해 고객을 분석하던 것을 넘어서, 대용량 데이터를 처리해야 하는 시대가 왔으므로 이를 위한 분석 및 연구를 하고 있다.


Q. 한국거래소 ‘전국 대학생 증권파생상품 경시대회’에서 입상을 했는데, 한 동아리에서 두 팀이 입상한 것이 특이하다. 대회 준비 과정은 어땠나?

황범주(경상대 경제 11, 이하 황): 해당 대회는 대학생이 참가할 수 있는 금융파생 논문 공모전 중 가장 큰 대회다. 그렇기 때문에 도전해보고자 하는 마음이 있었다.

김: 작년에 학회를 시작할 때에도 이 대회를 염두에 두고 있었다. 우리가 고민했던 것들, 학회에서 활동했던 것들이 경쟁력을 갖추고 있는지를 확인해보고 싶기도 했다. 이번 대회의 경험을 통해서 좋은 결과를 얻은 것도 중요하지만, 대회를 준비하면서 동아리원들이 지향하는 바가 명확해진 데에 큰 의의가 있다.

하: 우리 팀의 주제는 ‘텍스트 마이닝과 LSA 기법을 활용한 상장폐지 종목 예측 모델링 연구’였다. 예선에 참가할 연구 계획서를 작성하는데, 원래 준비하던 주제가 잘 풀리지 않아 제출 마감일 바로 전날에 엎은 일이 있다. 그래서 하루 만에 연구 계획서를 다시 작성했다. 예선을 통과해야 본선에 갈 수 있으니까, 밤을 다 새면서 준비하긴 했지만 하루 동안 새로 쓴 계획서로 통과 될 줄은 정말 몰랐다. 본선 진출 발표가 난 후에는 정말 기뻤고, 그때부터 더욱 마음을 다잡고 최선을 다한 덕에 좋은 결과를 얻은 것 같다. 팀 이름도 밤샘 중에 치킨을 시켜먹다가 ‘후참’이라는 단어를 따와 ‘HUCHAM’으로 지어 붙였는데, 수상할 때에 담당자 분이 ‘휴챔’으로 읽어야 하는 것이냐며 물어봤었던 에피소드도 있다.

김: 한글 텍스트 자료의 자연어 처리 과정은 굉장히 복잡하다. 명사, 조사 등을 하나하나 분류하는 게 쉽지 않다. 예를 들어 북한에 관한 텍스트 마이닝을 할 때 조사 ‘은’을 빼다 보면 ‘김정은’에서 은이 빠져 ‘김정’이 돼버리는 상황이 발생할 수도 있다. 그런 것을 다 분류하고, 분석하고, 추출 해야 했기 때문에 쉽지 않았다.

황: 우리 팀은 ‘다트사랑’이라는 베이직한 이름으로 갔다. 주제는 ‘코스닥 시장 내에 상장된 중국기업들의 가치할인에 관한 연구’였다. 이걸 통계적으로 분석하려면 표본이 많아야 하는데, 국내에 진출한 중국기업 자체가 별로 없어서 표본이 적다는 난관에 봉착했었다. 통계적으로 유의미할 수가 없는 수치였으므로, 검증방법을 바꾸는 대안을 활용해 좋은 결과를 얻었다. 코스닥 시장의 중국기업들이 어느 순간부터 비슷한 수준의 한국기업에 비해 낮은 수익률을 기록했는데, 이걸 통계적으로 분석한 사례는 없었다. 한국거래소에서도 실제로 이 현상을 주목하고 있었다더라. 우리 팀의 주제가 시의적절했기 때문에 평가를 잘 받은 것 같다. 한국거래소 상무님이 평가를 했는데, 발표를 하는 열 개 팀 중에 우리 팀에게만 코멘트를 해 줬다.


Q. 대회를 준비하며 가장 인상 깊었던 일이 있다면?

황: HUCHAM팀의 주제에서는 비정형 데이터인 뉴스 텍스트를 LSA라는 토픽 모델링 기법을 사용하여 사용한다. 글의 행간을 보며 맥락과 의미를 도출하는 것이다. 미국 시장에서는 이러한 기법이 많이 활용되고 있지만 한국에서 이 기법을 적용한 사례는 잘 없었다. 그런데 대회를 준비하며 상장 폐지될 것으로 예측한 기업이 실제로 폐지된 일이 있다. 수상을 하기 위해 한국거래소 서울사무소가 위치한 여의도에 갔는데, HUCHAM팀에서 상장 폐지될 것으로 예측했던 기업이 정말 폐지되어 그 기업의 투자 피해자들이 피켓을 들고 한국거래소 근처에서 시위하는 모습을 보고 깜짝 놀랐다.


 Q. 앞으로의 학회 운영 및 활동에 대한 계획은 무엇인가?

하: DART는 2년차 학회이기 때문에 분위기가 굉장히 자유로운 것이 특징이다. 학회 안에 관습이나 권위적인 문화가 없다. 그렇기 때문에 새로운 프로그램이 있으면 도입하여 계속해서 변화를 시도하는 단계에 있고, 이런 부분에서 학회 운영의 원동력을 얻는다. 금융공학과 데이터 분석을 함께 하는 동아리인 만큼 앞으로 금융공학 중점 커리큘럼뿐만 아니라 교수님들, 선배 멘토님들과의 협업을 통해 금융데이터 분석에 관한 커리큘럼도 만들어 나가려고 한다. 오는 14일까지 신입 회원을 모집하고 있으니 동아리에 관심 있는 학우들이 많이 지원을 해주면 좋겠다.

김: IQC(International Quant Championship)라는 대회가 있다. WorldQuant라는 미국 퀀트투자회사에서 주최하는 국제 대회인데, 작년에 DART가 이 대회에서 국내 5위세계 25위로 입상을 했다. 올해도 대회 참가를 준비하고 있다. 이러한 분야에 관심이 많은 학생이라면 DART에서 다양한 것들을 함께 할 수 있을 것이다.

공다원(경상대 경영 15): 제 경우에는 코딩에 대해서도 아예 모르고, 데이터 분석도 모르는 상태로 DART에 가입 했다. 그때가 4학년이었는데, 한 번 배워보고 싶다는 생각만으로 가입한 것이다. DART에는 경상대학뿐만 아니라 인문대, 공대 등 다양한 전공의 학생이 모여 활동하고 있다. 이렇듯 다른 전공자도 열심히 하기만 하면 충분히 성취할 수 있으니, 학우들이 금융 및 데이터 분석 분야에 대한 자신감이 없다고 두려워하지만 말고 다가와 줬으면 좋겠다.



조현영 전임기자



포토/만평