암호화폐 정서분석으로 가격을 예측할 수 있을까?
이 기사를 공유합니다
코인데스크코리아
코인데스크코리아 2019년 12월20일 11:40
* 글쓴이 헤수스 로드리게스는 암호화폐 시장의 지능 인프라에 초점을 맞춘 플랫폼 인투더블록(IntoTheBlock)의 공동창립자이자 CTO다. 로드리게스는 인공지능 회사 인벡터랩스(Invector Labs)의 수석과학자이자 암호화폐 및 인공지능 분야에서 활발하게 활동 중인 투자자다.

Myths and Realities: Sentiment Analysis for Crypto Assets
이미지=셔터스톡


 

암호화폐가 뉴스와 소셜미디어의 영향을 많이 받는다는 것은 암호화폐 시장에서 정설로 통한다. 생겨난 지 얼마 되지 않아 미숙한 여느 자산 시장이 그렇듯 암호화폐의 가격은 예기치 못한 상황에 관한 뉴스나 소셜미디어의 영향을 많이 받는다. 그래서 암호화폐와 디지털 토큰 가격의 잠재적인 상관관계를 파악하기 위한 정서 분석(sentiment analysis) 등 머신러닝 기술에 대한 관심이 증가하고 있다. 중요한 분야이긴 하지만, 정서 분석을 활용한 시도는 대개 실질적으로 의미 있는 정보를 생산해내지 못한다. 여전히 분석 결과는 너무 기초적인 데 그치는 경우가 많고, 심지어 현실을 오도할 때도 있다.

사실 자산의 움직임을 평가하기 위해 정서 분석을 사용하려는 시도는 암호화폐뿐 아니라 많은 자산에서 이뤄졌다. 텍스트의 행간에 숨은 감정선이나 투자 심리 등을 제대로 파악해 통찰력 있는 분석을 하려면 대부분 구체적인 금융 분야마다 최적화된 자연언어처리(NLP) 모델이 있어야 할 정도로 매우 어렵다. 대형 퀀트 헤지펀드 중에는 중빈도 거래(medium frequency trade)에서 우위를 점하기 위해 수익 보고서 분석과 같은 매우 구체적인 작업을 NLP 모델이 수행하도록 한다. 그러려면 수많은 머신러닝 전문가를 고용해 NLP 알고리듬을 훈련해야 한다. 암호화폐에 정서 분석을 효과적으로 접목하려 해도 심도 있고 엄격한 머신러닝 기술이 필요하다.

이 설명을 이해하기 위해 정서 분석의 특징에 대해 좀 더 깊이 있게 살펴보자.

 

정서 분석이란 무엇인가


“펜은 칼보다 강하다.”

영국의 극작가 에드워드 불워리턴이 그의 희곡 “리슐리외 추기경”의 제2막 제2장에서 남긴 세대를 초월하는 명언이다. 그로부터 수 세기가 지난 오늘날 정서 분석의 중요성과 효용을 훌륭하게 표현해내는 데도 불워리턴의 명언이 유용한다. 문자로 주고받는 소통에서 드러나는 감정과 정서는 물리적 행동보다도 오히려 어떤 행위를 유발하고 추동하는 힘이 더 강할 때가 많다.

먼저 그 개념을 정리하자면, 정서 분석은 문자 소통(text communication)의 감정과 정서를 파악하는 데 초점을 맞춘 자연언어처리의 한 분야다. 정서 분석은 특정 기술이 아니라 다양한 종류의 감정을 텍스트상 데이터에서 감지하는 딥러닝의 하위 분야를 뜻한다. 이러한 관점에서 암호화 자산 관련 정보를 분석하는 데 유용하게 쓰일 수 있는 정서 분석 방법에는 다음의 몇 가지가 있다.

  • 극성 분석(Polarity Analysis): 텍스트의 정서를 긍정, 부정 또는 중립으로 분류하는 분석법이다. 예를 들어 “비트코인 가격이 회복하면서 시장은 활기를 되찾았다”는 문장은 대부분 모델이 긍정적인 문장으로 분류한다.

  • 감정/어조 분석(Emotion/Tone Analysis): 텍스트 전반을 분석하기보다는 특정 텍스트에 존재하는 다양한 종류의 감정과 맥락을 점수로 매기는 방법이다. 정서 분석 알고리듬에서 주로 사용되는 감정들은 슬픔, 기쁨 또는 분노다. 예를 들어 “이번 비트코인 랠리는 완전 미쳤다”는 문장에서는 흥분이나 희열 같은 수치가 높게 나타날 것이다.

  • 주제별 정서 분석(Aspect Sentiment Analysis): 문장 전체가 아닌 문장 내 특정 주제와 관련된 감성을 해석하는 데 집중하는 방법이다. 예를 들어 “백트 선물은 비트코인 시장에서 중요한 이정표다”는 문장에서 정서 분석은 문장 전체가 아닌 “백트 선물”과 관련된 감성만을 파악해 수치화한다.


위 목록을 보면 암호화 자산에 정서 분석을 적용하면 얻을 수 있는 이점이 분명하다. 그러나 이러한 종류의 기술을 사용하기 전에 몇 가지 선결 과제가 있다. 맥락 파악, 주관성, 반어법과 심지어 문법적 오류까지 아무리 훌륭한 NLP 알고리듬이라도 빠질 수 있는 함정이 많기 때문이다.

 

암호화폐에 정서 분석을 적용하면


암호화폐는 아직도 금융 시장의 비합리성과 적절한 대화 채널, 소통 공간의 부재에 영향을 받는 새로운 자산에 속한다. 그래서 사람들이 정서 분석과 같은 NLP 기술을 이용해 암호화 자산의 움직임을 예측하는 데 필요한 알파 또는 스마트 베타 창출 요인을 파악할 수 있다고 생각하는 것도 당연하다. 그러나 현실은 조금 다르다.

암호화 자산에 정서 분석을 적용하기 전에 우리는 먼저 다음 두 가지 과제를 해결해야 한다.

  1. 암호화 자산 분석과 같은 독특한 영역에 분석 기술을 적용할 때 나타나는 NLP 기술의 한계.

  2. 뉴스 및 소셜미디어에 감성이 반영되는 방식에 관한 잘못된 가정.


첫 번째 과제는 자연언어처리 기술이 급속도로 발달하면서 생겨난 예측하지 못한 부작용이다. 즉 오늘날에는 딥러닝에 관한 전문성이 없는 개발자도 간단한 API(응용프로그램 인터페이스)를 이용해 정서 분석 툴을 콘텐츠나 웹사이트 전체에 쉽게 적용할 수 있다.

자연언어처리 API는 일반적인 문장에 나타나는 감정은 효과적으로 분석할 수 있겠지만, 구체적인 문장의 영역의 특이적인 지식을 추론하는 작업은 제대로 해내지 못할 것이다. 예를 들어 “비트코인 ETF가 곧 승인될 수 있다”는 문장을 분석하려면 암호화폐 시장에서만 쓰이는 용어의 의미와 맥락을 전문적으로 다루고 겉으로 드러나는 단어나 문장 수준이 아니라 훨씬 더 세세한 수준에서 감정선과 반응을 추론하는 NLP 모델이 필요하다.

두 번째 과제는 뉴스나 소셜미디어에 올라오는 글에 정서가 반영되는 방식에 대한 오해와 관련이 있다. 뉴스는 훌륭한 정보의 원천이지만, 정서 분석에 활용하기에는 별 쓸모가 없다. 감정을 배제하고 객관적인 사실을 바탕으로 쓴 기사가 좋은 기사로 평가받는 점을 생각하면 그 이유를 어렵잖게 짐작할 수 있다. 소셜미디어는 이와는 정반대다. 트위터나 텔레그램상 암호화폐에 관한 대화는 관련 정서를 숨기지 않지만, 이때 나타나는 정서는 공개된 주요 정보에 대한 반응인 경우가 대부분이고, 이는 이러한 정서가 정보의 측면에서는 딱히 효과가 없을 가능성이 있다는 뜻이다. 또한, 소셜미디어상의 대화는 요란스럽고 상대적으로 주관적인 경향이 강해서 정서 분석 알고리듬이 이를 오해하고 잘못 분석할 가능성도 상대적으로 크다.

순전히 기술적인 측면에서 효과적인 암호화 자산 정서 분석 모델은 암호화 시장의 용어를 충분히 학습한 뒤 뉴스를 정보의 원천으로, 소셜미디어 게시글들을 정서의 증폭기로 놓고 분석할 필요가 있다. 그러나 이러한 기술적 과제를 극복한다고 하더라도 여전히 남는 정서 분석 모델에 관한 대표적인 오해가 있다.

 

정서가 시장에 미치는 영향에 관한 오해와 그로 인한 오류


이른바 정서-시장 영향의 오류(sentiment-market impact fallacy)는 새로 생긴 금융시장에서 투자자들이 정서 분석 결과와 시세 사이에 직접적인 상관관계가 존재한다고 가정하는 것과 같은 악명높은 비합리적인 현상을 일컫는다. 이러한 행동경제학적 역학을 설명하기 위해 최근 비트코인 관련 트위터의 정서를 분석하는 툴을 사용한다고 가정해보자. 심리학적으로 대부분 투자자는 이러한 정서를 아래의 순서대로 선행 지표로 해석하는 경향을 보인다.

  • 긍정적인 정서는 비트코인 가격이 오르리라는 선행 지표다.

  • 반대로 부정적인 정서는 비트코인 가격이 내리리라는 전조로 볼 수 있다.


그러나 분석 모델을 이용해 공개된 중대한 정보를 분석하면, 정서 분석 결과는 아래와 같은 다소 직관적이지 못한 규칙에 따라 후행 지표로 해석하는 것이 맞다.

  • 긍정적인 정서가 드러났는데 비트코인 가격이 오르지 않았다면, 이는 시장이 약세라는 신호로 풀이해야 한다.

  • 반대로 부정적인 정서가 드러났는데 비트코인 가격이 내리지 않고 버티고 있다면, 이는 시장이 강세라는 신호로 볼 수 있다.


정서와 가격 사이의 편향을 이해하게 되면 정서 분석이 선행 지표가 아닌 거래전략을 세울 때 참고할 수 있는 요인이라는 점을 깨닫게 된다.

 

정서 분석에서 시장 영향 분석으로


정보의 관점에서 보면 암호화폐 시장은 요란스럽고 예기치 못한 사건으로 가득하다. 정서 분석에서 이러한 요소들의 결합은 악몽과 같다고 할 수 있다. 그렇기 때문에 정서 분석에만 집중하기보다 좀 더 전체적인 접근법을 개발해야 한다. 정서-시장 영향 지표는 장기적으로 볼 때 극성(부정적, 긍정적, 중립적), 감정(불안, 흥분, 슬픔) 및 주제 기반(주제, 법인) 분석이 결합된 형태로 발전할 것이다. 이 접근법은 구체적인 시장 상황의 맥락에서 나타나는 정서를 평가하기 위해 암호화 자산의 역학을 전문적으로 다루는 모델의 훈련을 요구할 것이다.

정서-시장 영향 모델의 개념 자체는 평범하다. 구체적인 시장 상황에서 감성과 감정, 주제가 종합적으로 암호화 자산에 미치는 영향을 수량화하면 되기 때문이다. 이 모델은 오늘날 대부분의 정서 모델처럼 완전한 비지도 학습을 하지 않아도 된다는 장점이 있다. 이는 우리가 암호화폐 시장을 분석하기 위해 꼭 알아야 할 용어나 관련 지식을 모델에 직접 가르칠 수 있다는 뜻이다. 예를 들어 우리는 중국의 암호화폐 투자에 관한 긍정적인 기사들이 지난 일주일간 상대적인 약세를 보인 시장에 긍정적인 영향을 미칠 수 있다는 내용을 모델이 습득하도록 훈련할 수 있다. 정서-시장 영향 분석 모델의 핵심 원칙은 정서 모델의 지식을 암호화폐 시장의 구체적인 맥락과 연결해야 한다는 점이다.

암호화폐 시장에서 정서 분석은 계속해서 자극적인 헤드라인과 함께 등장할 것이다. 그러나 이러한 모델이 효과적이려면 더 심도 있는 머신러닝 엄격성과 암호화폐 시장의 구체적인 역학에 기초한 지식의 축적이 필요하다. 시장이 진화하면 평범한 정서 분석 기술이 암호화폐 시장의 행태와 구체적인 주제 간의 관련성을 수량화하는 전체적인 시장 영향 모델로 진화할 것이다.

번역: 뉴스페퍼민트
· This story originally appeared on CoinDesk, the global leader in blockchain news and publisher of the Bitcoin Price Index. view BPI.
· Translated by NewsPeppermint.

제보, 보도자료는 contact@coindeskkorea.com



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.