'로봇 작가' GPT-3를 두려워할 필요가 없는 이유
가짜뉴스 만들어낼 수 있지만, 암호화폐에는 위협 아닌 기회
이 기사를 공유합니다
Jesus Rodriguez
Jesus Rodriguez 2020년 7월24일 08:00
출처=언스플래시
출처=언스플래시

오픈AI(OpenAI)의 새로운 언어 생성 프로그램 GPT-3를 둘러싼 암호화폐 업계의 관심이 뜨겁다. GPT-3를 건전한 호기심으로 바라보는 시선도 있지만, 일부는 암호화폐 업계에 불어 닥친 ‘끔찍한 일’이라며 다소 극단적인 반응을 보이고 있다.

GPT 모델이 세상에 처음 등장한 것도 아니고, 머신러닝의 대표적인 화젯거리가 된 지도 1년이 넘은 상황에서 GPT-3에 대한 관심이 이처럼 폭발적인 것은 다소 놀랍다. 2018년 6월 GPT 모델을 연구한 결과가 최초 발표된 이후 지난해 2월 GPT-2가 등장했고, 두달 전 GPT-3가 공개됐다.

GPT-3가 그 자체로 암호화폐 생태계에 실질적인 영향을 끼칠 가능성은 작다고 생각한다. 다만 GPT-3를 구성하는 머신러닝 기법이 최근 몇 년간 등장한 것 중 가장 앞섰다는 점을 고려하면, 암호화 자산과의 연관성도 높아질 가능성이 있다. 이번 글에서는 GPT-3와 관련된 개념들을 살펴보고, 암호화폐 업계에 무엇을 시사하는지 알아보고자 한다.

 

GPT-3는 무엇인가?

GPT-3는 무려 1750억개의 매개변수를 사용해 다수의 언어 작업을 수행할 수 있는 거대한 자연어 처리 모델(NLU, natural language understanding)이다. 세계에서 가장 규모가 큰 언어처리 모델인 GPT-3는 마이크로소프트의 튜링NLG(Turing-NLG)나 이전 모델인 GPT-2를 뛰어넘는다.

GPT-3는 기계번역, 질의응답, 언어분석, 문자 생성 등 수많은 언어 작업을 수행할 수 있다. 진위를 구별하기 어려울 정도로 진짜 같은 가짜 글을 생성할 수 있어 언론의 집중적인 관심을 받고 있다.

이것이 암호화폐 업계에 미칠 영향은 무엇일까? 거래 규모가 크지 않은 암호화 자산에 대한 가짜 뉴스를 만들어 시세 변동에 영향을 줄 가능성이 있다. 꽤 무서운 이야기지만, GPT-3의 주요 기능은 따로 있다.

언어 기반 모델인 GPT-3는 문자 기반의 데이터 세트를 가지고 작업한다. 상당히 멋진 기능이지만, 암호화폐 업계에서 그다지 흥미를 끌 만한 일은 아니다. 사실 우리가 주목해야 할 부분은 GPT-3의 기반이 되는 기법이다.

 

GPT-3의 근간을 이루는 마법

GPT-3의 기반은 트랜스포머(transformers)라 불리는 딥러닝 체계다. 트랜스포머에 대한 개념은 2017년 구글 브레인(Google Brain)이 발간한 보고서 “필요한 것은 집중(Attention is all you need)”에서 처음 소개됐다.

트랜스포머의 가장 큰 특징은 보고서의 제목처럼 ‘집중’이라는 개념을 접목했다는 것이다. 일반적으로 집중 메커니즘은 Seq2Seq 모델에 적용된다. 순서대로 나열된 단어나 글자, 숫자 등을 입력하면 새로운 배열이 출력되는 모델로, 문자 생성, 기계번역, 질의응답 등 언어 지능 작업에서 폭넓게 활용되고 있다.

Seq2Seq 모델을 처리할 때는 인코더(encoder)와 디코더(decoder) 기능이 관여한다. 인코더는 입력된 배열의 맥락을 파악해 디코더에 전송한다. 디코더는 이를 바탕으로 새로운 배열을 구성해 출력한다. 입력된 배열에서 ‘집중해서 봐야 할’ 주요 측면을 파악해 전통적 신경망의 한계점을 뛰어넘은 것이 바로 이 ‘집중 메커니즘’이다.

기계번역을 통해 스페인어를 영어로 바꾸는 상황을 생각해보자. 인코더가 입력된 스페인어 문자를 ‘상상의 언어’로 알려진 중간 형태로 바꿔 놓으면, 디코더가 이를 영어로 변환하는 방식이 일반적이다. 더 전통적인 딥러닝 환경에서는 인코더와 디코더 사이의 소통이 지속적으로 이뤄져야 하므로 효율성이 상당히 떨어진다.

집중 메커니즘의 주요 임무는 입력된 배열을 보고 단계마다 해당 배열에서 중요한 것이 무엇인지 파악하는 것이다. 기계번역을 수행하는 경우라면 디코더가 ‘집중해서 봐야 할’ 단어를 강조해주는 식이다.

GPT-3의 기반이 되는 트랜스포머는 인코더와 디코더 기능을 접목한 전통적 기법으로, 효율성을 개선하기 위해 집중 블록을 삽입한다. 집중 블록은 입력된 내용 전체와 현시점의 출력 내용을 보면서 최종 출력물을 최적화할 수 있는 요소들을 추론한다.

트랜스포머는 방대한 크기의 데이터 세트를 학습할 수 있고 효율적으로 비교 가능한 다양한 모델의 밑거름이 됐다. 구글 보고서가 발간된 이후 다양한 언어 작업을 처리할 수 있는 슈퍼 모델을 구축하기 위한 경쟁이 시작된 것은 놀라운 일도 아니다. 구글의 버트(BERT), 페이스북의 로버타(RoBERTa), 마이크로소프트의 튜링NLG와 오픈AI의 GPT-3모두 트랜스포머를 기반으로 하는 최신 모델이다.

GPT-2는 15억개의 매개변수를 사용해 세계를 놀라게 했다. 이후 170억개의 매개변수를 사용하는 마이크로소프트의 튜링 NLG가 등장하면서 기록이 깨졌는데, GPT-3는 1750억개라는 말도 안 될 만큼 큰 규모의 매개변수를 사용한다. 이 모든 것이 고작 1년이라는 시간 안에 이뤄졌다. 결론은 간단하다. 트랜스포머 모델이라면 그 규모가 클수록 좋다.

1세대 트랜스포머 모델들은 언어 작업에 초점을 맞췄다. 최근에는 페이스북이나 오픈AI와 같은 기업들이 이미지 분류에 트랜스포머 모델을 활용하는 방안을 담은 연구 보고서를 발간했다. 일각에서는 가짜 이미지 생성을 위한 수법으로 여길 수도 있겠지만, 실제 영향력은 이를 훨씬 넘어설 것으로 보인다.

이미 분류가 이뤄진 데이터 세트가 많지 않은 상태에서 이미지 분류 모델의 학습 효율을 높이기 위해서는 가짜 이미지를 생성하는 것이 매우 중요하다. 실제로 퀀트 거래 전략 향상을 위해 트랜스포머 모델에 금융 시계열 데이터를 학습하려는 시도가 진행되고 있다.

 

트랜스포머와 암호화 자산

이제 트랜스포머와 GPT-3에 대한 맥락을 어느 정도 파악했으니 처음의 질문으로 되돌아가자. GPT-3는 과연 암호화폐 업계가 두려워해야 할 기술일까?

물론 암호화폐 시장을 움직일 만한 가짜 뉴스를 생성할 수 있는 모델이 세상에 나왔다는 것은 가볍게 넘길 일이 아니다. 하지만 나는 현재 모습의 GPT-3를 암호화폐 업계에 위협이라고 보지 않는다. 오히려 트랜스포머 기반 모델이 차세대 암호화폐 지능 솔루션에 어떤 영향을 미칠지 더 관심이 간다. 실제로 예상할 수 있는 이용 사례는 다음과 같다.

 

거래 전략. 트랜스포머를 금융 데이터에 적용할 수 있다는 것이 입증된 이상, 암호화 자산에 대한 거래 전략 수립에 상당한 영향을 줄 수 있다. 현재 딥러닝을 기반으로 한 대부분의 신경망은 퀀트 거래 부문에서 새로운 지평을 열고 있다. 선형회귀 모델이나 의사결정 계통도와 같은 기본적인 머신러닝 모델부터 더 발전된 형태의 딥러닝 전략을 찾는 퀀트 펀드가 늘고 있다.

본질적으로 디지털 형태를 취하는 암호화 자산은 퀀트 전략을 위한 최고의 자산이다. 순환신경망(RNN, Recurrent Neural Network), 복합형신경망(CNN, Convolutional Neural Network) 등 퀀트 분야에서 인기를 얻은 기법들은 암호화 자산에도 잘 적용되는 것으로 보인다. 트랜스포머는 언어 분석과 마찬가지로 RNN이나 CNN보다 뛰어날 것으로 보이며, 특히 올해 3월 비트코인 폭락장처럼 한 데이터 세트 내에 ‘집중’해서 봐야 할 부분들이 있을 때 더욱 그렇다. 또 블록체인 거래처럼 기록 데이터가 방대한 경우에도 유용할 것으로 기대된다.

 

블록체인 분석. 트랜스포머를 활용하면 지금보다 훨씬 효율적인 계산 방식으로 블록체인에 존재하는 패턴을 파악할 수 있을 것으로 보인다. 트랜스포머의 주요 기능 중 하나는 입력된 데이터에서 특정 부분에 ‘관심을 집중’하고 그를 통해 출력해야 할 내용을 추론하는 것이다. 비트코인 채굴 내역이나 거래소 입출금 내역을 분석해 거래장부 패턴을 파악하고자 하는 경우 트랜스포머가 특히 더 유용할 수 있다.

 

탈중앙화. 트랜스포머 모델을 싱귤러리티넷(SingularityNet)과 같은 탈중앙화 인공지능 체계에 접목하기 위한 노력이 계속되고 있다. 실현된다면 트랜스포머의 사용은 우리가 아직 상상하지 못한 방면까지 확대될 수 있다. 지금까지 GPT-3와 같은 트랜스포머 모델은 거대한 신경망을 구축하고 운영할 수 있는 데이터와 자원이 있는 대기업 인공지능 실험실의 특권이었다. 탈중앙화 방식의 인공지능은 인센티브를 기반으로 하는 탈중앙화 네트워크에서 트랜스포머의 학습과 작동, 모니터링이 모두 이뤄질 수 있는 하나의 대안을 제시한다.

이미 이와 같은 탈중앙화 환경에서 성공적으로 작동한 신경망이 있었던 만큼 GPT-3와 같은 모델이 싱귤러리티넷이나 오션 프로토콜(Ocean Protocol)과 같은 탈중앙화 인공지능 플랫폼에서 작동되는 모습을 조만간 보게 될 수도 있다.

GPT-3를 비롯한 트랜스포머 모델의 등장은 딥러닝 역사의 획기적인 발전이다. 앞으로 몇 년간 우리는 트랜스포머가 딥러닝의 모든 주요 분야에 영향을 끼치는 모습을 보게 될 것이다. 또 이 영향력은 금융 시장으로 확대될 것으로 보이며, 암호화폐 역시 이 혁신의 혜택을 볼 수 있어야 한다.

이처럼 영향력이 큰 GPT-3이지만, 두려워할 필요는 없다. 인공지능 분야에서 이뤄지는 주요 혁신 기술을 잘 활용하기만 한다면, 암호화폐는 역사상 가장 지능적인 자산군이 될 수 있다.

· This story originally appeared on CoinDesk, the global leader in blockchain news and publisher of the Bitcoin Price Index. view BPI.
· Translated by NewsPeppermint.

제보, 보도자료는 contact@coindeskkorea.com



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.