[블룸버그 칼럼]GPT4, 주식 투자에도 머니볼 논리

미국 시카고대학교의 연구원인 알렉스 김, 막시밀리안 뮌, 발레리 니콜라예프는 오픈AI의 GPT4 거대언어모델(LLM)에 1968~2021년 사이 1만5401개 상장기업의 재무제표를 익명화해 입력하고 미래 수익을 추측하도록 했다. 그 결과, 당장 효용성은 크지 않더라도 결국 금융과 경제에 큰 영향을 미칠 수 있다는 사실을 발견했다.


연구진에 따르면 GPT4는 내년 수익이 증가할지 감소할지를 52%의 정확도로 예측할 수 있었다. 이는 인간인 금융분석가나 통계적 예측 방법에 못 미치는 수준이다. 하지만 GPT4에 인간 분석가처럼 생각하도록 하는 ‘생각의 사슬’ 기법을 이용하자 그 정확도는 60%까지 뛰어올랐다. 인간 분석가보다 높고, 통계적 예측과 거의 동일한 수치다.

우리는 전문가에게 규칙을 물어본 후 컴퓨터에 규칙을 체계적으로 모방하라 할 경우, 컴퓨터가 전문가를 능가한다는 사실을 이미 알고 있다. 전문가들은 자존심과 직업적 권위 때문에 자신의 분야가 과학이 아닌 예술이라고 주장하며 때때로 단순한 규칙을 따르지 않는 직감이 중요하다고 생각하는 경향이 있다. 하지만 통상 이러한 직감은 잘못된 경우가 많고, 단순한 규칙을 따르는 것이 더 나은 결과를 가져오기도 한다. 물론 전문가들은 많은 것을 알고 있지만, 대부분 간단한 규칙으로 쉽게 인코딩할 수 있는 것들이다.


또 우리는 간단한 규칙으로 인간 의사결정자들을 이기는 것이 쉽다는 것도 알고 있다. 최첨단 LLM이나 5년간의 완전한 재무제표 자료 없이도 시장을 이길 수 있다. 단순히 주가 대비 순자산이 높은 주식을 사면 된다. 5가지 재무 비율을 이용해 반세기 전 개발된 올트먼 Z-스코어를 사용하면 신용평가사의 신용등급보다 더 정확히 기업의 채무불이행(디폴트) 가능성을 예측할 수 있다.


이는 스포츠 베팅의 맥락에서 더 쉽게 이해할 수 있다. 1960년대 시장 분석가들은 스포츠 결과를 예측하는 연구를 시도했다. 그들 중 일부는 개별 경기를 자세히 모델링하고자 시도했고, 다른 일부는 도박업자(Bookmaker)의 잘못 책정된 베팅을 찾는 데 집중했다.

첫 번째 그룹은 선수 통계와 과거 경기를 살펴보고 향후 경기의 예상 결과를 시뮬레이션했다. 두 번째 그룹은 ‘홈 경기에서 레이커스에 베팅하기’ 등과 같은 규칙을 찾아냈는데, 이는 로스앤젤레스 레이커스와 같은 인기 농구팀에 베팅이 많다는 것을 이미 알고 그 팀에 긍정적 기대감을 주는 방식으로 경기 스프레드를 설정하기 때문이다.


첫 번째 접근법은 빌 제임스의 이름을 따서 지어졌다. 그는 해당 접근법을 최초로 적용한 인물은 아니지만, 스포츠 분석의 수호신과 같은 가장 유명한 존재다. 두 번째는 에드 소프 접근법이라고 부르겠다. 에드는 스포츠 베팅에는 잠시 도전했을 뿐이지만, 카지노와 자본시장에서 수학적 모델을 활용해 시장 우위를 찾는 데 가장 잘 알려진 인물이다. GPT4가 빌 제임스라면, 전통적 퀀트 헤지펀드 투자는 에드 소프다.


빌 제임스는 스포츠 베팅에선 특별히 성공하지 못했다. 그 이유 중 하나는 에드 소프의 방식보다 더 어려워서다. 더 큰 이유는 도박업자들이 이기는 도박꾼에게는 관심이 없어서였다. 수익을 낼 만큼 정확히 스포츠 결과를 예측하는 것은 어렵지 않았지만, 이러한 예측에 기초해 베팅에서 승리할 경우 돈을 주겠다는 도박업자를 찾는 것도 어려웠다.


하지만 도박업자들은 홈에서 레이커스를 상대로 베팅하는 에드 소프 유형의 베팅은 환영했고, 기꺼이 돈을 걸었다. 레이커스의 스프레드(fair spread)가 -2.5, 즉 레이커스가 3점 이상 이길 확률이 50%라고 가정해보겠다. 레이커스 팬이 1억달러를 레이커스에 베팅했다면 도박업자는 반대쪽에 3000만달러만 유치할 수도 있다. 만약 스프레드를 -4.5로 설정한다면 5000만달러를 얻을 수도 있다. 이 경우 레이커스에 베팅하는 것은 약 40% 성공 확률이 된다.


스프레드를 더 높게 설정해도 더 많은 돈을 끌어모을 수 없었고, 스프레드에 민감한 스포츠 베팅 자금은 많지 않았다. 게다가 당시 스포츠 도박은 조직범죄에 독점되다시피 했다. 이들은 로스앤젤레스 도박꾼들이 베팅한 1억달러를 모두 자신의 돈으로 간주했고, 결국 개인 도박꾼들이 돈을 모두 잃을 것으로 예상했다. 다만 그들은 게임당 5%씩 천천히 이 돈을 가져가길 원했다. 너무 빨리 적용하면 도박꾼들이 수익성이 없는 도박에서 손을 뗄 것이고, 황금알을 낳는 거위는 죽게 될 것이기 때문이다.


라스베이거스 도박업체들은 레이커스에 1000만달러를 걸겠다는 퀀트 투자자들을 환영했다. 이 베팅은 도박업체에 부정적이긴 했으나, 대신 위험을 낮춰졌다.


에드 소프의 접근 방식은 훨씬 더 실용적이었지만 세상을 바꾸는 영향을 주지는 못했다. 대조적으로 빌 제임스의 접근 방식은 느리지만 확실히 스포츠 진행 방식을 변화시켰다. 우리는 모든 스포츠에서 분석의 효과를 확인한다. 하키팀은 일찍 골키퍼를 투입하고, 농구팀은 더 많은 3점 슛을 시도하고, 야구팀은 3~5번이 아닌 1~2번에 출루율이 높은 타자를 배치하고, 풋볼팀은 포스다운과 2점 전환을 더 많이 시도하는 등 모든 스포츠에서 이러한 분석 효과를 볼 수 있었다.


퀀트 트레이딩은 금융시장은 변화시켰지만, 비즈니스 관행을 바꾸지는 않았다. 헤지펀드의 천재들은 자문, 비즈니스 운영에서 눈에 띄는 성공을 거두지 못했다. 사모펀드는 퀀트 트레이더가 선호하는 기법을 크게 활용하지 않았다. 관찰된 시장 가격의 통계적 패턴은 실제 비즈니스 의사 결정에 큰 도움이 되게끔 역설계할 수 없다.


GPT4는 일반적 지식을 활용해 비즈니스 결과를 예측한다는 점에서 이와 다르다. 해당 논문은 연도, 회사명 등이 삭제되고 표준화된 5년치 재무제표라는 매우 제한적 데이터 세트를 사용했다. 훨씬 더 광범위한 데이터 세트를 기반으로 보다 정교한 모델을 적용할 경우, 더 나은 결과가 나올 수 있다. 더욱이 인공지능(AI) 연구는 빠르게 발전 중이다.


이 연구 논문은 수익 증가 확률이 가장 높은 기업 10%의 주식을 매수하고, 확률이 가장 낮은 기업 10%의 주식을 매도할 경우, 연간 알파(시장 및 알려진 요인에 대한 노출을 초과하는 수익률)가 10%라고 주장했다. 실거래에서 10%의 알파가 실현되면 경이롭겠지만, 시뮬레이션에서 이 수준을 찾는 것은 드문 일이 아니다. 이러한 결과는 전문 헤지펀드 전략의 일부로 실용적으로 사용될 수 있다.


10%의 잠재 수익률은 단순히 통계적 패턴을 발견하는 것이 아니라, 매출 성장, 수익성, 순이익, 대차대조표 레버리지 등 재무 수치를 이해한 결과라는 점에서 획기적이다. 이는 ‘빌 제임스 스타일 분석’ 대 ‘에드 소프 통계 패턴’이자, ‘머니볼’ 대 ‘딜러 이기기’다.


물론 이는 하나의 연구논문일 뿐이며 경제 성장을 위한 마법의 묘약은 아니다. 스포츠 분석이 경기에 큰 여파를 미치기까지는 수십 년이 걸렸고, 경제 정책 입안자와 기업 경영진이 스포츠 코치나 관리자보다 덜 보수적이지도 않을 것이다. AI를 기반으로 한 연방준비제도(Fed) 의장이나 포천 500대 최고경영자(CEO)가 곧 등장하진 않을 것이란 뜻이다. 하지만 이 논문은 한 마리의 제비가 여름을 만드는 것처럼 변화의 초기 신호가 될 수 있다.


[블룸버그 칼럼]GPT4, 주식 투자에도 머니볼 논리 원본보기 아이콘

애런 브라운 전 AQR 캐피털매니지먼트 금융시장조사책임자


이 글은 블룸버그의 칼럼 ‘GPT4 Brings Moneyball Logic to Picking Stocks’를 아시아경제가 번역한 것입니다.




<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>