Researchers from the University of Chicago have shown that large language models (LLMs) can conduct financial statement analysis with accuracy rivaling and even surpassing that of professional analysts. The state-of-the-art LLM, GPT-4, developed by OpenAI, outperformed human analysts in predicting future corporate earnings growth. The researchers used "chain-of-thought" prompts to guide GPT-4 to emulate the analytical process of a financial analyst, resulting in a 60% accuracy in predicting the direction of future earnings, notably higher than the 53-57% range of human analyst forecasts. The researchers attribute the LLM's advantage to its vast knowledge base and ability to recognize patterns and business concepts. While some experts caution that the "ANN" model used as a benchmark in the study may not represent the state-of-the-art in quantitative finance, the ability of a general-purpose language model to match the performance of specialized ML models and exceed human experts points to the disruptive potential of LLMs in the financial domain.
시카고대학교 연구진은 대형언어모델(LLM)이 전문 애널리스트에 버금가거나 심지어 능가하는 정확도로 재무제표 분석을 수행할 수 있음을 입증했다. 오픈AI에서 개발한 최신 LLM인 GPT-4는 기업의 미래실적 성장을 예측하는 작업에서 인간 애널리스트를 능가했다. 연구진은 "사고 연쇄(chain-of-thought)" 프롬프트를 사용하여 GPT-4가 재무 분석가의 분석 과정을 모방하도록 유도했고, 이를 통해 GPT-4는 미래실적 방향을 60%의 정확도로 예측했다. 이는 인간 애널리스트의 53-57% 예측 범위보다 현저히 높은 수치이다. 연구진은 LLM의 장점이 방대한 지식 기반과 패턴 인식 능력에서 비롯된 것으로 보인다고 설명했다. 일부 전문가들은 이 연구에서 벤치마크로 사용된 'ANN' 모델이 계량금융의 최신 기술을 대표하지 않을 수 있다고 지적하지만, 범용언어모델이 전문 ML 모델의 성능에 필적하고 인간 전문가를 능가할 수 있다는 점은 LLM의 파괴적 잠재력을 시사한다.