본문 바로가기

오성연/기타

스포츠에 언어 모델인 ChatGPT가 사용될 수 있을까?

스포츠 보도가 아니라 실제 스포츠를 분석하는데 ChatGPT와 같은 거대 언어 모델(LLM, Large Language Model)이 사용될 수 있을까요?

 

세계 최대 스포츠 데이터 기업인 OPTA는 ChatGPT와 같은 LLM을 이용해 스포츠 경기(특히 축구)에 대한 깊은 이해를 제공하는 것이 스포츠 분석의 차세대 혁명이라고 말합니다.

 

It is the next revolution in sports analytics, to provide deeper than ever understanding of the game to teams and fans, especially in soccer.

- by. OPTA 

 

어떻게 이런 일이 가능할까요?

 

이를 위해서 ChatGPT와 같은 LLM과 Generative Model(생성모델)에 대해서 알아야 합니다. (ChatGPT는 LLM이자 텍스트 생성모델이라고 볼 수 있습니다.)

 

LLM은 고유한 구조(문자, 단어, 문장, 단락 등)가 있는 텍스트 데이터를 이용해 Transformer 구조를 통해 다음 단어의 예측 등의 일을 할 수 있습니다.

 

그리고 생성모델은 텍스트, 이미지 등을 input으로 받아 새로운 텍스트, 이미지, 비디오 등의 output을 출력합니다. 대표적으로는 OpenAI의 DALL-E2가 있습니다. 

 

그렇다면 이것들을 축구에 어떻게 적용시킬 수 있을까요?

 

AI 모델이란 곧 학습하는 데이터에 따라서 성질이 크게 좌우됩니다. ChatGPT는 방대한 양의 텍스트를 학습해서 텍스트를 input으로 받아 text를 생성하는 기능을 하는 것이고, DALL-E2는 수 억 개의  텍스트-이미지 쌍 데이터를 학습하여 텍스트를 통해 이미지를 생성해 주는 기능을 하는 것입니다.

 

이런 맥락에서 축구 데이터를 모아서 AI를 학습시킨다면 자연스럽게 축구 AI 모델을 만들 수 있다는 뜻이 됩니다. 이것을 조금 더 구체적으로 설명하면 다음과 같습니다.

 

  1. 축구는 11명 vs 11명이 그라운드 안에서 공을 두고 대결을 하는 스포츠입니다.
  2. 이 때 각각의 플레이어는 일종의 문자라고 볼 수 있습니다.
  3. 이 문자는 각각의 역할(공격수, 수비수 등)에 맞게 움직이고 플레이합니다. 즉, 규칙성이 존재합니다.
  4. 그리고 플레이되는 매 순간이 모여 90분의 긴 서사가 됩니다. 즉, 시간의 흐름이 있는 Sequence Data의 모음입니다.
  5. 그러므로 각 문자(플레이어)의 다음 Sequence를 예측하는데 ChatGPT와 같은 모델이 사용될 수 있습니다.

그렇다면 이렇게 예측해서 얻은 output은 어디에 쓰일 수 있을까요? Opta가 예측 데이터를 사용하는 방식은 아래와 같습니다.

 

출처: Opta 홈페이지

위의 빨간 원 위의 선수가 패스를 하려고 하는 순간 그의 정면(우측)에 있는 선수들 중 누구에게 패스를 줄 확률이 높은지(xPass, 패스가 성공할 확률), 그 선수가 상대를 위협할 확률(패스를 받고 10초 이내에 슛이 발생할 확률. 공격수와 수비수의 모든 움직임을 고려하여 계산)은 얼마나 되는지(xThreat)를 예측합니다. 그리고 이를 통해 어떤 선수가 상대를 가장 위협하고 있는지, 패스하는 선수는 가장 위협적인 선수에게 패스를 정확하게 하고 있는지를 통해 선수의 능력을 평가할 수 있습니다.

 

그 밖에도 xG(기대 득점), xA(기대 어시스트) 등의 수치를 통해서 많은 선수들의 다음 sequence를 예측하고 데이터를 추출하여 축구 분석에 이용하고 있습니다. 이 데이터를 이용해서 할 수 있는 가장 대표적인 예시는 다음과 같습니다.

더보기

오늘 열린 경기에서 A라는 선수의 xG값이 1.3 이었고, 실제 득점 값은 0이라고 가정합니다.

 

이 데이터를 통해 A라는 선수는 골 결정력이 별로 좋지 않다는 것을 유추할 수 있습니다.

 

이전에는 각 선수별로 독립적인 모델을 이용해 예측을 했지만, ChatGPT 같은 대규모 언어 모델링의 접근 방법을 이용해 한 번에 모든 선수를 분석할 수 있습니다. 

 

이를 통해 조금 더 효율적이고 정확하게 많은 선수들을 분석할 수 있게 되었고 이 데이터를 이용해 많은 코치들에게 도움을 줄 수 있습니다. 그리고 축구를 조금 더 관심 있게 즐기는 일반인들에게도 흥미로운 데이터가 될 수 있습니다.

 


이처럼 성능이 뛰어난 AI 모델이 매년 세상에 공개되고, 이것은 각 분야에 맞는 데이터들로 fine-tuning 혹은 pre-training 되어 새로운 가치를 창출하는데 이용되고 있습니다.