"일본어로는 챗 GPT·엘리자 이겨"
파라미터 적어 스마트폰 활용도 높아
일본 NTT가 내년 3월 일본어에 특화된 거대언어모델(LMM) 생성형 인공지능(AI) 서비스를 상용화한다고 발표했다. 이른바 '일본판 챗 GPT'로 불리고 있는데, 챗 GPT보다 훨씬 적은 파라미터 수로 비슷한 성능을 낼 수 있다고 홍보해 성공 여부에 많은 관심이 쏠리고 있다.
2일 IT매체 니케이크로스테크에 따르면 전날 NTT는 독자 개발한 LMM '쓰즈미'를 내년 3월 법인이나 NTT 제휴 기업을 중심으로 상용화한다고 발표했다. 쓰즈미는 일본어로 타악기인 북을 뜻하는데, 경량이지만 소리가 강하고, 조율이 용이한 특징에서 따온 것으로 알려졌다.
북의 특징처럼 NTT는 쓰즈미를 파라미터(매개변수)가 70억인 '경량판'과 6억인 '초경량판' 두 개의 모델로 선보일 예정이다. 일반적으로 LMM은 수십억에서 수천억에 달하는 파라미터를 사용하고, 파라미터 수가 많을수록 AI 성능이 뛰어나다고 평가한다. 챗 GPT의 파라미터가 1750억개인 것을 고려하면, 쓰즈미의 파라미터는 턱없이 부족한 수준이다.
파라미터 수를 억제하면서 쓰즈미는 일본어 그리고 영어로만 사용이 가능할 예정이다. 그러나 일본어 사전 학습 데이터 질을 높이는 등의 연구로 일본어 성능에 온전히 집중했다는 것이 NTT의 설명이다.
NTT는 "우리가 실시한 일본어 성능 벤치마크에 따르면 경량 판은 미국 오픈AI가 개발한 GPT-3.5를 웃도는 성능을 냈다"면서 "학습 비용은 GPT 모델의 25분의 1로 상당히 아낄 수 있다"고 전했다. 현재는 GPT-4를 목표로 성능 향상을 도모 중인 것으로 알려졌다.
실제 NTT는 공식 홈페이지에서 쓰즈미와 챗 GPT 3.5, 엘리자 등과 일본어 성능을 비교한 결과를 홍보하고 있다. 이에 따르면 쓰즈미는 챗 GPT 3.5는 52.5%, 그리고 엘리자는 71.3% 확률로 성능 대결에서 이겼다.
NTT는 "경량 버전은 스마트폰이나 스마트워치에서 활용이 가능해 장점"이라고도 강조한다.
그러면서 "쓰즈미는 문자 외에 문서에 포함된 그림이나 표, 그래프를 읽고 응답하는 기능도 갖추고 있다"며 "앞으로는 시각 정보에 더해 음성 등을 포함한 학습을 이어가 내년 4월 이후 제공하겠다"고 덧붙였다.
지금 뜨는 뉴스
쓰즈미는 이달부터 NTT 도코모나 NTT 동일본 등 사내외 평가를 진행 중이다. 법인으로는 교토대병원, 도쿄해상화재보험 등과 실증 평가를 하고 있다. 시마다 아키라 사장은 "쓰즈미만으로 2027년에 1000억엔 이상의 매출을 달성하는 것이 목표"라고 전했다.
전진영 기자 jintonic@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>