카카오브레인, 한국어 초거대 AI 언어모델 'KoGPT' 공개

[아시아경제 강나훔 기자] 'AI가 인간처럼 생각하고 글을 써주는 초거대 AI 시대.'

카카오브레인이 ‘GPT-3’ 모델의 한국어 특화 인공지능(AI) 언어모델 ‘KoGPT’를 최대 오픈소스 커뮤니티 깃허브(github)에 공개했다.

김일두 카카오브레인 대표는 16일 카카오 개발자 콘퍼런스인 ‘if (kakao) 2021’에서 카카오브레인의 향후 방향성과 주요 연구를 소개하며 이같은 소식을 전했다.

OpenAI의 언어 모델 GPT-3는 인간과 AI가 자연어 기반으로 소통할 수 있는 AI 모델로 딥러닝의 한계를 끌어올려 차세대 AI 시대를 열었다고 평가받는 기술이다.

GPT 모델을 적용하면 추가 학습 없이 스스로 판단해 감정 분석을 할 수 있다. 예를 들어 영화 리뷰 댓글을 보고 댓글이 영화에 대한 긍정적인지 부정적인지 판별할 수 있고 글의 내용을 짧게 요약 가능하다.

카카오브레인의 KoGPT는 이같은 GPT-3 모델의 한국어 특화 버전이다. 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 구축했다. 특히 KoGPT는 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여 준다. ▲주어진 문장의 긍정과 부정 판단 ▲긴 문장 한줄 요약 ▲문장 추론 뒤 결론 예측 등 언어를 가지고 활용할 수 있는 모든 과제를 수행한다.

카카오브레인은 추후 한국어 뿐만 아니라 영어, 일본어 모델도 준비해 오픈소스화한다. 베트남어, 말레이시아어 등 동남아시아 언어도 준비해 더 많은 곳에서AI 기술의 혜택을 누릴 수 있도록 할 예정이다.

김 대표는 “앞으로 GPT 기술의 사이즈와 성능을 100배 규모로 키울 예정” 이라며 “GPT는 대규모 데이터를 다루기 때문에 높은 수준의 리소스와 투자가 필요하다. GPT를 오픈소스로 개방해 일반 대학이나 스타트업 등의 기술 접근성을 높일 것”이라고 말했다.

한편, 콘퍼런스 첫날 김 대표를 비롯한 카카오 주요 공동체 최고경영자(CEO)가 직접 발표자로 참여해 사업에 대한 경험을 공유하고 기술 노하우를 전했다. 또 서비스부문책임자(CPO)와 비즈니스 부문 책임자(CBO), 기술 부문 책임자(CTO) 등 카카오 C레벨 임원들이 나서 카카오톡 지갑, 카카오톡 채널, 카카오 뷰, 음mm 등 주요 서비스와 비즈니스에 대한 현황 및 전략, 방향성 등을 소개했다.

강나훔 기자 nahum@asiae.co.kr<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

4차산업부 강나훔 기자 nahum@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스