고려대, 한국어 답변 능력 우수한 LLM ‘구름3’ 공개

한국어 지시 이해하고 실행하는 능력 우수
AI 상담 챗봇 등 다양한 활용 가능성 기대

고려대 연구팀이 한국어에 특화된 거대언어모델(LLM) ‘구름3(KULLM3)’을 선보였다.

임희석 고려대 컴퓨터학과 교수.[사진 제공=고려대]

‘구름3’은 임희석 고려대 컴퓨터학과 교수가 이끄는 NLP&AI 연구실과 HIAI 연구소가 협력해 개발한 한국어 특화 LLM이다.

NLP&AI 연구실과 HIAI 연구소는 지난해 6월 ‘구름(KULLM)’을 처음 공개한 이후 실제 활용할 수 있는 수준으로 한국어 생성 능력을 향상하는 것을 목표로 연구해왔다.

연구팀은 고품질의 한국어 지시어 데이터 세트를 활용해 해당 모델의 한국어 지시를 따르는 능력을 대폭 향상했다. 또한 다양한 한국어 데이터 세트를 제작했으며, ‘구름3’ 모델만을 위한 특수 데이터도 제작했다.

연구팀은 이러한 데이터를 ‘Upstage SOLAR-10.7B 모델’에 적용해 지시 튜닝(instruction-tuning) 학습을 통해 ‘구름3’이 탄생했다고 설명했다.

한국어 특화 LLM '구름3'이 한국어로 출력한 답변.[사진 제공=고려대]

연구팀은 “GPT-4-터보를 활용해 분석한 결과 ‘구름3’의 생성 답변은 기존의 한국어 모델보다 매우 우수했으며 GPT-3.5 터보와 GPT-4 터보에 준하는 능력을 보였다”고 평가했다. 연구팀이 제시한 성능에 따르면 ‘구름3’이 생성한 답변은 유창성, 응집성, 정확도, 완결성, 총점 평가에서 우수한 성능을 보였다.

임 교수는 “실질적인 한국어 생성 성능이 월등한 ‘구름3’이 좋은 대안이 될 수 있을 것이라 기대한다”고 말했다.

사회부 심성아 기자 heart@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스