이명환기자
카카오는 자체 기술력을 기반으로 개발한 인공지능(AI) 언어모델 '카나나(Kanana)-2'를 업데이트하고 4종의 모델을 오픈소스로 추가 공개했다고 20일 밝혔다.
카나나-2는 카카오가 지난해 12월 글로벌 오픈소스 AI 플랫폼 '허깅페이스'를 통해 오픈소스로 공개한 언어모델이다. 이후 한달여 만에 성능을 업데이트한 4종의 모델을 오픈소스로 추가 공개했다.
카카오는 자체 기술력을 기반으로 개발한 차세대 언어모델 '카나나(Kanana)-2'를 업데이트하고 4종의 모델을 오픈소스로 추가 공개했다고 밝혔다. 카카오 제공
이번에 공개한 4종의 모델은 고효율과 저비용을 내세웠다. 특히 엔비디아 A100 수준의 범용 그래픽처리장치(GPU)에서도 원활하게 구동할 수 있도록 최적화해 중소기업과 학계 연구자들의 비용 부담을 줄이고 실용성을 높였다. 일반적으로 고성능 최신 AI 모델을 돌리기 위해서는 고가의 GPU 인프라가 필요하다.
카나나-2 효율성의 핵심은 '전문가 혼합(MoE)' 아키텍처다. 이 모델의 전체 매개변수(파라미터)는 32B(320억개) 규모인데, 실제 추론 시에는 상황에 맞는 3B(30억개)의 매개변수만 활성화해 연산 효율을 높이는 식이다. MoE 모델의 학습에 필수적인 여러 커널을 직접 개발해 성능 손실 없이도 학습 속도를 높이고 메모리 사용량은 줄였다.
데이터 학습 단계도 고도화했다. 사전 학습과 사후 학습 사이에 '미드 트레이닝' 단계를 신설하고 AI 모델이 새로운 정보를 배울 때 기존 지식을 잊는 망각 현상을 방지하기 위해 '리플레이' 기법을 도입했다. 이를 통해 새로운 추론 능력을 추가하면서도 기존 한국어 구사와 일반 상식 능력을 유지할 수 있다.
카카오는 ▲기본(Base) 모델 ▲지시 이행(Instruct) 모델 ▲추론 특화(Thinking) 모델 ▲미드 트레이닝(Mid-training) 모델 등 총 4종의 카나나-2 모델을 허깅페이스에 추가 공개했다. 연구 목적으로 활용도가 높은 미드 트레이닝 탐색용 기본 모델을 함께 제공해 오픈소스 생태계 기여도를 높였다.
사람을 대신해 실질적인 업무 수행이 가능한 에이전틱 AI의 구현을 위해 도구 호출 능력도 강화했다. 고품질 멀티 도구 호출 데이터를 집중 학습시켜 지시 이행과 도구 호출 능력을 키웠다. 이를 통해 복잡한 사용자 지시를 정확히 이해하고 적절한 도구를 스스로 선택해 호출할 수 있다는 설명이다.
이를 통해 실제 성능 평가에서도 동급 경쟁 모델인 알리바바의 '큐웬(Qwen)-30B-A3B-Instruct-2507' 대비 지시 이행 정확도와 멀티턴 도구 호출 성능, 한국어 능력 등에서 우위를 나타냈다.
김병학 카카오 카나나 성과리더는 "새로워진 카나나-2는 '어떻게 하면 고가의 인프라 없이도 실용적인 에이전트 AI를 구현할 수 있을까'에 대해 치열하게 고민한 결과"라며 "보편적인 인프라 환경에서도 고효율을 내는 모델을 오픈소스로 공개해 국내 AI 연구 개발 생태계 발전과 기업들의 AI 도입의 새로운 대안이 될 수 있기를 기대한다"고 밝혔다.