모델 매개변수 220억개서 310억개로 확대
"소형언어모델 중 한국어 성능 가장 뛰어나"
업스테이지는 차세대 거대언어모델(LLM) '솔라 프로 2'의 프리뷰(미리 보기) 버전을 공개한다고 20일 밝혔다.
솔라 프로 2는 지난해 12월 출시된 '솔라 프로'의 후속 모델이다. 모델 매개변수(파라미터)는 기존 220억개에서 310억개로 늘었고, 이에 따라 성능도 향상됐다는 게 업스테이지의 설명이다.
업스테이지는 오는 7월 정식 출시에 앞서 초기 테스트용으로 솔라 프로 2의 프리뷰 API(응용프로그램 인터페이스)를 무료로 사용할 수 있도록 공개했다.
솔라 프로 2가 글로벌 빅테크들의 소형언어모델(sLLM) 과 비교해 앞서는 성능을 보였다는 설명이다. 'MMLU(종합 지식)', 'IFEval(지시 이행)' 등 주요 LLM 벤치마크 성능 평균에서 메타의 '라마 4 스카우트' 및 '라마 3.3 70B', 알리바바의 '큐원 2.5 72B' 등을 앞질렀다.
한국어 성능을 평가하는 'KMMLU', '해례(HAE-RAE)' 등 대표 벤치마크에서도 높은 점수를 기록하면서 공개된 소형언어모델 중 가장 뛰어난 수준임을 입증했다. 업스테이지는 고품질 한국어 데이터를 학습에 활용한 것이 주효했다고 설명했다.
아울러 솔라 프로 2에는 업스테이지 LLM 최초로 '하이브리드 모드'가 적용된다. 모델 사용 시 빠른 응답에 최적화된 '챗 모드'와 단계적 사고를 거쳐 구조화된 답변을 생성하는 '추론 모드' 중 선택할 수 있다. 추론 모드에는 생각 사슬(Chain of Thought, CoT) 기법이 적용돼 수학이나 코딩처럼 복잡한 문제에서 정교한 답변을 제공한다.
사용성도 강화됐다. 기존보다 2배 확장된 6만4000 토큰까지 지원해 더 긴 문서나 대화를 한 번에 처리할 수 있다. 자체 토크나이저(tokenizer) 개선을 통해 한국어 및 문서 기반 작업에서 최대 30%까지 토큰 절감이 가능해졌다. 이에 따라 응답 속도와 비용 효율도 향상됐다.
지금 뜨는 뉴스
김성훈 업스테이지 대표는 "솔라 프로 2는 31B라는 효율적인 규모로도 70B 모델 수준의 성능을 구현하며 작지만 강력한 소형언어모델의 새 기준을 제시한다"면서 "특히 최고 추론 성능에 뛰어난 한국어 성능을 갖춘 이번 모델을 통해 더 많은 업무 혁신을 기대한다"고 말했다.
이명환 기자 lifehwan@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>