김대현기자
온디바이스 음성 인공지능(AI) 스타트업 프레리스쿠너가 세계 저명 음성 AI 학회 '인터스피치'(Interspeech 2025)'에서 자사 논문이 우수한 기술력을 바탕으로 채택돼 구두 발표가 이뤄졌다고 20일 밝혔다.
인터스피치는 구글과 메타, 애플 등 빅테크(대형 정보기술 기업)를 포함해 전 세계 수천명의 음성 AI 전문가가 참여하는 음성 AI 분야 최대 규모의 학술대회다. 올해는 네덜란드 로테르담에서 열렸다.
프레리스쿠너의 논문은 스트리밍 음성인식 모델을 높은 정확도의 비스트리밍 모델로 손쉽게 전환할 새로운 '파라미터 효율적 미세조정'(Parameter-efficient Fine-tuning) 기법을 다루고 있다. '실시간 음성인식용 모델'을 '정확도를 중시하는 오프라인 분석용 모델'로 빠르고 경제적으로 바꿔주는 기술이다.
기존 비스트리밍 모델과 유사한 수준의 정확도를 달성하면서도 추가되는 파라미터는 10% 미만에 그친다. 하나의 스트리밍 모델만 학습시킨 뒤, 추가적인 대규모 훈련 없이 필요에 따라 비스트리밍 모델로 즉시 활용 가능해 개발·운영 효율성이 증가한다는 설명이다.
프레리스쿠너는 상용 디바이스에서 직접 구동 가능한 온디바이스 음성 AI 파운데이션 모델과 다양한 도메인에 손쉽게 적용할 수 있는 최적화 기술로 구성된 엔진 '그래스랜드(GrassLand)'를 개발하고 있다.
김기연 프레리스쿠너 대표는 "이번 연구는 제한된 자원 환경에서도 높은 성능을 요구하는 온디바이스 AI 시장에 필수적인 기술"이라며 "자체 엔진 '그래스랜드'를 지속해서 고도화해 여러 산업 분야에 성공적으로 기술을 적용해 나갈 것"이라고 밝혔다.