소버린 AI 경쟁 속 ‘한국어 음성 주권’ 부상…페르소나AI, 사투리까지 이해하는 음성 AI 공개

글로벌 인공지능(AI) 패권 경쟁이 심화되면서 각국이 자국의 언어·데이터·인프라를 기반으로 한 '소버린 AI(Sovereign AI)' 구축에 속도를 내고 있다.

소버린 AI는 단순히 AI를 보유하는 차원을 넘어, 국가의 언어와 문화, 산업 데이터를 외부 의존 없이 스스로 통제·운영할 수 있는 AI 주권을 의미한다. 특히 음성 AI는 언어 주권을 직접적으로 좌우하는 핵심 기술로 평가된다.

이러한 흐름 속에서 페르소나에이아이(대표 유승재, 이하 페르소나AI)는 2년간의 집중 개발 끝에 한국어의 특성을 정밀하게 구현한 차세대 음성 AI 모델 'SSTT(Sovereign AI Speech to Text)'를 공개했다.

SSTT는 단순한 음성 인식을 넘어, 국내 최고 수준의 음성 데이터 정밀도를 갖춘 것이 특징이다.

이번 모델은 4,000만 개 이상의 한국어 발화 데이터셋(약 5만 시간 이상 음성 데이터)을 학습해 압도적인 이해도를 갖췄다. 전체 학습량의 4분의 1 수준인 13,200시간을 사투리 데이터에 할애했다. 이를 통해 경상·전라·충청·강원·제주 등 5대 권역별 방언과 고유 어휘를 정밀하게 구분한다. 또한, AI가 인식하기 어려운 짙은 방언, 고유 어휘, 60대 이상 고령 화자의 음성 특성까지 반영해 세대와 지역을 아우르는 소통이 가능 해졌다.

특히, 표준어 중심의 기존 음성 인식 한계를 넘어, 한국어 사투리 인식과 화자분리가 가능하도록 설계된 점이 큰 특징으로 실시간 및 오프라인에서도 동작한다. 전 처리 기능을 지원하여 잡음·반향 감쇄, 원거리 인식을 위한 자동이득제어(AGC), 딥러닝 기반 음성구간 검출, 화자변곡점 검출과 같은 고품질의 음성기술이 집약돼 있다.

기존의 음성 인식 모델(STT, Speech to Text)은 소리를 텍스트로 변환하는 핵심 기술이지만, 사투리·억양·속도 차이로 인해 실제 산업 현장에서는 인식 정확도가 낮다는 한계가 있었다. 이로 인해 콜센터, 공공 민원, 의료·제조 현장 등 음성 인식 수요가 높은 분야에서도 시장 확산이 더디게 진행돼 왔다.

페르소나AI의 SSTT는 이러한 문제를 정면으로 해결했다. 최대 20명까지 화자 분리가 가능해, 기존 4~5명 수준에 머물렀던 기술 대비 획기적인 성능 향상을 이뤘다. 다자간 동시 대화 상황에서도 '누가, 어떤 말을 했는지'를 정확히 구분할 수 있어, 회의 기록, 현장 관제, 다중 사용자 인터페이스 등 활용 범위를 크게 확장시켰다.

이 같은 기술적 진보는 피지컬 AI(Physical AI) 시대를 대비한 핵심 요소로 평가된다. 앞으로 로봇, 키오스크, 산업 장비, 자율 시스템 등 대부분의 피지컬 AI 기기는 음성을 중심으로 제어·상호작용하게 될 것으로 전망된다. 이 과정에서 특정 국가나 기업의 외산 음성 모델에 의존할 경우, 데이터 주권·보안·서비스 연속성 측면의 구조적 리스크가 발생할 수 있다.

업계에서는 페르소나AI의 차세대 음성 AI 모델을 소버린 AI 관점에서 매우 중요한 전략 자산으로 평가하고 있다. 한국어, 특히 지역 사투리까지 정밀하게 인식하는 대형 음성 모델은 단기간에 외부에서 대체하기 어려운 기술로, 국가 차원의 AI 주권 확보에도 직결된다는 분석이다.

페르소나AI는 AI 모델 개발부터 산업별 솔루션화까지 수행하는 기업으로, AICC(AI 컨택센터)와 생성형 AI(Gen AI) 분야를 주력으로 하고 있다. 최근에는 작년에 이어 CES 2026 혁신상을 수상하며 2년 연속 3관왕을 기록, 국제 무대에서도 기술 경쟁력을 입증했다. 또한 피지컬 AI의 핵심 엔진으로 평가되는 VLA(Vision-Language-Action) 기술을 개발하며, 로봇·기기·AI를 연결하는 차세대 운영 구조를 제시하고 있다.

페르소나AI 관계자는 "소버린 AI 경쟁에서 가장 중요한 것은 단순한 모델 규모가 아니라, 자국 언어와 실제 산업 환경을 얼마나 깊이 이해하느냐"라며 "SSTT는 한국형 소버린 AI의 실질적 기반이 될 수 있는 핵심 모델"이라고 말했다.

소버린 AI가 국가 경쟁력의 핵심으로 부상한 지금, 한국어 음성 주권을 겨냥한 페르소나AI의 행보가 피지컬 AI와 공공·산업 전반에 강력한 파급효과를 가져올 것으로 기대된다.

디지털마케팅부 정진 기자 peng1@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스