KAIST는 전기 및 전자공학부 최정우 교수 연구팀이 'IEEE DCASE 챌린지 2025'에 참가해 '공간 의미 기반 음향 장면 분할' 분야에서 우승을 차지했다고 11일 밝혔다.
'IEEE DCASE 챌린지'는 세계 최고 권위의 음향 탐지 및 분석대회로 꼽힌다. 음향 분리 및 분류기술은 드론, 공장 배관, 국경감시 시스템 등에서 이상 음향을 조기에 탐지하거나 AR·VR 콘텐츠를 제작할 때 공간음향을 음원별로 분리해 편집할 수 있게 하는 차세대 인공지능(AI) 핵심 기술이다.
연구팀은 이 챌린지에 처음 참가해 세계 86개 팀과 6개 분야에서 경합한 끝에 세계 1위 타이틀을 거머쥐는 성과를 거뒀다.
최 교수와 이동헌 박사·권영후 석사·박사통합과정생·김도환 석사과정생으로 구성된 이 연구팀은 챌린지 '공간 의미 기반 음향 장면 분할' 중 '태스크(Task) 4'분야에서 실력을 검증받았다. 태스크 4 분야는 여러 음원이 혼합된 다채널 신호의 공간 정보를 분석해 개별 소리를 분리, 18종으로 분류하는 고난도 분야다.
연구팀은 오는 10월 바르셀로나에서 열리는 DCASE 워크숍에 참가해 기술을 발표할 예정이다.
앞서 이동헌 박사는 올해 초 트랜스포머(Transformer)와 맘바(Mamba) 아키텍처를 결합한 세계 최고 성능의 음원 분리 인공지능을 개발했다. 또 챌린지 기간 권영후 연구원을 중심으로 1차 분리된 음원의 파형과 종류를 단서로 다시 음원 분리와 분류를 수행하는 '단계적 추론 방식'의 AI 모델을 완성했다.
이는 사람이 복잡한 소리를 들을 때 소리의 종류, 리듬, 방향 등 특정 단서를 기초로 개별 소리를 분리해 들을 수 있는 능력을 AI가 모방한 모델이다.
연구팀은 이 모델을 통해 AI가 소리를 얼마나 잘 분리·분류했는지 평가하는 '음원의 신호대 왜곡비 향상도(CA-SDRi)'에서 참가팀 중 유일하게 두 자릿수 대의 성능(11dB)을 보여 기술적 우수성을 입증했다.
CA-SDRi는 기존 오디오와 비교했을 때 얼마나 더 선명(덜 왜곡)하게 특정 소리를 분리했는지를 데시벨(dB) 단위로 측정, 숫자가 클수록 보다 정확하고 깔끔하게 소리를 분리한 것으로 판단하는 기준이 된다.
지금 뜨는 뉴스
최 교수는 "연구팀은 최근 3년간 세계 최고의 음향 분리 AI 모델을 선보여 왔고, 그간의 성과를 챌린지에서 공식적으로 인정받았다"며 "챌린지 첫 참가에도 불구하고, 집중력 있는 연구로 당당하게 세계 1위를 거머쥔 연구팀 구성원 모두가 자랑스럽다"고 말했다.
대전=정일웅 기자 jiw3061@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>


