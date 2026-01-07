독자 AI 모델 '프롬 스크래치 기준 두고 논란

"외부 인코더 채택, 기술적 판단…자체 인코더로 교체 가능"

일각서 "라이센싱 기준 충족 못 해" 지적도

모호한 프롬 스크래치 기준…"논의 통해 기준 정립해야"

네이버클라우드가 독자 인공지능(AI) 파운데이션 모델 '프롬 스크래치' 중국 모델 차용 논란과 관련해 외부 모델을 활용한 비전 인코더는 자체 기술로 교체할 수 있는 영역이라는 입장을 밝혔다. 네이버클라우드 관계자는 7일 아시아경제와의 통화에서 "비전 인코더는 파운데이션 모델과 호환이 가능한 일종의 도구"라면서 "향후 모델 고도화 과정에서 자체 인코더로 전환하는 것도 가능하다"고 말했다.

IT 업계에 따르면 이번 논란은 네이버클라우드가 공개한 '하이퍼클로바X 시드 32B'(HyperCLOVA X SEED 32B Think) 모델과 중국 알리바바의 오픈소스 AI 모델 '큐웬(Qwen) 2.4' 모델 사이의 비전 인코더 웨이트(가중치) 코사인 유사도와 피어슨 상관계수가 높다는 주장이 불거지면서 시작됐다. 코사인 유사도는 모델의 방향성을, 피어슨 상관계수는 모델의 상관관계를 나타내는 지표다. 두 지표가 높게 나타날수록 모델의 유사도가 높다고 볼 수 있다.

이번 논란은 독자 AI 사업의 요건이었던 '프롬 스크래치'를 두고 발생했다. 정부가 추진하는 독자 AI 파운데이션 모델 프로젝트는 해외 기술에 의존하지 않기 위해 AI 모델을 밑바닥부터 새롭게 개발하는 '프롬 스크래치'를 평가 방식으로 제시했는데, 이 기준이 명확하지 못했다는 지적도 나온다.

네이버클라우드 "향후 자체 인코더로 교체 가능 검토"

지난달 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 네이버클라우드 부스를 체험하고 있다. 연합뉴스

네이버클라우드는 이번 사업에 참여하는 5개의 컨소시엄 중 유일하게 시각(이미지, 영상)과 음성 데이터까지 처리할 수 있는 옴니모달 모델을 공개했는데, 이 과정에서 알리바바 모델의 비전 인코더를 활용했다는 설명이다. 비전 인코더는 이미지나 영상의 시각 정보를 AI 모델이 이해할 수 있도록 변환하는 역할을 한다.

알리바바의 모델을 활용한 게 기술력 부족 탓은 아니라는 게 네이버클라우드의 입장이다. 네이버클라우드는 "기술적 자립도가 부족해서가 아니라 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 기술적 판단"이라면서 "이미 VUClip 등 독자적인 비전 기술력을 충분히 보유하고 있다"고 했다. 파운데이션 모델이 인간의 사고와 정체성을 담당하는 '두뇌'에 해당한다면, 비전 인코더는 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 '시신경' 역할이라는 게 네이버클라우드의 설명이다.

다만 일각에서는 비전 인코더가 옴니모달 모델에서 차지하는 역할이 큰 만큼, 외부 모델을 활용해서는 안 됐다는 지적이 나온다. 비전 인코더가 시각 정보를 AI가 이해할 수 있도록 변환해줄 뿐 아니라 주요 시각정보에 가중치를 부여하는 역할까지 하기에 중요도가 메인 모델 못지않게 크다는 것이다. 비전 인코더가 시신경의 역할뿐 아니라 이를 판단하는 두뇌의 역할도 일부 수행하는 셈이다.

모델 작동 과정에서 비전 인코더의 비중도 적지 않다. 업계에 따르면 하이퍼클로바X 시드 32B의 작동 과정에서 비전 인코더가 차지하는 비중은 매개변수(파라미터) 기준 12% 수준이다.

'독자' 파운데이션 모델 논란 점화…"프롬 스크래치 기준 필요"

독자 AI 파운데이션 사업 공모 당시 제시된 기준.

일각에서는 라이센싱을 이유로 하이퍼클로바X 시드 32B가 프롬 스크래치 기준을 충족하지 않는다는 지적도 나온다. 독자 AI 파운데이션 모델 공모 당시 제시된 기준에 따르면 '모델의 설계부터 사전학습 과정 등을 수행한 국산 모델이며, 타사 모델에 대한 라이센싱 이슈가 없어야 한다'고 명시돼 있다.

이 기준을 따르면 알리바바가 오픈소스로 공개한 큐웬 2.4의 라이센싱을 변경하면 프롬 스크래치 기준을 충족하지 못하게 되는 셈이다. 오픈소스는 개발 과정에서 누구나 소프트웨어를 활용할 수 있도록 공개하는 것을 의미한다.

최병호 고려대 AI연구소장은 "공모 내용대로만 본다면 하이퍼클로바X 시드 32B는 독자 AI 파운데이션 모델에 해당하지 않을 가능성이 크다"면서 "기술력이 없는 게 아니라 사업에 맞는 형태로 제출하지 않은 전략 문제"라고 지적했다.

일각에서는 프롬 스크래치라는 기준이 모호한 만큼, 이번 논란을 계기로 AI 업계와 학계가 기준을 정립해나가야 한다는 의견도 나온다. 국내 AI 업계 한 관계자는 "국내 AI 파운데이션 모델 개발이 아직 초반인 만큼 프롬 스크래치에 대한 기준이 모호해 이런 논란이 발생한 것으로 보인다"면서 "이를 계기로 산학계의 논의를 통해 기준을 만들어나가는 과정도 의미 있을 것"이라고 말했다.

이번 사업을 주관하는 과학기술정보통신부 역시 프롬 스크래치에 대한 구체적인 기준을 세우지는 않았다고 했다. 과기부 관계자는 "(AI 모델을) 어디서부터 만들었느냐는 사람들마다 의견이 다른 추상적 개념"이라며 "글로벌에서도 프롬 스크래치의 기준이 없고, 업계에서도 논의가 진행 중인 상황"이라고 전했다. 과기부는 프롬 스크래치의 기준이 전문가들과 업계의 논의를 통해 정해져야 한다는 입장이다.

다만 이번 논란은 이달 중순으로 예정된 독자 AI 1차 평가에도 영향을 미칠 것으로 보인다. 이 관계자는 "1차 평가에서 입체적인 평가가 이뤄질 예정인데, (이번 논란이) 평가에 고려될 것"이라면서도 "당락을 좌우한다고 단정할 수는 없다"고 설명했다. 과기부는 이달 평가를 통해 5개 정예팀 중 한 곳을 탈락시킨다.





한편, 독자 AI 파운데이션 모델 사업 참가사들을 둘러싼 모델 도용 논란은 연이어 제기되고 있다. 앞서 업스테이지의 '솔라 오픈 100B'도 중국의 AI 모델을 복제했다는 의혹이 제기됐다. 다만 김성훈 업스테이지 대표가 직접 나선 공개 검증 과정에서 통계 해석에 오류가 있었음이 밝혀졌고, 의혹을 제기한 측이 사과하며 일단락됐다.





이명환 기자 lifehwan@asiae.co.kr

박유진 기자 genie@asiae.co.kr

