노경조기자
인공지능(AI). 픽사베이
1년 전 중국 인공지능(AI) 스타트업 딥시크가 오픈소스 추론 모델을 공개해 전 세계에 충격을 안겼다. 첨단 하드웨어 인프라 없이 저비용, 저효율로 고성능 AI를 구현한 딥시크는 가성비 AI 모델의 대명사가 됐다.
한국은 분주해졌다. 정부는 국산 기술력 확보가 필요하다고 판단해 독자 AI 파운데이션 모델 사업을 시작했다. 단기간에 'AI 3강' 체제를 구축하겠다는 각오로 그래픽처리장치(GPU) 지원 등에 앞장서고 있다.
하지만 '프롬 스크래치(처음부터 독자 개발)' 여부가 사업 초기부터 논란이 됐다. 정부가 '독자성'에 방점을 찍어 오픈소스 활용에 대한 부정적 인식이 업계 전반에 퍼졌다. 명확한 가이드라인이 없었기 때문에 어디까지를 독자적 모델로 볼 수 있을지에 대한 혼란이 업계를 덮쳤다. 네이버클라우드가 기준 미달로 1차 평가에서 탈락했고, 주요 기업들은 재공모 불참 의사를 밝히는 결과로 이어졌다.
정작 딥시크는 오픈소스를 적극 활용, 효율을 극대화했다. 모델 개발 과정에서 구글과 오픈AI 등의 모듈을 적용해 속도를 낸 딥시크는 이후 기존 메커니즘보다 빠른 초고속 장문 훈련·추론 기술을 공개하고, 스파스 어텐션 기술을 이용해 추론 비용을 낮추는 등 혁신을 추가하고 있다.
한국의 뛰어난 가공 능력을 십분 발휘하는 것이 시간과 비용 측면에서 이득이지 않겠냐는 업계의 지적이 나오는 이유다. 독자 AI 모델 자체를 부정적으로 바라보는 시선도 있다. 국내용에 집중할 경우 글로벌 경쟁력 확보가 어려울 수 있다는 우려에서다. 동시에 범용보다는 버티컬(특화) 모델에 집중할 필요가 있다고도 한다.
데이터 주권이 요구되는 분야는 분명히 있다. 그러나 기업들의 챗GPT 도입이 활발해지고, 개인들도 챗GPT나 제미나이를 사용하면서 각자의 사용 후기를 공유하는 시대다. 치열한 개발·업데이트 경쟁을 벌이고 있는 구글과 오픈AI의 두 AI 모델에 이미 스며들었다. AI 모델은 얼마나 많이 쓰일 수 있느냐가 핵심이다. 독자성도 중요하지만 오픈소스를 잘 활용해 성능을 높이고, 통제할 수 있게끔 하는 게 우선이다.