최유리기자
네이버, 카카오 등 인공지능(AI) 사업자가 AI 학습용 데이터를 쓰려면 저작권자에게 적절한 보상을 해야 한다는 정부 차원의 가이드라인이 나왔다. 사업자들은 신속한 기술 개발이 어려워졌다며 반발하는 반면, 그간 데이터 사용 대가를 요구했던 언론사 등 저작권자의 목소리에는 힘이 실릴 전망이다. 대가의 적정성 여부와 함께 구체적인 산정방식에 대한 갑론을박이 시작될 것으로 보인다.
문화체육관광부가 27일 공개한 ‘생성형 AI 저작권 안내서’에 따르면 IT기업 등 사업자는 AI 학습용 데이터를 활용할 때 저작권자에게 적절한 보상 등으로 적법한 이용 권한을 확보하도록 했다. 또 홈페이지나 블로그, 사회관계망서비스(SNS) 등에 공개된 저작물이라도 저작권자 허락 없이 이용할 수 있는 것은 아니기 때문에 유의할 필요가 있다고 지적했다. 이 가이드라인은 사업자, 저작권자, 서비스 이용자가 AI 저작권과 관련해 유의해야 할 사항을 담은 안내서로, 사실상 AI 저작권에 대한 정부 입장이라는 평가다.
가이드라인은 법적 구속력이 없지만 뚜렷한 방향성을 제시했다는 점에서 의미가 있다. 안내서 작성에 참여한 이대희 고려대학교 법학전문대학원 교수는 "해외에선 학습용 데이터에 사용료를 내는 사례가 나오는 등 장기적으로는 보상하는 방향으로 갈 것"이라고 설명했다.
생성형 AI의 기반이 되는 거대언어모델(LLM)을 만들기 위해 방대한 데이터를 모아야 하는 AI 사업자들은 비상이 걸렸다. 네이버의 경우 제휴 언론사들의 50년 치 기사를 활용했다는 얘기도 돌았다. 그간 무상으로 쓰던 데이터를 유료로 구매해야 하는 만큼 비용부담은 커질 수밖에 없다.
한국소프트웨어산업협회 산하 초거대AI추진협의회는 즉각 반발했다. 가이드라인대로면 신속한 기술 개발이 불가능하다며 "학습 데이터에 대한 적법한 권한을 확보할 것을 권고한다"는 문구를 삭제해 달라고 요청했다. 대신 명확하게 금지된 사항을 안내하는 방향으로 안내서 수정을 건의했다. 안홍준 한국소프트웨어산업협회 산업정책실장은 "데이터 이용 목적, 기간, 대가 등을 건건이 협의해야 한다는 의미로 풀이되는데 이런 절차로는 글로벌 경쟁에서 뒤처질 수밖에 없다"고 우려했다.
IT업계 관계자는 "보상 기준 등이 구체적이지 않아 지켜봐야겠지만 데이터 활용의 보이지 않는 허들로 작용할 것"이라며 "향후 관련 입법이나 법원 판단에 영향을 줄 수 있어 우려된다"고 말했다. AI 학습에 무상으로 저작물을 이용할 수 있도록 한 데이터마이닝법안이 국회에 계류 중인 상황에서 섣부르게 허들을 세웠다는 지적이다. 관련 법안은 AI학습용 데이터를 저작권법 예외인 '공정이용' 대상에 포함하는 내용을 담고 있다.
반면 데이터 저작권자의 목소리에는 힘이 실릴 전망이다. 현재 언론사를 중심으로 AI 학습 데이터에 대한 대가를 요구하고 있다. 한국신문협회는 최근 "생성형 AI의 뉴스 학습 및 활용에 대한 대가 지급을 의무화해야 한다"는 내용의 의견서를 문체부에 제출했다. 한국방송협회도 네이버, 카카오, 구글코리아 등에 방송사 저작물을 AI 학습에 활용하는지 확인을 요청했다. 이 경우 별도의 보상이 필요하다는 의견을 전달했다.
해외에선 AI 사업자들과 언론사들의 소송이 이어지고 있다. 미국 뉴욕타임스(NYT)는 27일(현지시간) AI 훈련에 자사 기사가 무단으로 활용됐다며 챗GPT 개발사 오픈AI와 마이크로소프트(MS)를 상대로 소송을 제기했다. 앞서 CNN방송, 로이터통신 등은 챗GPT의 정보 수집을 차단했다.
일부 빅테크(대형 정보기술 기업)는 AI 학습용 콘텐츠 사용료 협상에 나섰다. 애플은 최근 주요 언론사와 출판사에 최소 5000만달러(약 650억원)의 계약을 제시했다. 오픈AI도 AP통신사, 아메리칸 저널리즘 프로젝트 등과 뉴스 사용료 지급 계약을 맺었다. 문체부 AI 저작권 제도개선 워킹그룹 구성원인 김찬동 한국저작권위원회 법제연구팀장은 "데이터 사용에 대한 보상 방법이나 개개인의 동의를 받는 문제는 세부적인 논의가 필요하다"며 "향후 국내외 동향을 파악해 합리적인 방향을 도출할 것"이라고 했다.