오수연기자
세계경제포럼 연차총회(WEF·다보스포럼)에서도 인공지능(AI)의 지식재산권(IP) 침해를 둘러싼 얘기가 오고 갔다. 생성형 AI 열풍을 불러일으킨 오픈AI는 AI에 의한 IP 침해 우려가 너무 과장됐다고 주장했다. 그러나 반대편에서는 AI 기업들이 훈련에 쓰이는 데이터를 훔쳐 간 것이라고 반박했다.
챗GPT를 개발한 오픈AI의 샘 올트먼 최고경영자(CEO)는 16일(현지시간) 스위스 다보스에서 진행한 블룸버그와의 인터뷰에서 "우리 연구의 대부분은 소량의 고품질 데이터에서 더 많은 것을 배우는 방법에 관한 것"이라고 말했다.
오픈AI 등 AI 스타트업들이 저작권 있는 자료를 무단으로 사용해 AI를 학습한다는 지적에 정면으로 반박하는 것이다. 올트먼 CEO는 "내 훈련 데이터가 모두에게 필요하고, 매우 가치 있다고 믿는 사람들이 있다"며 "그러나 일반적으로는 그렇지 않다"고 말했다. 이어 "예를 들어 오픈AI는 NYT 데이터를 학습하고 싶지 않다"고 선을 그었다.
NYT는 지난해 12월 27일 자사가 생산한 수백만건의 기사가 오픈AI의 챗GPT 훈련에 무단으로 쓰였고, 그 결과 챗GPT가 정보 제공자로 NYT와 경쟁하게 됐다며 오픈AI와 마이크로소프트에 소송을 제기했다. 또 이 과정에서 광고, 라이선스, 구독 수익이 감소해 수십억 달러에 달하는 손해가 발생했다고 주장했다. 이에 앞서 코미디언 사라 실버맨, 인기 드라마 '왕좌의 게임' 원작자 조지 R.R 마틴, 퓰리처상 수상 작가 마이클 샤본 등 문화계 인사들도 저작권 침해 혐의로 오픈 AI에 소송을 제기했다.
오픈AI는 폴리티코·비즈니스인사이더·빌트 등을 소유한 미디어 그룹 악셀 스프링어와 AP통신 등 언론사와 뉴스 사용 계약을 체결하며 법적 리스크 최소화에 나섰다.
올트먼 CEO는 "오픈AI가 언론사들과 하고 싶은 일은 예컨대 이용자가 오늘 다보스에서 무슨 일이 있었는지 물었을 때 블룸버그 기사와 NYT 기사를 모두 보여주는 것"이라며 "어떤 사람들은 오픈AI와 협력하고 싶어하지만, 어떤 사람들은 그렇지 않다"고 말했다.
반면 시사주간지 타임(TIME)을 소유하고 있는 세일즈포스의 마크 베니오프 CEO는 AI 기업들이 기술을 구축하기 위해 지식재산권(IP)을 훔쳤다고 꼬집었다.
베니오프 CEO는 같은 날 블룸버그와의 인터뷰에서 "모든 훈련 데이터는 도난당한 것"이라며 "타임스와 NYT를 포함한 언론 매체의 콘텐츠가 AI 기업의 결과물로 나타나고 있다"고 말했다. 블룸버그에 따르면 현재 타임스와 CNN, 폭스 등은 오픈AI와 라이선스 계약을 추진하고 있다.
베니오프 CEO는 AI 학습에 쓰이는 데이터의 가치 측정에도 어려움이 있다고 지적했다. 그는 "아무도 AI가 학습하는 데이터의 공정한 가격이 얼마인지 정확하게 알지 못한다"고 말했다. 그러나 AI 기업들은 콘텐츠 제작자를 공평하게 대하기 위해 지불 체계를 표준화해야 한다.