美법원 "인간 독서와 유사" 변형성 인정
상업 서비스·불법 수집에는 엄격
생성형 인공지능(AI)의 저작물 학습이 저작권법상 공정이용으로 인정받는 기준은 명확하다. 변형적 이용을 입증하고, 원저작물의 시장 잠식 우려를 철저히 해소해야 한다.
문화체육관광부와 한국저작권위원회가 26일 펴낸 '생성형 인공지능의 저작물 학습에 대한 저작권법상 공정이용 안내서'는 미국, 유럽 등 주요국의 최신 판례를 심층 분석해 AI 학습의 저작권 침해 여부를 가르는 명확한 법리적 기준을 제시한다.
안내서는 제1요소인 '이용의 목적 및 성격'에서 변형적 이용을 집중적으로 조명한다. 변형적 이용은 AI가 원저작물을 단순히 대체하지 않고 새로운 표현, 의미, 메시지로 변경해 새로운 가치를 부여하는 행위를 뜻한다. 영리 목적의 AI 개발이라 하더라도, 기존 저작물 시장을 침해하지 않고 새로운 가치를 창출한다면 공정이용으로 인정할 여지를 열어둔다. 반대로 비영리 목적의 연구단체라도 원저작물을 그대로 모방해 경제적 대체재로 전락시키면 철퇴를 가한다.
미국의 최신 하급심 판례는 변형적 이용을 폭넓게 인정하며 기술 패권을 지원하는 추세다. 미국 캘리포니아 북부 연방지방법원은 앤트로픽이 대규모 언어 모델 클로드의 학습 과정에서 합법적으로 구매한 도서를 복제한 행위를 공정이용으로 판단했다. AI가 특정 저작물의 표현을 밖으로 재현하지 않고 문법, 구성 등 비표현적 추상적 요소를 통계적으로 추출하는 행위를 인간이 수많은 책을 읽고 내면화하는 과정과 유사하다고 간주했다. 메타가 라마 학습에 불법 도서 저장소 데이터를 활용한 사건에서도 법원은 언어 모델 학습 자체를 고도의 변형적 이용으로 인정했다.
하지만 원저작물과 직접 경쟁하는 상업적 서비스에는 미국과 유럽 모두 엄격한 잣대를 들이댄다. 미국 델라웨어 연방지방법원은 로스 인텔리전스가 경쟁사인 톰슨 로이터의 법률 데이터베이스를 무단 학습해 유사한 법률 인공지능 검색엔진을 개발한 행위를 불법으로 규정했다. 이는 원저작물과 같은 목적을 지닌 비변형적 이용이며, 경쟁사의 시장을 직접적으로 잠식할 가능성이 크다고 판단했다.
독일 뮌헨 제1지방법원도 오픈AI의 챗GPT가 음악저작권단체 게마의 가사를 무단 학습하고 그대로 재현한 행위를 명백한 복제권 및 공중 전달권 침해로 판결했다. 모델이 학습데이터를 암기해 영구 저장하는 행위는 '텍스트 데이터 마이닝' 예외 조항을 적용할 수 없다고 선을 그었다.
지금 뜨는 뉴스
변형적 이용 목적을 입증하더라도 데이터를 훔쳐서 학습한 사례도 면책을 기대할 수 없다. 앞선 앤트로픽 판결에서 법원은 합법적으로 구매한 도서의 학습은 허용했지만, 불법 사이트에서 내려받은 도서 활용은 명백한 저작권 침해로 봤다. 이에 따라 앤트로픽은 불법 수집한 데이터세트를 영구 폐기하고 집단 소송 참가자들에게 대규모 합의금을 지급하는 절차에 돌입했다. 우리 정부의 안내서 역시 로봇 배제 표준이나 접근 제한 조치를 우회해 불법 수집한 데이터는 원천적으로 공정이용의 보호막을 벗어난다고 경고한다.
이종길 기자 leemean@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>



