생성형 AI 저작권 침해 합법·불법 사례 명시
원저작물 시장 대체 행위, 저작권 침해 규정
최휘영 문화체육관광부 장관과 배경훈 과학기술정보통신부 장관, 임문영 국가인공지능전략위원회 부위원장은 26일 국립현대미술관 서울관에서 AI 산업과 문화 산업의 상생을 위해 필요한 제도 개선과 지원 사업을 함께 추진하기로 했다.
생성형 인공지능(AI)이 데이터를 학습할 때 발생하는 저작권 분쟁을 막기 위해 정부가 구체적인 합법·불법 사례를 제시했다. 문화체육관광부와 한국저작권위원회가 26일 발간한 '생성형 인공지능의 저작물 학습에 대한 저작권법상 공정이용 안내서'는 상업적 목적의 원저작물 시장 대체 행위를 명백한 저작권 침해로 규정한다.
대표적 사례가 언론사의 허락 없이 뉴스 기사 전체를 크롤링해 요약 서비스를 자동 제공하는 행위다. 기자의 해석과 논평이 담긴 저작물을 이용함에 따라 언론사의 서비스와 동일·유사한 목적을 지닌다. 이용자가 원문 기사에 접근하지 않고 정보를 소비하게 만들어 언론사의 구독 및 광고 수익을 직접적으로 훼손하므로 공정이용으로 인정하지 않는다.
무단 수집만 잣대에 걸리는 것이 아니다. 정당한 대가를 지불하고 합법적으로 구매한 저작물이라도 원저작물과 경쟁하는 상업적 결과물 생성에 사용하면 침해의 굴레를 벗지 못한다. 보고서는 "교육 기술 기업이 여러 출판사의 유료 디지털 교과서 수백 권을 구매해 AI에 학습시키고 새로운 교과서나 문제집을 편찬한다면 기존 교육 출판 시장을 잠식할 수 있다"고 설명했다.
유료 이미지 웹사이트에서 고해상도 사진을 무단 수집해 상업용 모델을 개발하고 이를 바탕으로 이미지를 생성·판매하는 사업 역시 불법으로 간주한다. 음원 유통망에서 구매한 음반 수천 곡을 학습시켜 음성 변환 서비스를 유료로 제공하는 사업도 음악 시장을 훼손하는 권리 침해로 판단한다. 유료 플랫폼이 적용한 워터마크, 로봇 배제 표준 등 기술적 보호조치를 우회해 무단 수집한 데이터를 학습하는 경우 역시 다르지 않다.
반면 원저작물과 다른 새로운 가치를 창출하며 기존 시장에 피해를 유발하지 않는 사용은 공정이용으로 폭넓게 허용한다. 국책연구기관이 사회적 불평등 분석 연구를 위해 공공데이터를 자연어처리(NLP) 모델에 학습시키는 비영리 목적 활용이 대표적인 면책 사례다.
개방형 논문을 수집해 과학기술을 요약하는 모델을 개발하거나, 이공계 논문을 활용해 새로운 데이터 자동 분석 방법을 연구하는 작업도 합법의 테두리 안에 둔다. 두 사례 모두 논문 전문을 복제하지만, 창작적 표현을 모방하지 않고 아이디어와 데이터만 추출하므로 변형적 목적에 부합한다고 판단한다.
지금 뜨는 뉴스
텍스트를 넘어 영상물 데이터 분석에도 같은 면책 기준을 적용한다. 합법적으로 구매한 영화나 드라마를 활용해 범죄자 동작 패턴을 분석하고 범죄 예방 기술을 개발하는 경우가 대표적이다. 보고서는 "상업적 기업이 영리를 목적으로 개발하더라도, 영상의 표현적 요소를 재현하지 않고 분석 도구로만 기능해 원저작물 시장을 전혀 훼손하지 않는다"고 평가했다.
이종길 기자 leemean@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>


