본문 바로가기
bar_progress

글자크기 설정

닫기

[과학을읽다]AI는 더 이상 배울 것이 없다?

시계아이콘02분 42초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

데이터 고갈과 모델 붕괴가 드러낸 인공지능의 구조적 한계

인공지능(AI)은 늘 더 똑똑해질 것처럼 보였다. 해마다 새로운 모델이 등장했고, 답변은 더 자연스러워졌으며, 인간의 영역을 빠르게 따라잡았다. 우리는 어느새 AI의 발전을 당연한 전제로 받아들이고 있다.


하지만 최근 AI 업계와 연구 현장에서는 조금 다른 질문이 나오기 시작했다. 만약 인공지능이 더 이상 배울 것이 없다면, 그다음은 어떻게 될까. AI의 발전은 정말 끝없이 이어질 수 있을까.

[과학을읽다]AI는 더 이상 배울 것이 없다?
AD

이 질문의 출발점은 '학습 데이터'다. 인공지능은 스스로 세상을 경험하지 않는다. 인간이 남긴 기록, 즉 텍스트와 이미지, 영상과 음성 데이터를 통해 세상을 배운다. AI의 지능은 연산 능력만으로 만들어지는 것이 아니라, 무엇을 얼마나 다양하고 질 높은 데이터를 학습했는지에 따라 크게 좌우된다. 그런데 이 학습의 재료가 점점 한계에 다다르고 있다는 경고가 잇따르고 있다.


인터넷이라는 '금광'이 바닥나다: 2026년의 경고

지금까지 대규모 언어모델(LLM)은 인터넷에 공개된 방대한 데이터를 기반으로 성장해왔다. 웹 문서와 뉴스 기사, 책과 논문은 AI의 교과서였다. 그러나 공개적으로 접근 가능한 고품질 데이터는 이미 상당 부분 수집된 상태다.


글로벌 AI 연구기관인 '에포크(Epoch)'는 최근 보고서를 통해 인간이 생성한 고품질 텍스트 데이터 자산이 이르면 2026년에서 2030년 사이에 완전히 바닥을 드러낼 것이라고 경고했다. 남아 있는 데이터는 저작권 문제로 접근이 엄격히 제한되거나, 막대한 비용을 지불해야 하는 유료 데이터인 경우가 많다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

이로 인해 AI 기업들이 이전과 같은 방식으로 '무단 대량 수집'을 통해 학습하기는 사실상 불가능해졌다. 데이터 확보가 기술 경쟁을 넘어 막대한 자본과 법적 공방의 영역으로 넘어간 것이다. 실제로 뉴욕타임스(NYT)와 같은 주요 언론사들과 작가들이 오픈AI 등을 상대로 제기한 저작권 소송은 AI 업계가 직면한 '데이터 장벽'을 상징적으로 보여준다.


이성엽 고려대학교 지식재산전략학과 교수는 "대형 언어모델은 이미 웹상의 공개 데이터를 대부분 훑었다고 봐야 한다"며 "단순히 데이터의 양(Quantity)을 늘리는 방식은 이제 중복되거나 재가공된 저품질 텍스트가 섞여 들어오기 때문에, 지능 향상에 기여하는 한계효용이 급격히 감소하는 단계에 진입했다"고 진단했다.


그는 이어 "이제는 단순한 말뭉치가 아니라, 고난도의 논리 구조와 인간의 가치 판단이 정교하게 라벨링 된 데이터가 필요하지만, 이를 생산하고 검증하는 비용은 기하급수적으로 늘고 있다"고 덧붙였다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

합성 데이터의 역설: '모델 붕괴'라는 보이지 않는 벽

데이터 부족의 대안으로 업계가 주목한 것이 '합성 데이터(Synthetic Data)'다. AI가 만든 텍스트와 이미지로 다시 차세대 AI를 학습시키는 방식이다. 인간의 기록이 부족하다면, AI가 스스로 데이터를 생성해 자가 발전하면 된다는 발상이다. 하지만 이 방식은 최근 '모델 붕괴(Model Collapse)'라는 치명적인 구조적 결함을 드러냈다.


영국 옥스퍼드대, 케임브리지대, 캐나다 토론토대 공동연구진은 국제 학술지 '네이처'에 발표한 논문에서 AI 생성 데이터를 반복 학습한 모델이 불과 몇 세대 만에 본래의 데이터 분포를 잊고 횡설수설하는 '지능의 퇴행' 과정을 입증했다. 연구진은 이를 통해 AI가 확률적으로 드문 사례(Outliers)를 단순한 오차로 간주해 삭제하면서, 정보의 다양성이 급격히 사라지는 메커니즘을 분석했다.


이는 사진을 복사하고 그 복사본을 다시 복사하면 어느 순간 형체를 알 수 없게 뭉개지는 '열화 현상'이 지능의 영역에서도 벌어지는 셈이다. 결과적으로 합성 데이터에만 의존한 AI는 편향된 정보만을 반복 재생산하는 '에코 체임버(Echo Chamber)'에 갇히게 된다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

테크 거인들의 전략 수정: 일리야 수츠케버와 얀 르쿤의 시각

이런 위기감은 AI 거장들의 발언에서도 명확히 드러난다. 오픈AI의 공동창립자이자 전 수석과학자인 일리야 수츠케버는 최근 한 기조연설에서 "우리는 인터넷이라는 금광을 거의 다 캤으며, 이제는 단순한 규모 확장(Scaling Law)만으로는 다음 단계의 지능에 도달하기 어렵다"고 지적했다. 이는 AI 경쟁의 승부처가 GPU 개수에서 '남들이 가지지 못한 배타적 데이터'로 옮겨갔음을 선언한 것이다.


메타의 AI 수석과학자 얀 르쿤 역시 텍스트 위주 학습의 근본적 한계를 지적해왔다. 그는 저서와 학술 강연을 통해 "인간의 아이는 수조 개의 단어를 읽어서 지능을 얻는 것이 아니라, 물리적 세계와의 실시간 상호작용을 통해 배운다"고 강조한다. 텍스트 데이터에만 의존하는 현재의 학습 방식은 결국 현실 세계와 동떨어진 '환각의 루프'에 빠질 뿐이라는 비판이다. 그는 텍스트를 넘어선 영상과 감각 데이터, 즉 물리 법칙을 스스로 이해할 수 있는 '세계 모델(World Model)'로의 아키텍처 전환이 필요하다고 주장한다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

다시 중요해지는 '인간의 기록'과 질문들

결국 AI의 학습이 정체기에 접어든다는 것은 기술적 재난이라기보다 '성장의 패러다임'이 변화하고 있음을 의미한다. 지금까지 AI가 인간의 기록을 대량으로 흡수하며 덩치를 키운 시기였다면, 앞으로는 데이터의 '양'보다 '질', 그리고 그 데이터를 생성하는 인간의 창의적 기록이 AI의 생존을 결정하는 귀한 자산이 될 전망이다.


실험실의 정교한 관측 데이터, 현장의 생생한 관찰 기록, 그리고 인간만이 내릴 수 있는 복잡한 도덕적·철학적 판단은 AI가 스스로 합성해낼 수 없는 영역이다. 이 때문에 구글, 마이크로소프트 등 거대 테크 기업들은 이제 단순히 데이터를 수집하는 것을 넘어 전문가 집단을 고용해 AI에게 가르칠 '고품질의 문제지'를 직접 제작하는 데 천문학적인 자금을 쏟아붓고 있다.


AD

AI의 다음 단계는 기계 안에만 있지 않다. 그 답은 여전히 인간이 살아가는 물리적 세계와 그 속에서 만들어지는 1차 데이터에 있다. AI가 배울 것이 없어 보이는 지금의 순간은, 사실 기술의 한계가 아니라 인간이 무엇을 소중히 기록하고 남겨야 하는지를 다시 묻는 성찰의 시간이 되고 있다. AI가 무엇을 할 수 있는지를 묻는 시대에서, 우리가 어떤 세계를 데이터로 남길 것인지를 고민해야 하는 시대로 접어든 것이다.




김종화 기자 justin@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 26.01.0914:18
    "손해 보고도 집못팔까" 걱정 덜어준다…지방 미분양 '환매보증' 첫도입
    "손해 보고도 집못팔까" 걱정 덜어준다…지방 미분양 '환매보증' 첫도입

    정부가 지방 미분양 해소를 위해 수분양자에게 일정 가격으로 되팔 권리를 보장하는 '주택환매 보증제(가칭)'를 처음 도입한다. 준공 후 미분양 1가구1주택 특례 가액기준을 6억원에서 7억원으로 상향하고, 인구감소지역 세제 특례와 기업구조조정 부동산투자회사(CR리츠) 지원도 연장한다. 공급 측면에서는 3기 신도시 1만8000가구를 포함해 올해 5만가구 착공에 나선다. 9일 관계부처 합동으로 발표한 '2026년 경제성장전략'에서

  • 26.01.0914:05
    디지털자산 제도화 본격화…스테이블코인·현물 ETF까지 제도권 편입
    디지털자산 제도화 본격화…스테이블코인·현물 ETF까지 제도권 편입

    정부가 스테이블코인 규율체계 마련을 포함한 디지털자산 제도화에 속도를 낸다. 디지털자산 기본법(가상자산 2단계 법안) 입법을 통해 발행·유통·거래 전반을 포괄하는 규제 틀을 마련한다. 또한 디지털자산 현물 상장지수펀드(ETF) 도입을 추진할 계획이다. 재정경제부·금융위원회를 비롯한 관계기관은 9일 오후 '2026 경제성장전략'을 통해 스테이블코인 규율체계 마련 등 디지털자산을 제도화하겠다고 밝혔다. 해당 법안은

  • 26.01.0914:00
    국장 장기투자 촉진 ISA 신설…국부펀드는 20조원 규모로 출범
    국장 장기투자 촉진 ISA 신설…국부펀드는 20조원 규모로 출범

    정부가 국내 장기 주식투자를 유도하기 위해 세제 혜택을 대폭 확대한 생산적 금융 개인종합자산관리계좌(ISA)를 출시한다. 투자 시 납입부터 배당까지 '더블 혜택'을 주는 국민성장펀드·기업성장집합투자기구(BDC) 펀드도 출시한다. 국내외 산업과 자산에 적극적으로 투자해 수익을 창출하는 '한국형 국부펀드'는 20조원 규모로 출범하기로 했다.9일 재정경제부는 이런 내용을 담은 '2026년 경제성장전략'을 발표했다. 정부는 60

  • 26.01.0914:00
    "국장 장기투자 촉진" 세제혜택 늘린 '생산적금융 ISA' 신설
    "국장 장기투자 촉진" 세제혜택 늘린 '생산적금융 ISA' 신설

    생산적 금융을 강조해온 이재명 정부가 국장 장기투자를 촉진하기 위한 '생산적 금융 개인종합투자계좌(ISA)'를 신설한다. 일정소득 이하의 청년을 대상으로 한 '청년형 ISA'는 물론, 비과세 200만원이 적용되는 기존 ISA 대비 세제혜택을 대폭 확대한 '국민성장ISA'도 선보일 예정이다. 재정경제부, 금융위원회를 비롯한 관계부처는 9일 오후 이러한 내용을 포함한 '2026년 경제성장전략'을 공개했다. 생산적 금융 기치 하에 첨단

  • 26.01.0914:00
    7월부터 24시간 외환시장 개방…MSCI선진지수 편입 박차
    7월부터 24시간 외환시장 개방…MSCI선진지수 편입 박차

    정부가 오는 7월부터 외환시장을 24시간 개방해 원화 국제화에 나선다. 역외 원화 결제 시스템을 구축하고 관련 규제를 정비함으로써 한국 증시의 숙원이자 이재명 대통령의 공약인 '모건스탠리캐피털인터내셔널(MSCI) 선진국지수' 편입에 박차를 가한다는 방침이다. 재정경제부·금융위원회를 비롯한 관계 기관은 9일 오후 '2026년 경제성장 전략'을 공개하면서 이러한 내용의 'MSCI 선진국지수 편입을 위한 외환·자본시장 종합

  • 26.01.1609:11
    윤희석 "한동훈 제명돼도 당 위한 활동 계속"
    윤희석 "한동훈 제명돼도 당 위한 활동 계속"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 윤희석 전 국민의힘 대변인(1월 15일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 전화 인터뷰 응해주셔서 감사합니다. 윤희석 : 감사합니다. 소종섭 : 국민의힘 윤리위원회가 제명 처분을 할 것이라고 예상을 했나요? 윤희석 : 어느 정도는 예상했었죠

  • 26.01.1416:21
    이준석 "한동훈, 고수라면 창당이나 서울시장 무소속 출마 선언할 것"
    이준석 "한동훈, 고수라면 창당이나 서울시장 무소속 출마 선언할 것"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 이준석 개혁신당 대표(1월 14일) ※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까? 소종섭의 시사쇼 시작하겠습니다. 이준석 개혁신당 대표와 함께 여러 가지 이슈 짚어보도록 하겠습니다. 잘 지내셨죠? 이준석 : 예, 그렇습니다. 소종

  • 26.01.1008:01
    "아내는 연상…원더우먼 같았다" 유산·가난 속에서 함께 버틴 박홍근 의원 '인생 최고의 반석' [배우자 열전]②
    "아내는 연상…원더우먼 같았다" 유산·가난 속에서 함께 버틴 박홍근 의원 '인생 최고의 반석' [배우자 열전]②

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD편집자주6·3 지방선거의 해가 열렸다. 여야 후보자들의 출마가 이어지고 있다. 후보자들이 누구인지, 어떤 정책을 내세우는지와 함께 배우자는 어떤 인물인가에 대한 관심도 커지고 있다. '소종섭의 시사쇼'는 출마(또는 출마 예상) 후보자 배우자에 대해 알아보는 '배우자 열전'을 시작한다. ①문혜정(정원오

  • 26.01.0808:49
    동갑내기 캠퍼스 커플…"예뻐보이더라" 정원오, 배우자 문혜정 첫 인상[배우자 열전]①
    동갑내기 캠퍼스 커플…"예뻐보이더라" 정원오, 배우자 문혜정 첫 인상[배우자 열전]①

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD편집자주6·3 지방선거의 해가 열렸다. 여야 후보자들의 출마가 이어지고 있다. 후보자들이 누구인지, 어떤 정책을 내세우는지와 함께 배우자는 어떤 인물인가에 대한 관심도 커지고 있다. '소종섭의 시사쇼'는 출마(또는 출마 예상) 후보자 배우자에 대해 알아보는 '배우자 열전'을 시작한다. ①문혜정(정원오

  • 26.01.0710:25
    장성철 "장동혁, 한동훈 제명 아니면 탈당 권고할 듯"
    장성철 "장동혁, 한동훈 제명 아니면 탈당 권고할 듯"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 장성철 공론센터 소장(1월 5일) 소종섭 : 어서 오세요. 새해 복 많이 받으세요. 장성철 : 감사합니다. 새해 복 많이 받으세요. 소종섭 : 이 얘기부터 해보죠. 이혜훈 기획예산처 장관 후보자와 관련해서 폭언했다, 보좌진에게 갑질했다, 남편이 부동산 투기를 했다는 등 의혹이 쏟아집니다. 그런데


다양한 채널에서 아시아경제를 만나보세요!

위로가기