본문 바로가기
bar_progress

글자크기 설정

닫기

[과학을읽다]AI는 더 이상 배울 것이 없다?

시계아이콘02분 42초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

그 답은 여전히 인간이 살아가는 물리적 세계와 그 속에서 만들어지는 1차 데이터에 있다.

AI가 배울 것이 없어 보이는 지금의 순간은, 사실 기술의 한계가 아니라 인간이 무엇을 소중히 기록하고 남겨야 하는지를 다시 묻는 성찰의 시간이 되고 있다.

AI가 무엇을 할 수 있는지를 묻는 시대에서, 우리가 어떤 세계를 데이터로 남길 것인지를 고민해야 하는 시대로 접어든 것이다.

닫기
뉴스듣기

데이터 고갈과 모델 붕괴가 드러낸 인공지능의 구조적 한계

인공지능(AI)은 늘 더 똑똑해질 것처럼 보였다. 해마다 새로운 모델이 등장했고, 답변은 더 자연스러워졌으며, 인간의 영역을 빠르게 따라잡았다. 우리는 어느새 AI의 발전을 당연한 전제로 받아들이고 있다.


하지만 최근 AI 업계와 연구 현장에서는 조금 다른 질문이 나오기 시작했다. 만약 인공지능이 더 이상 배울 것이 없다면, 그다음은 어떻게 될까. AI의 발전은 정말 끝없이 이어질 수 있을까.

[과학을읽다]AI는 더 이상 배울 것이 없다?
AD

이 질문의 출발점은 '학습 데이터'다. 인공지능은 스스로 세상을 경험하지 않는다. 인간이 남긴 기록, 즉 텍스트와 이미지, 영상과 음성 데이터를 통해 세상을 배운다. AI의 지능은 연산 능력만으로 만들어지는 것이 아니라, 무엇을 얼마나 다양하고 질 높은 데이터를 학습했는지에 따라 크게 좌우된다. 그런데 이 학습의 재료가 점점 한계에 다다르고 있다는 경고가 잇따르고 있다.


인터넷이라는 '금광'이 바닥나다: 2026년의 경고

지금까지 대규모 언어모델(LLM)은 인터넷에 공개된 방대한 데이터를 기반으로 성장해왔다. 웹 문서와 뉴스 기사, 책과 논문은 AI의 교과서였다. 그러나 공개적으로 접근 가능한 고품질 데이터는 이미 상당 부분 수집된 상태다.


글로벌 AI 연구기관인 '에포크(Epoch)'는 최근 보고서를 통해 인간이 생성한 고품질 텍스트 데이터 자산이 이르면 2026년에서 2030년 사이에 완전히 바닥을 드러낼 것이라고 경고했다. 남아 있는 데이터는 저작권 문제로 접근이 엄격히 제한되거나, 막대한 비용을 지불해야 하는 유료 데이터인 경우가 많다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

이로 인해 AI 기업들이 이전과 같은 방식으로 '무단 대량 수집'을 통해 학습하기는 사실상 불가능해졌다. 데이터 확보가 기술 경쟁을 넘어 막대한 자본과 법적 공방의 영역으로 넘어간 것이다. 실제로 뉴욕타임스(NYT)와 같은 주요 언론사들과 작가들이 오픈AI 등을 상대로 제기한 저작권 소송은 AI 업계가 직면한 '데이터 장벽'을 상징적으로 보여준다.


이성엽 고려대학교 지식재산전략학과 교수는 "대형 언어모델은 이미 웹상의 공개 데이터를 대부분 훑었다고 봐야 한다"며 "단순히 데이터의 양(Quantity)을 늘리는 방식은 이제 중복되거나 재가공된 저품질 텍스트가 섞여 들어오기 때문에, 지능 향상에 기여하는 한계효용이 급격히 감소하는 단계에 진입했다"고 진단했다.


그는 이어 "이제는 단순한 말뭉치가 아니라, 고난도의 논리 구조와 인간의 가치 판단이 정교하게 라벨링 된 데이터가 필요하지만, 이를 생산하고 검증하는 비용은 기하급수적으로 늘고 있다"고 덧붙였다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

합성 데이터의 역설: '모델 붕괴'라는 보이지 않는 벽

데이터 부족의 대안으로 업계가 주목한 것이 '합성 데이터(Synthetic Data)'다. AI가 만든 텍스트와 이미지로 다시 차세대 AI를 학습시키는 방식이다. 인간의 기록이 부족하다면, AI가 스스로 데이터를 생성해 자가 발전하면 된다는 발상이다. 하지만 이 방식은 최근 '모델 붕괴(Model Collapse)'라는 치명적인 구조적 결함을 드러냈다.


영국 옥스퍼드대, 케임브리지대, 캐나다 토론토대 공동연구진은 국제 학술지 '네이처'에 발표한 논문에서 AI 생성 데이터를 반복 학습한 모델이 불과 몇 세대 만에 본래의 데이터 분포를 잊고 횡설수설하는 '지능의 퇴행' 과정을 입증했다. 연구진은 이를 통해 AI가 확률적으로 드문 사례(Outliers)를 단순한 오차로 간주해 삭제하면서, 정보의 다양성이 급격히 사라지는 메커니즘을 분석했다.


이는 사진을 복사하고 그 복사본을 다시 복사하면 어느 순간 형체를 알 수 없게 뭉개지는 '열화 현상'이 지능의 영역에서도 벌어지는 셈이다. 결과적으로 합성 데이터에만 의존한 AI는 편향된 정보만을 반복 재생산하는 '에코 체임버(Echo Chamber)'에 갇히게 된다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

테크 거인들의 전략 수정: 일리야 수츠케버와 얀 르쿤의 시각

이런 위기감은 AI 거장들의 발언에서도 명확히 드러난다. 오픈AI의 공동창립자이자 전 수석과학자인 일리야 수츠케버는 최근 한 기조연설에서 "우리는 인터넷이라는 금광을 거의 다 캤으며, 이제는 단순한 규모 확장(Scaling Law)만으로는 다음 단계의 지능에 도달하기 어렵다"고 지적했다. 이는 AI 경쟁의 승부처가 GPU 개수에서 '남들이 가지지 못한 배타적 데이터'로 옮겨갔음을 선언한 것이다.


메타의 AI 수석과학자 얀 르쿤 역시 텍스트 위주 학습의 근본적 한계를 지적해왔다. 그는 저서와 학술 강연을 통해 "인간의 아이는 수조 개의 단어를 읽어서 지능을 얻는 것이 아니라, 물리적 세계와의 실시간 상호작용을 통해 배운다"고 강조한다. 텍스트 데이터에만 의존하는 현재의 학습 방식은 결국 현실 세계와 동떨어진 '환각의 루프'에 빠질 뿐이라는 비판이다. 그는 텍스트를 넘어선 영상과 감각 데이터, 즉 물리 법칙을 스스로 이해할 수 있는 '세계 모델(World Model)'로의 아키텍처 전환이 필요하다고 주장한다.

[과학을읽다]AI는 더 이상 배울 것이 없다?

다시 중요해지는 '인간의 기록'과 질문들

결국 AI의 학습이 정체기에 접어든다는 것은 기술적 재난이라기보다 '성장의 패러다임'이 변화하고 있음을 의미한다. 지금까지 AI가 인간의 기록을 대량으로 흡수하며 덩치를 키운 시기였다면, 앞으로는 데이터의 '양'보다 '질', 그리고 그 데이터를 생성하는 인간의 창의적 기록이 AI의 생존을 결정하는 귀한 자산이 될 전망이다.


실험실의 정교한 관측 데이터, 현장의 생생한 관찰 기록, 그리고 인간만이 내릴 수 있는 복잡한 도덕적·철학적 판단은 AI가 스스로 합성해낼 수 없는 영역이다. 이 때문에 구글, 마이크로소프트 등 거대 테크 기업들은 이제 단순히 데이터를 수집하는 것을 넘어 전문가 집단을 고용해 AI에게 가르칠 '고품질의 문제지'를 직접 제작하는 데 천문학적인 자금을 쏟아붓고 있다.


AD

AI의 다음 단계는 기계 안에만 있지 않다. 그 답은 여전히 인간이 살아가는 물리적 세계와 그 속에서 만들어지는 1차 데이터에 있다. AI가 배울 것이 없어 보이는 지금의 순간은, 사실 기술의 한계가 아니라 인간이 무엇을 소중히 기록하고 남겨야 하는지를 다시 묻는 성찰의 시간이 되고 있다. AI가 무엇을 할 수 있는지를 묻는 시대에서, 우리가 어떤 세계를 데이터로 남길 것인지를 고민해야 하는 시대로 접어든 것이다.




김종화 기자 justin@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 26.02.1311:00
    정부 발표 2시간 만에 한 단지서 신규매물 3건…갭투자 일시 허용에도 '관망'
    정부 발표 2시간 만에 한 단지서 신규매물 3건…갭투자 일시 허용에도 '관망'

    정부가 다주택자 양도세 중과 조치를 재시행하기로 최종 발표한 이후 시장에선 매물을 내놓겠다는 다주택자의 문의가 늘고 있다. 무주택자가 세입자 있는 다주택자 집을 사게 되면 전월세 계약 종료 때까지 '일시적 갭투자'가 가능하다. 다만 매물이 늘어나면 가격 하락이 예상되는 만큼 매수자들은 서두르지 않고 있다. 앞으로 매물이 더 풀릴 것이라는 전망이 우세하면서 관망하는 것이다. 서울 지역 아파트 값 증가율은 2주 연속

  • 26.02.1310:20
    "지금 아니면 이 가격에 못 사요" 사람들 몰리더니 '잠실 르엘' 보류지 완판
    "지금 아니면 이 가격에 못 사요" 사람들 몰리더니 '잠실 르엘' 보류지 완판

    잠실미성크로바 재건축 조합이 내놓은 서울 송파구 '잠실 르엘' 보류지 10가구가 유찰 없이 첫 입찰에서 전량 낙찰됐다. 감정평가금액보다 5%가량 높은 기준가를 책정했음에도 40여명이 입찰에 참여해 평균 4대 1의 경쟁률을 기록했다. 13일 롯데건설에 따르면 조합은 최고가 공개경쟁입찰 방식으로 전용면적 59㎡B 3가구와 74㎡B 7가구를 매각했다. 입찰 기준가는 59㎡가 29억800만~29억9200만원, 74㎡가 33억1800만~35억3300만원

  • 26.02.1211:20
    양천구 33평 24억 아파트 21억까지 떨어져…매물 풀리고 호가 하락
    양천구 33평 24억 아파트 21억까지 떨어져…매물 풀리고 호가 하락

    "인근 신축 아파트 33평(전용면적 84㎡)이 전에는 24억원에 호가가 형성됐어요. 그런데 양도세 중과 발표가 나오고 21억5000만원에 매물이 나왔고 이젠 21억원에라도 팔겠다고 하네요."(서울 양천구 신정동 A공인) 정부의 다주택자 양도세 중과 방침이 확정된 이후 시장에선 체감할 만큼 다주택자 매물이 풀리고 있다. 수억원씩 호가를 낮춰 내놓거나 세입자가 있어 당장 정리하기 어려운 경우엔 위로금 명목의 웃돈을 주고 매각하

  • 26.02.1211:00
    2월 주택사업자 경기 전망 대폭 개선…"수도권 중심 가격 상승 기대"
    2월 주택사업자 경기 전망 대폭 개선…"수도권 중심 가격 상승 기대"

    서울을 비롯한 수도권의 주택 매매 가격 상승세가 이어지면서 주택사업자들의 경기 전망이 큰 폭으로 개선됐다. 주택산업연구원은 주택사업자를 대상으로 설문조사한 결과, 2월 주택사업경기전망지수는 전월 대비 15.3포인트 상승한 95.8로 집계됐다고 12일 밝혔다. 수도권의 경우 11.9포인트 올라 107.3으로, 비수도권은 16.0포인트 상승한 93.3으로 전망됐다. 해당 지수가 기준선인 100을 넘으면 주택사업 경기가 좋아질 것으로

  • 26.02.1107:00
    "국가가 부동산 개발 판 깔았다"…1·29 대책에 업계 '새 사업 검토'
    "국가가 부동산 개발 판 깔았다"…1·29 대책에 업계 '새 사업 검토'

    정부의 1·29 도심 주택공급 대책에 부동산개발업계가 새 사업 검토로 들썩이고 있다. 정부가 용산국제업무지구 등 공공 유휴부지 10여곳과 노후청사 34개소 위치 및 착공 일정을 공개하자 인근 민간 유휴부지까지 개발 동력이 생길 것이라는 판단에서다. 지난해까지 악성 프로젝트파이낸싱(PF) 정리에 묶여 있던 업계가 올해를 기점으로 규모 검토와 사업성 분석에 나서고 있다는 게 현장 분위기다. "규모 검토 이미 시작…PF사태

  • 26.02.0307:05
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:04
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:03
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:02
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:01
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0511:23
    박원석 "전한길, 이석기보다 훨씬 더 위험"
    박원석 "전한길, 이석기보다 훨씬 더 위험"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 박원석 전 국회의원(2월4일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 소종섭의 시사쇼 시작하겠습니다. 오늘은 박원석 전 의원과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 박원석 : 네, 안녕하십니까. 소종섭 : 오늘 장

  • 26.02.0314:25
    장성철 "한동훈의 알파와 오메가는 배지"
    장성철 "한동훈의 알파와 오메가는 배지"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 장성철 공론센터 소장(2월 2일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 장성철 공론센터 소장과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 이재명 대통령 SNS 정치, 지난주 토요일부터 오늘 오전까지 9개를 올렸습니다.

  • 26.01.2907:47
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'

    김민석 국무총리와 정청래 더불어민주당 대표가 '장군멍군'을 하고 있다. 보이지 않는 힘겨루기가 한창이다. 올 8월 전당대회를 향한 움직임이다. '8월 전대'는 누가 당 대표가 되느냐를 넘어 여권의 권력 지형을 가르는 의미가 있다. 정 대표가 연임에 성공한다면 그의 정치적 힘은 지금보다 더 커진다. 여권 내 위상이 올라가는 것도 당연하다. 2028년 국회의원 선거의 공천권을 쥐기 때문이다. 김민석 국무총리가 대표가 된다면

  • 26.01.2811:24
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"

    여당인 더불어민주당 내 긴장감이 높아가는 흐름이다. '명청대전'이라는 말이 나오더니 최근에는 최고위원회에서 직접 언쟁을 주고받았다. 일부 최고위원들이 회의에 불참하는 일도 벌어졌다. 8월 전당대회를 앞둔 세력 격돌이 서서히 본격화하는 모양새다. 이언주 더불어민주당 수석최고위원은 그 한가운데 있다. 최근 이 수석최고위원과 두 차례 인터뷰했다. 지난 21일 '소종섭의 시사쇼'에 출연해 1시간 인터뷰했고, 27일엔 전화

  • 26.01.2611:31
    윤희석 "오세훈 프레임 바꿔야", 서용주 "정원오 재료 좋아"
    윤희석 "오세훈 프레임 바꿔야", 서용주 "정원오 재료 좋아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 서용주 맥정치사회연구소장, 윤희석 전 국민의힘 대변인(1월 22일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까? 소종섭의 시사쇼 시작하겠습니다. 서용주 맥 정치사회연구소장님과 윤희석 전 국민의힘 대변인, 두 분 모시고 최근 여


다양한 채널에서 아시아경제를 만나보세요!

위로가기