본문 바로가기
bar_progress

글자크기 설정

닫기

저질 숏폼에 절여진 AI, 추론 못하고 성능저하 …"데이터 품질도 관리해야"

시계아이콘01분 54초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

AI도 '쓰레기 데이터' 학습하면 성능 떨어져
복잡한 문제 생각하지 않고 결과 도출
"대형 언어모델의 품질 관리 필요"

1분 이내로 짧고 자극적으로 만들어진 '숏폼 콘텐츠'가 사람의 정신건강뿐만 아니라 인공지능(AI)의 성능까지 해친다는 연구 결과가 나왔다. 사회관계망서비스(SNS)에서 떠도는 저품질 데이터가 AI의 성능을 영구적으로 해칠 수 있어 학습하는 데이터의 품질을 관리해야 한다는 진단이 나오고 있다.


저질 숏폼에 절여진 AI, 추론 못하고 성능저하 …"데이터 품질도 관리해야"
AD

텍사스 A&M 대학교, 텍사스대학교 오스틴캠퍼스의 연구진은 지난 15일(현지시간) '대형 언어모델도 브레인 로트(Brain rot·뇌 부패)에 걸릴 수 있다'(LLMS can get 'brain rot')는 제목의 논문을 내놓았다. 브레인 로트란 온라인 콘텐츠를 과잉 소비해 정신 또는 지적 상태가 나빠지는 것을 의미한다. 특히 인스타그램 릴스나 유튜브 쇼츠 등 숏폼 콘텐츠가 브레인 로트를 유발한다. 옥스퍼드 영어사전을 발행하는 영국 옥스퍼드대학 출판부는 지난해 브레인 로트를 올해의 단어로 선정하기도 했다.


연구진은 M1과 M2 등 두 개 기준을 통해 사회관계망서비스(SNS) 엑스(X·옛 트위터)의 콘텐츠를 '쓰레기 데이터'와 '고품질 데이터'로 구분했다. M1은 게시물의 길이와 공감 수, 댓글 수, 게시물 공유 수 등을 종합해 인기도를 측정하는 기준이다. 예를 들어 게시물의 길이가 짧으면서 많은 인기를 끌었다면 쓰레기 데이터로 구분된다. M2는 내용의 깊이나 표현법 등 의미적 요소에 대한 기준으로 감탄사를 남발하거나 음모론을 주장하면 쓰레기 데이터, 사실 중심으로 논리를 펴거나 차분한 어조의 글은 고품질 데이터로 분류된다.


연구진은 이 같은 기준을 통해 데이터를 나눠서 각각 라마 38B(Llama38B), 큐엔 2.57B(Qwen2.57B), 큐엔 2.50.5B(Qwen2.50.5B), 큐엔 34B(Qwen34B) 등 대형 언어모델(LLM)들에 학습시켰다. 대형 언어모델은 방대한 양의 텍스트 데이터를 학습하여 인간의 언어를 이해하고 생성하는 AI를 뜻한다.


저질 숏폼에 절여진 AI, 추론 못하고 성능저하 …"데이터 품질도 관리해야" AP연합뉴스

논문에 따르면 쓰레기 데이터를 학습한 대형 언어모델은 성능 저하가 나타났다. 추론 능력, 장문 맥락 이해, 안전성 등 대부분의 영역에서 성능이 떨어졌다. 여기서 안전성이란, 유해한 정보를 걸러내는 윤리적 영역의 AI 기능을 의미한다. 실제 테스트에서도 성능 하락이 드러났다. 쓰레기 데이터를 학습하지 않은 대형 언어모델은 AI의 추론 능력을 검증하는 아크 챌린지(ARC-Challenge)에서 74.9점을 받았지만 쓰레기 데이터만을 학습한 대형 언어모델의 점수는 57.2점으로 떨어졌다.


연구진은 AI가 계속해서 쓰레기 데이터를 학습하면 일시적인 성능 저하가 아닌 영구적인 성능 손상으로 이어진다는 점도 확인했다. 논문에서는 이를 '인지 구조의 변형'이라고 설명했다. 연구진은 "쓰레기 데이터를 학습한 대형 언어모델에 다시 고품질 데이터를 학습시켰지만 성능이 완벽하게 돌아오지 않았다"고 밝혔다.


데이터의 품질은 AI의 성향도 좌우했다. M1을 기준으로 쓰레기로 분류된 데이터를 학습한 대형 언어모델은 사이코패스 혹은 나르시시즘(자신을 지나치게 애착하거나 관심 보이는 심리 상태), 마키아벨리즘(목적을 위해서는 어떤 수단도 정당하다고 믿는 사상) 등 성향을 나타냈다. SNS에서 접할 수 있는 자극적이거나 선정적인, 유해한 게시물대로 AI의 성향이 결정되는 셈이다. 다만 친화력, 개방성 등 일부 항목에서는 긍정적인 결과를 나타내기도 했다. 고품질 데이터를 학습한 대형 언어모델은 비교적 온건한 반응을 보였다.


연구진은 대형 언어모델 브레인 로트의 원인으로 사고 생략(Thought Skipping)을 지목했다. 쓰레기 데이터를 학습한 대형 언어모델은 복잡한 문제가 주어질 때 중간 단계를 생각하지 않고 곧바로 결과부터 도출했다. 이 때문에 장문의 맥락, 논리적 연결성이 필요한 상황에서 더 수준 낮은 답변을 내놓았다. 연구진은 논문을 통해 "대형 언어모델이 점점 더 많은 인터넷상 데이터와 언어를 학습하고 있다"며 "피해를 막기 위해 신중한 데이터 분류와 대형 언어모델의 품질 관리가 필요하다"고 설명했다.


AD

숏폼 콘텐츠 등 자극적인 정보를 전달하는 짧은 영상이 인간에게도 악영향을 미친다는 연구 결과는 계속 나오고 있다. 컬럼비아대 의대 연구팀은 2021년 동영상을 정기적으로 장시간 시청하면 뇌에 강한 자극을 줘 기억력, 추리능력이 감퇴한다는 내용의 연구를 발표했다. 이건우 바른ICT연구소 교수는 논문을 통해 "인스타그램 릴스와 유튜브 쇼츠 같은 숏폼 콘텐츠가 사용자의 온라인 영상시청 시간을 증가시켰다"며 "2021년 숏폼 콘텐츠 도입이 20대의 전반적인 스마트폰 과의존 위험군 증가에 직·간접적으로 영향을 미쳤다"고 설명했다.




공병선 기자 mydillon@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 25.12.0209:29
    자식 먹이고자 시도한 부업이 사기…보호망은 전혀 없었다
    자식 먹이고자 시도한 부업이 사기…보호망은 전혀 없었다

    "병원 다니는 아빠 때문에 아이들이 맛있는 걸 못 먹어서…." 지난달 14일 한 사기 피해자 커뮤니티에 올라 온 글이다. 글 게시자는 4000만원 넘는 돈을 부업 사기로 잃었다고 하소연했다. 숨어 있던 부업 사기 피해자들도 나타나 함께 울분을 토했다. "집을 부동산에 내놨어요." "삶의 여유를 위해 시도한 건데." 지난달부터 만난 부업 사기 피해자들도 비슷한 상황에 놓여있었다. 아이 학원비에 보태고자, 부족한 월급을 메우고자

  • 25.12.0206:30
    "부끄러워서 가족들한테 말도 못 해"…전문가들이 말하는 부업사기 대처법 ⑤
    "부끄러워서 가족들한테 말도 못 해"…전문가들이 말하는 부업사기 대처법 ⑤

    편집자주부업인구 65만명 시대, 생계에 보태려고 부업을 시작한 사람들이 부업으로 둔갑한 사기에 빠져 희망을 잃고 있다. 부업 사기는 국가와 플랫폼의 감시망을 교묘히 피해 많은 피해자를 양산 중이다. 아시아경제는 부업 사기의 확산과 피해자의 고통을 따라가 보려고 한다. 전문가들은 사회관계망서비스(SNS)를 중심으로 확산하는 부업 사기를 두고 플랫폼들이 사회적 책임을 갖고 게시물에 사기 위험을 경고하는 문구를 추가

  • 25.12.0112:44
    부업도 보이스피싱 아냐? "대가성 있으면 포함 안돼"
    부업도 보이스피싱 아냐? "대가성 있으면 포함 안돼"

    법 허점 악용한 범죄 점점 늘어"팀 미션 사기 등 부업 사기는 투자·일반 사기에 해당한다는 이유로 구제 대상에서 제외되고 있습니다. 하지만 부업 사기도 명확히 전기통신금융사기(보이스피싱)의 한 유형이고 피해자는 구제 대상에 포함되도록 제도가 개선돼야 합니다."(올해 11월6일 오OO씨의 국민동의 청원 내용) 보이스피싱 방지 및 피해 복구를 위해 마련된 법이 정작 부업 사기 등 온라인 사기에는 속수무책인 상황이 반복되

  • 25.12.0112:44
    의지할 곳 없는 부업 피해자들…결국 회복 포기
    의지할 곳 없는 부업 피해자들…결국 회복 포기

    편집자주부업인구 65만명 시대, 생계에 보태려고 부업을 시작한 사람들이 부업으로 둔갑한 사기에 빠져 희망을 잃고 있다. 부업 사기는 국가와 플랫폼의 감시망을 교묘히 피해 많은 피해자들을 양산 중이다. 아시아경제는 부업 사기의 확산과 피해자의 고통을 따라가보려고 한다. 나날이 진화하는 범죄, 미진한 경찰 수사에 피해자들 선택권 사라져 조모씨(33·여)는 지난 5월6일 여행사 부업 사기로 2100만원을 잃었다. 사기를 신

  • 25.12.0111:55
    SNS 속 '100% 수익 보장'은 '100% 잃는 도박'
    SNS 속 '100% 수익 보장'은 '100% 잃는 도박'

    편집자주부업인구 65만명 시대, 생계에 보태려고 부업을 시작한 사람들이 부업으로 둔갑한 사기에 빠져 희망을 잃고 있다. 부업 사기는 국가와 플랫폼의 감시망을 교묘히 피해 많은 피해자들을 양산 중이다. 아시아경제는 부업 사기의 확산과 피해자의 고통을 따라가보려고 한다. 기자가 직접 문의해보니"안녕하세요, 부업에 관심 있나요?" 지난달 28일 본지 기자의 카카오톡으로 한 연락이 왔다.기자가 사회관계망서비스(SNS) 인스

  • 25.12.0513:09
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 김용태 국민의힘 의원(12월 4일) "계엄 1년, 거대 두 정당 적대적 공생하고 있어""장동혁 변화 임계점은 1월 중순. 출마자들 가만있지 않을 것""당원 게시판 논란 조사, 장동혁 대표가 철회해야""100% 국민경선으로 지방선거 후보 뽑자" 소종섭 : 김 의원님, 바쁘신데 나와주셔서 고맙습니다. 김용태 :

  • 25.12.0415:35
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 강전애 전 국민의힘 대변인, 김준일 시사평론가(12월 3일) 소종섭 : 국민의힘에서 계엄 1년 맞이해서 메시지들이 나왔는데 국민이 보기에는 좀 헷갈릴 것 같아요. 장동혁 대표는 계엄은 의회 폭거에 맞서기 위한 것이었다고 계엄을 옹호하는 듯한 메시지를 냈습니다. 반면 송원석 원내대표는 진심으로

  • 25.11.2709:34
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 윤희석 전 국민의힘 대변인(11월 24일) 아시아경제 '소종섭의 시사쇼'에 출연한 윤희석 전 국민의힘 대변인은 "장동혁 대표의 메시지는 호소력에 한계가 분명해 변화가 필요하다"고 진단했다. 또한 "이대로라면 연말 연초에 내부에서 장 대표에 대한 문제제기가 불거질 것"이라고 내다봤다. 한동훈 전

  • 25.11.1809:52
    홍장원 "거의 마무리 국면…안타깝기도"
    홍장원 "거의 마무리 국면…안타깝기도"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD 지난 7월 내란특검팀에 의해 재구속된 윤석열 전 대통령은 한동안 법정에 출석하지 않았다. 특검의 구인 시도에도 강하게 버티며 16차례 정도 출석 요청에 응하지 않았다. 윤 전 대통령의 태도가 변한 것은 곽종근 전 육군 특수전사령관이 증인으로 나온 지난달 30일 이후이다. 윤 전 대통령은 법정에 나와 직접

  • 25.11.0614:16
    김준일 "윤, 여론·재판에서 모두 망했다" VS 강전애 "윤, 피고인으로서 계산된 발언"
    김준일 "윤, 여론·재판에서 모두 망했다" VS 강전애 "윤, 피고인으로서 계산된 발언"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이미리 PD■ 출연 : 강전애 전 국민의힘 대변인, 김준일 시사평론가(11월 5일) 소종섭 : 이 얘기부터 좀 해볼까요? 윤석열 전 대통령 얘기, 최근 계속해서 보도가 좀 되고 있습니다. 지난해 국군의 날 행사 마치고 나서 장군들과 관저에서 폭탄주를 돌렸다, 그 과정에서 또 여러 가지 얘기를 했다는 증언이 나왔습니다. 강


다양한 채널에서 아시아경제를 만나보세요!

위로가기