본문 바로가기
bar_progress

글자크기 설정

닫기

[테크토크]업그레이드한 챗GPT, 오히려 멍청해졌다?

시계아이콘02분 08초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

"답변 질 낮아졌다" 업계서 불만 나와
3개월 전보다 수학, 코딩 응답 질 저하
AI 모델 구조 변환했을 가능성 제기돼

올해 초 생성형 인공지능(AI) 열풍을 불러온 오픈AI의 '챗GPT'가 대대적인 업그레이드 후 오히려 부정확한 답변을 내놓는 빈도가 높아졌다는 의혹을 받고 있습니다. 아직 명확히 규명되지 않은 의혹이지만 학계마저 술렁이고 있는 터라 파장은 매우 클 것으로 보입니다.


챗GPT, 업그레이드 후 멍청해졌다?
[테크토크]업그레이드한 챗GPT, 오히려 멍청해졌다? 챗GPT [이미지출처=연합뉴스]
AD

챗GPT는 오픈AI의 대형 언어 생성 모델(LLM) 'GPT' 시리즈를 기반으로 개발됐습니다. 현재 오픈AI 홈페이지에서 무료로 이용할 수 있는 챗GPT는 'GPT-3.5'를 사용했으며, 유료 구독 후 이용할 수 있는 챗GPT 프리미엄 버전의 경우 이보다 훨씬 개량된 'GPT-4.0'을 사용합니다.


하지만 GPT-4.0 도입 후 챗GPT가 오히려 '멍청해졌다'는 주장이 지속해서 제기되고 있습니다. 지난 5월 미국 메타버스 플랫폼 '로블록스' 개발자인 피터 양은 트위터에 "업그레이드 후 챗GPT의 응답 속도는 더 빨라졌지만, 대신 답변의 질은 더 낮아졌다"라고 지적하기도 했습니다.


앞서 오픈AI 측은 이런 주장에 대해 "오히려 챗GPT는 더 똑똑해졌다"라며 정면으로 반박했습니다. 다만 "이용자 수가 폭발적으로 급증하다 보니 이전에는 보이지 않았던 미흡한 점이 더 자주 발견되고 있을 뿐"이라고 설명했습니다.


"수학 풀이, 코드 생성 등 기능 떨어져" 논문도 나와
[테크토크]업그레이드한 챗GPT, 오히려 멍청해졌다? 미국 유명 플랫폼 기업 '로블록스'의 제품 책임자 피터 양이 챗GPT의 성능 저하 관련 논문 내용을 소개했다. [이미지출처=트위터]

그러나 논란은 현재진행형입니다. 심지어 미 스탠퍼드대 컴퓨터 과학 연구진은 최근 챗GPT의 응답 자료를 분석해 실제 성능이 얼마나 저하됐는지 가늠하는 연구 논문을 내놓기도 했습니다.


이 논문에서 연구진은 "수학 문제 풀이, 코드 생성, 시각적 추론 등 4개 영역에서 3월 버전 대비 전반적으로 기능이 떨어졌다"라고 판단했습니다. 다만 해당 논문 또한 아직 피어 리뷰(peer reivew·동료 전문가에게 평가받아 논문을 검증하는 과정)를 거치지 않아 액면 그대로 받아들이기엔 다소 무리가 있습니다.


AI의 '지능'을 판가름하는 것은 사실 매우 힘든 일입니다. 왜냐하면 아직 AI 모델의 실제 성능을 가늠할 수 있는 지표가 없기 때문입니다. 현재 AI 업계에선 다양한 질문과 과제로 이뤄진 데이터를 구성해 'AI 성능 벤치마크 테스트'를 개발하려는 시도가 늘고 있지만, 아직 표준으로 삼을 만한 테스트는 나오지 않았습니다.


하지만 '챗GPT의 답변 퀄리티가 과거와 비교해 떨어졌다'는 주장을 그저 허위로 치부하는 것은 힘들어 보입니다. 실제 개발자를 포함한 여러 유저가 불만 목소리를 내고 있고, 챗GPT의 이용률도 지난달부터 전월 대비 9.7% 감소하는 등 하향 곡선을 그리고 있기 때문입니다.


오픈AI, AI 구조 바꿨을 수도
[테크토크]업그레이드한 챗GPT, 오히려 멍청해졌다? 오픈AI가 챗GPT를 이루는 AI 모델의 구조를 급진적으로 바꿨을 수 있다는 추측이 나온다.

만일 챗GPT가 3개월 전보다 더 멍청해졌다면, 어째서일까요. 그 이유도 난제입니다. 기계 학습 기술은 빠르게 발전하고 있지만, 아직 학계는 컴퓨터 지능이 '어떻게' 통찰력을 발휘하는지는 알지 못합니다. 챗GPT의 근간을 이루는 딥러닝 기술은 여전히 많은 부분이 블랙박스로 가려져 있어, 정확히 어떤 부분이 성능 저하의 요인이 됐는지 파악하기 힘듭니다.


일부 전문가는 오픈AI가 챗GPT를 이루는 모델을 급진적으로 변화시켰을 수 있다고 추측합니다. 즉, GPT-3.5까지 챗GPT는 하나의 거대한 언어 모델을 기반으로 이뤄졌습니다.


그러나 GPT-4.0부터는 특정 전문 지식만 집중적으로 학습시킨 작은 언어 모델들을 여러 개 모아 하나의 AI처럼 작동시켰을 수 있다는 겁니다. 이런 접근법을 두고 '전문가 혼합(Mixture of experts·MOE)'이라고 합니다.


챗GPT가 거대 모델에서 MOE로 전환됐다면, 응답 속도가 과거에 비해 빨라진 것도 설명됩니다. 다만 한 질문에 답변하는 모델의 크기가 작아지면서 실질적인 추론 능력이 저하됐을 가능성이 있습니다.


새 모델 때문에 품질 저하됐을까
[테크토크]업그레이드한 챗GPT, 오히려 멍청해졌다? 오픈AI는 자사 AI 제품의 모델과 관련된 정보들을 대부분 기밀로 취급한다. [이미지출처=연합뉴스]

그러나 이런 설명들은 어디까지나 학계 일각에서 거론되는 추측에 불과합니다. 이는 오픈AI가 챗GPT의 실제 AI 모델과 관련된 거의 모든 사항을 공개하지 않기 때문에 벌어지는 혼란이기도 합니다.


미국 비영리 AI 연구기관 '알렌인공지능연구소' 최고경영자(CEO) 오렌 에치오니는 미 매체 '인사이더'에 챗GPT가 MOE 모델로 전환됐을 가능성에 대해 "정확도 높은 추측"이라면서도 "확신은 할 수 없다"라고 했습니다.


에치오니는 MOE 접근 방식에 대해 "응답 속도를 올리고, 더 저렴하게 (AI를) 구동하게 하는 방식"이라면서도 성능을 저하하는 것은 아니라고 강조했습니다. 다만 오픈AI가 챗GPT를 MOE로 바꾸는 과정에서 일부 품질을 희생했을 가능성은 있다고 덧붙였습니다.


챗GPT의 성능 저하 논란은 AI 비즈니스에 새로운 쟁점으로 다가오기도 합니다. 현재 오픈AI는 기업, 혹은 개인에 구독료를 받고 챗GPT 프리미엄 서비스를 제공합니다. 혹은 유료로 API(애플리케이션 프로그램 인터페이스) 사용을 허가하기도 합니다.


AD

하지만 AI의 성능이 기업의 운영 역량에 따라 큰 폭으로 저하할 수 있다면, 소비자 입장에서는 큰 손해가 될 겁니다. AI 제품의 성능을 보장할 수 있도록 투명한 정보공개가 요구될 수도 있는 셈입니다.




임주형 기자 skepped@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 26.02.0307:05
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:04
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:03
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:02
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:01
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.01.2306:55
    "한류 지금 르네상스…각국 인허가 뒷받침 필요"⑫
    "한류 지금 르네상스…각국 인허가 뒷받침 필요"⑫

    지난해 11월 말 주베트남한국문화원 주최로 베트남 하노이 OEG 스타디움에서 열린 '2025 한국게임주간'. 우리나라와 베트남의 게임산업과 문화를 교류하기 위해 3년째 진행하는 이 행사에는 5000여명이 몰려 성황을 이뤘다. 사흘간 열린 행사 중에는 양국에서 높은 인기를 얻고 있는 리그 오브 레전드(LoL), 배틀그라운드 모바일, 크로스파이어 등 e스포츠 대회 세 종목의 예선과 결선도 있었다. 이 자리에 한국 e스포츠팀 DRX 소

  • 26.01.2214:58
    베트남 '하노이 핫플' 韓 쇼핑몰 그대로 옮겨놨네
    베트남 '하노이 핫플' 韓 쇼핑몰 그대로 옮겨놨네

    ⑩ #베트남 수도 하노이에서 가장 큰 호수인 '서호(West Lake)'를 마주한 롯데몰 웨스트레이크 하노이. 출입문 앞 광장의 분수는 싸이의 '강남스타일', 빅뱅의 '하루하루' 등 K팝 리듬에 맞춰 조명과 물줄기가 시시각각 변했다. 한껏 멋을 낸 20대 여성들과 어린아이를 동반한 부모들은 분수대와 쇼핑몰을 배경으로 연신 휴대전화 카메라 셔터를 눌렀다. 내부는 화이트톤 인테리어부터 떡볶이 무한리필 뷔페 '두끼'와

  • 26.01.2209:09
    "어라, 여기가 한국인 줄"…떡볶이 무한리필에 뷰티숍까지 '하노이 핫플' ⑩
    "어라, 여기가 한국인 줄"…떡볶이 무한리필에 뷰티숍까지 '하노이 핫플' ⑩

    #베트남 수도 하노이에서 가장 큰 호수인 '서호(West Lake)'를 마주한 롯데몰 웨스트레이크 하노이. 출입문 앞 광장의 분수는 싸이의 '강남스타일', 빅뱅의 '하루하루' 등 K팝 리듬에 맞춰 조명과 물줄기가 시시각각 변했다. 한껏 멋을 낸 20대 여성들과 어린아이를 동반한 부모들은 분수대와 쇼핑몰을 배경으로 연신 휴대전화 카메라 셔터를 눌렀다. 내부는 화이트톤 인테리어부터 떡볶이 무한리필 뷔페 '두끼'와 중식당 '연경',

  • 26.01.2207:11
    맥날은 체면 구겼는데…"치킨 염지까지 맞춰" 까다로운 베트남서 '훨훨' 롯데리아 ⑨
    맥날은 체면 구겼는데…"치킨 염지까지 맞춰" 까다로운 베트남서 '훨훨' 롯데리아 ⑨

    베트남 하노이에서 가장 큰 호수인 서호(West Lake)를 바라볼 수 있는 롯데리아 락롱콴점. 4만6000동(약 2500원)짜리 치킨볼 라이스를 주문하자 10조각 남짓한 팝콘 치킨에 안남미로 지은 밥 한덩이와 달걀 프라이, 토마토와 양배추샐러드 등이 한 접시에 담겨 나왔다. 겉면에 윤이 나는 소스를 바른 팝콘 치킨을 한 입 베어 물자 강렬한 단맛이 입안에 퍼졌다. 이우주 베트남 롯데리아 운영팀장은 "퀵서비스 레스토랑(QSR)에서 버

  • 26.01.2115:53
    '뷔 얼굴' 하나로 국적이 바뀌었다…한국어만 들어가면 불티나게 팔려
    '뷔 얼굴' 하나로 국적이 바뀌었다…한국어만 들어가면 불티나게 팔려

    지난달 일본 최대 뷰티 편집숍 '앳코스메 도쿄(@come TOKYO)'는 일본 뷰티 브랜드 '윤스(Yunth)' 팝업스토어 입장을 기다리는 대기줄로 북적였다. 일본 MZ세대(밀레니얼+Z세대)와 관광객이 자주 찾는 쇼핑의 거리 '하라주쿠'에 위치한 매장은 K팝 아이돌인 방탄소년단(BTS) 뷔의 대형 사진이 방문객들의 눈길을 사로잡았다. 윤스는 지난해 10월29일 뷔를 앰버서더로 발탁했다. 이 때문에 일부 방문객들은 윤스를 K뷰티 브랜드로 오

  • 26.02.0511:23
    박원석 "전한길, 이석기보다 훨씬 더 위험"
    박원석 "전한길, 이석기보다 훨씬 더 위험"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 박원석 전 국회의원(2월4일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 소종섭의 시사쇼 시작하겠습니다. 오늘은 박원석 전 의원과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 박원석 : 네, 안녕하십니까. 소종섭 : 오늘 장

  • 26.02.0314:25
    장성철 "한동훈의 알파와 오메가는 배지"
    장성철 "한동훈의 알파와 오메가는 배지"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 장성철 공론센터 소장(2월 2일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 장성철 공론센터 소장과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 이재명 대통령 SNS 정치, 지난주 토요일부터 오늘 오전까지 9개를 올렸습니다.

  • 26.01.2907:47
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'

    김민석 국무총리와 정청래 더불어민주당 대표가 '장군멍군'을 하고 있다. 보이지 않는 힘겨루기가 한창이다. 올 8월 전당대회를 향한 움직임이다. '8월 전대'는 누가 당 대표가 되느냐를 넘어 여권의 권력 지형을 가르는 의미가 있다. 정 대표가 연임에 성공한다면 그의 정치적 힘은 지금보다 더 커진다. 여권 내 위상이 올라가는 것도 당연하다. 2028년 국회의원 선거의 공천권을 쥐기 때문이다. 김민석 국무총리가 대표가 된다면

  • 26.01.2811:24
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"

    여당인 더불어민주당 내 긴장감이 높아가는 흐름이다. '명청대전'이라는 말이 나오더니 최근에는 최고위원회에서 직접 언쟁을 주고받았다. 일부 최고위원들이 회의에 불참하는 일도 벌어졌다. 8월 전당대회를 앞둔 세력 격돌이 서서히 본격화하는 모양새다. 이언주 더불어민주당 수석최고위원은 그 한가운데 있다. 최근 이 수석최고위원과 두 차례 인터뷰했다. 지난 21일 '소종섭의 시사쇼'에 출연해 1시간 인터뷰했고, 27일엔 전화

  • 26.01.2611:31
    윤희석 "오세훈 프레임 바꿔야", 서용주 "정원오 재료 좋아"
    윤희석 "오세훈 프레임 바꿔야", 서용주 "정원오 재료 좋아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 서용주 맥정치사회연구소장, 윤희석 전 국민의힘 대변인(1월 22일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까? 소종섭의 시사쇼 시작하겠습니다. 서용주 맥 정치사회연구소장님과 윤희석 전 국민의힘 대변인, 두 분 모시고 최근 여


다양한 채널에서 아시아경제를 만나보세요!

위로가기