본문 바로가기
bar_progress

글자크기 설정

닫기

"암 입니다"…병 진단도 AI가 인간을 능가했다

시계아이콘01분 52초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

美 스탠퍼드대 'AI 인덱스 보고서 2025'
GPT-4, 인간 의사보다 진단 정확도 16%P↑

"암 입니다"…병 진단도 AI가 인간을 능가했다
AD

인공지능(AI) 실력이 의료 진단 분야에서도 인간을 능가했다는 보고서가 나왔다. 오픈AI의 최신 AI 모델인 GPT-4가 인간 의사보다 뛰어나다는 것이다. 'AI 닥터' 출현이 가시권에 들어왔다는 평가가 나온다.


8일(현지시간) 미국 스탠퍼드대학교 인간중심인공지능연구소(HAI)가 발표한 'AI 인덱스 2025' 보고서에 따르면 GPT-4는 임상 사례를 기반으로 한 진단 테스트에서 인간 의사보다 정확도가 16%포인트 더 높게 나왔다. 보고서는 "전반적으로 GPT-4 단독 진단 성능이 가장 높고 결과도 한결같았다"고 했다. 이어 "반면 인간 의사 단독 진단은 성능이 낮았다"며 "다만 인간 의사가 AI와 협업하면 활용 방식에 따라 성과 편차가 컸다"고 덧붙였다.


AI 인덱스 2025 보고서에서 나온 AI 대 인간 의사의 진단 테스트 실험은 GPT-4와 미국의 50명 임상의(전문의 26명·전공의 24명)에게 진단하기 어려운 환자 6명의 사례를 제공하는 방식으로 이뤄졌다. 이어 'GPT-4 단독' 'GPT-4와 협업한 인간 의사' '인간 의사 단독'의 진단 성과를 비교했다. 첫 번째 실험은 'GPT-4 대 인간 의사', 두 번째 실험은 'GPT-4와 협업한 인간 의사 대 인간 의사'로 나눠 진단 정확성을 살펴봤다.


그 결과 GPT-4가 진단한 그룹에서 정확도의 중앙값(92%)은 인간 의사 홀로 진단하는 그룹(76%)보다 16%포인트 더 높았다. 중앙값은 데이터를 나열했을 때 정확히 한가운데 있는 수치를 말한다. 또 GPT-4와 협업한 의사 그룹의 중앙값(76%)은 인간 의사 단독으로 진단한 그룹(74%)보다 단 2%포인트 높은 수준에 그쳤다. 이마저도 유의미하지 않은 것으로 나타났다. 정확도에 대해선 실험에 직접 참여하지 않은 내과 전문의 두 명이 사전에 정해진 기준에 따라 독립적으로 평가했다. 이들은 각 진단을 누가 한 건지 모르는 상태에서 채점했다.


이번 보고서 평가는 의료 현장에서 AI 위상이 달라지고 있음을 보여줬다는 점에서 의미가 있다. AI는 로봇 수술, 의학 데이터 분석은 물론 AI 기반으로 한 암 검진 솔루션 등 광범위하게 도입되고 있다. 하지만 의사의 판단을 도와주는 영역에 머물렀다.


"암 입니다"…병 진단도 AI가 인간을 능가했다

세계적으로 가장 공신력 있는 AI 백서로 꼽히는 AI 인덱스가 GPT-4같은 생성형 AI 모델이 의사보다 진단을 더 잘한다는 분석 결과를 내놓으면서 병원에서 AI 의사를 흔히 볼 수 있는 날이 머지않았다는 전망도 나온다.


보고서는 "이 실험 결과는 전반적으로 GPT-4 진단의 성능은 가장 높고 일관성이 있다는 걸 나타낸다"며 "AI가 의사와 협업할 경우에도 의사 개인의 판단 방식이나 활용 능력에 따라 성과가 달라진다"고 평가했다. 이어 "암 발견과 중증 환자 식별과 같은 분야에서도 AI가 의료진보다 뛰어난 성과를 보인 최근 연구들이 있다"며 "AI의 활용 범위가 단순한 진단을 넘어 보다 복합적인 임상 판단 영역까지 확대되고 있다"고 했다.


이와 함께 GPT-4의 임상지식 성능을 측정하는 대표적 기준인 '메드QA' 벤치마크 테스트에서도 GPT-4는 지난해 기준 96.0%의 정확도를 기록했다. 이 수치는 2022년 67.6%와 비교하면 무려 28.4%포인트 올랐다. 메드QA는 미국 의사국가시험 수준의 의학 문제를 기반으로 구성된 테스트로, AI의 임상 지식수준을 평가하는 데 쓰인다.


보고서는 "AI와 의사의 협업이 최선의 결과를 낳을 수 있다는 연구 결과들이 있어, 이 분야는 향후 중요한 연구 주제가 될 것"이라면서도 "AI 시스템 그 자체가 내포한 리스크, 예를 들어 사실과 다른 정보를 생성하는 '환각' 문제나 예측 불가능한 오류 등 신뢰성과 안전성에 대한 우려도 있어 이러한 위험 요소를 고려한 정책적 대비가 필요하다"고 덧붙였다.


AD

의료 분야에서 AI의 진단 성능이 빠르게 향상되면서 우리나라에서도 의료 전문직의 미래에 대한 논의가 이어지고 있다. 한국은행이 지난 2월 발표한 보고서 'AI와 한국경제'는 "AI가 단순히 인간 노동을 대체하는 것이 아니라 의료와 같은 고위험 분야에서는 인간의 판단을 보완하는 역할을 할 가능성이 크다"며 "특히 AI의 발전은 의료 서비스의 질을 개선할 잠재력을 지닌다"고 내다봤다.




박유진 기자 genie@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 26.02.1815:06
    "세금 무서워" 서울 고가 매물 쏟아지는데…팔리는 건 '15억 이하'
    "세금 무서워" 서울 고가 매물 쏟아지는데…팔리는 건 '15억 이하'

    정부가 '거주 목적 외' 주택 보유에 대한 세제 혜택을 단계적으로 회수하겠다고 밝히면서 서울 아파트 매물이 빠르게 쌓이고 있다. 다만 늘어나는 매물만큼 거래가 따라붙지는 못하는 모습이다. 대출 규제로 매수 여력이 제한된 데다 '다주택자 양도소득세 중과 유예' 종료일이 다가올수록 매물이 늘어 가격이 추가 하락할 수 있다는 관망 심리가 확산한 영향으로 풀이된다. 18일 부동산 빅데이터 업체 아실에 따르면 전일 기준 서

  • 26.02.1807:00
    수도권 집값 상승 지방으로 퍼질까…기대 심리 '쑥'
    수도권 집값 상승 지방으로 퍼질까…기대 심리 '쑥'

    서울을 비롯한 수도권에서 주택 가격 상승이 주춤한 가운데 지방 부동산 시장이 점차 살아나고 있다. 주택사업자들이 바라보는 지방 부동산 경기 전망도 큰 폭으로 개선된 것으로 확인됐다. 18일 주택산업연구원이 주택사업자를 대상으로 한 설문조사에 따르면 2월 비수도권 주택사업경기전망지수는 전월보다 16.0포인트 상승한 93.3으로 전망됐다. 주택사업 경기가 좋아질 것으로 보는 기준선인 100보다 여전히 낮은 수치지만 같은

  • 26.02.1713:49
    서울 정비사업 77조에 AI발 원전까지…부실 털어낸 건설사, '쌍끌이 반등' 오나
    서울 정비사업 77조에 AI발 원전까지…부실 털어낸 건설사, '쌍끌이 반등' 오나

    건설업계가 3년간의 부실 정리를 마무리하고 반등 채비에 나서고 있다. 국내에서는 서울 핵심지를 중심으로 대규모 정비사업 장이 열렸고, 해외에서는 인공지능(AI)발 전력 수요 폭증에 따른 원전 수주 소식이 잇따르는 추세다. 안정적인 내수 수익 기반에 글로벌 성장 동력이 맞물리면서 건설업 체질 개선과 가치 재평가가 가속화하고 있다는 분석이 나온다. 17일 건설업계에 따르면 박세라 신영증권 연구원은 최근 '건설, 사야 할

  • 26.02.1711:50
    법은 '금지' 세칙은 '허용'…은행 '셀프 감정' 53년째 예외
    법은 '금지' 세칙은 '허용'…은행 '셀프 감정' 53년째 예외

    금융기관의 부동산 담보 자체 감정평가를 둘러싼 감정평가업계와 은행권의 갈등 법적 대응 국면으로 번지고 있다. 국토교통부는 지난해 은행 자체평가를 위법으로 판단했고, 국정감사에서도 여러 차례 같은 지적이 나왔다. 금융위원회도 개선을 약속했다. 그러나 5개월이 지난 지금까지 은행권은 자체평가 중단 시점을 밝히지 않고 있다. 협의 교착…특정 은행 물량은 3배 급증 17일 감정평가업계에 따르면 한국감정평가사협회는 금

  • 26.02.1414:44
    좁을수록 인기?…수도권에선 중형 면적보다 소형 청약 '러시'
    좁을수록 인기?…수도권에선 중형 면적보다 소형 청약 '러시'

    분양가 상승 흐름으로 인해 수도권 아파트 청약 시장에서 소형 면적이 중형보다 더 큰 인기를 얻고 있다. 지난해엔 소형 청약자 수가 처음으로 중형을 앞서기도 했다. 14일 부동산R114에 따르면 지난해 수도권 아파트 청약자 총 48만5271명 중 전용면적 60㎡ 이하 소형아파트에 21만8047명이 몰린 것으로 파악됐다. 전용 60∼85㎡의 중형 아파트에 21만7322명, 전용 85㎡를 초과하는 대형 아파트에 4만9902명이 접수했다. 한국부동

  • 26.02.0307:05
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:04
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:03
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:02
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:01
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.1915:25
    '젊은 서양인들'이 한국에 몰려온다
    '젊은 서양인들'이 한국에 몰려온다

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 요즘 거리를 다니다 보면 외국인들이 많이 눈에 띈다. 어느 순간 그렇게 됐다. 서울이 뉴욕의 축소판이 된 것 같은 느낌이 들 때가 있다. 이 많은 외국인은 어디서 왔을까? 법무부 출입국 외국인정책본부의 통계월보에 따르면

  • 26.02.0511:23
    박원석 "전한길, 이석기보다 훨씬 더 위험"
    박원석 "전한길, 이석기보다 훨씬 더 위험"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 박원석 전 국회의원(2월4일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 소종섭의 시사쇼 시작하겠습니다. 오늘은 박원석 전 의원과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 박원석 : 네, 안녕하십니까. 소종섭 : 오늘 장

  • 26.02.0314:25
    장성철 "한동훈의 알파와 오메가는 배지"
    장성철 "한동훈의 알파와 오메가는 배지"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 장성철 공론센터 소장(2월 2일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 장성철 공론센터 소장과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 이재명 대통령 SNS 정치, 지난주 토요일부터 오늘 오전까지 9개를 올렸습니다.

  • 26.01.2907:47
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'

    김민석 국무총리와 정청래 더불어민주당 대표가 '장군멍군'을 하고 있다. 보이지 않는 힘겨루기가 한창이다. 올 8월 전당대회를 향한 움직임이다. '8월 전대'는 누가 당 대표가 되느냐를 넘어 여권의 권력 지형을 가르는 의미가 있다. 정 대표가 연임에 성공한다면 그의 정치적 힘은 지금보다 더 커진다. 여권 내 위상이 올라가는 것도 당연하다. 2028년 국회의원 선거의 공천권을 쥐기 때문이다. 김민석 국무총리가 대표가 된다면

  • 26.01.2811:24
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"

    여당인 더불어민주당 내 긴장감이 높아가는 흐름이다. '명청대전'이라는 말이 나오더니 최근에는 최고위원회에서 직접 언쟁을 주고받았다. 일부 최고위원들이 회의에 불참하는 일도 벌어졌다. 8월 전당대회를 앞둔 세력 격돌이 서서히 본격화하는 모양새다. 이언주 더불어민주당 수석최고위원은 그 한가운데 있다. 최근 이 수석최고위원과 두 차례 인터뷰했다. 지난 21일 '소종섭의 시사쇼'에 출연해 1시간 인터뷰했고, 27일엔 전화


다양한 채널에서 아시아경제를 만나보세요!

위로가기