본문 바로가기
bar_progress

글자크기 설정

닫기

'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트]

시계아이콘02분 31초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

(30) '독감' 검색량으로 질병 예측 시도
혁신적이던 '구글 플루 트렌드'의 중단
"상관관계는 인과관계가 아니다" 교훈

편집자주실패를 살펴보는 것은 성공으로 가는 지름길입니다. 'AI오답노트'는 AI와 관련한 제품과 서비스, 기업, 인물의 실패 사례를 탐구합니다.

모니터를 바라보며 키보드를 두드립니다.


'독감 증상'


누군가가 이렇게 검색했다면, 그 사람은 감기에 걸렸을 확률이 높을 겁니다.


그리고 부산에서 갑자기 이런 '독감', '독감 증상', '독감 증세'와 같은 키워드의 검색량이 늘어난다면, 이 지역에 독감이 유행한다고 볼 수 있을 겁니다.


구글의 엔지니어들은 이런 단순하면서도 기발한 아이디어를 떠올렸습니다. 그리고 금방 이를 서비스로 구현했습니다. 2008년 '구글 플루 트렌드(Google Flu Trends)'의 탄생이었죠.


당시로서는 신선한 발상이었습니다. 기존 보건 당국이 병원 보고서를 수집하고 분석하는 동안, 구글은 이미 사람들의 검색 데이터를 통해 독감 유행을 예측하고 있었으니까요.


구글 플루 트렌드 : 검색어로 질병을 예측한다
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 상승하는 그래프. 픽사베이
AD

구글 플루 트렌드는 사람들이 검색창에 입력하는 독감 관련 검색어를 분석해 실시간으로 독감 유행을 예측하는 시스템이었습니다. 참신한 아이디어였죠.


예를 들어, 어떤 지역에서 '기침', '발열', '독감 증상' 같은 검색어가 갑자기 많아지면, 그 지역에서 독감이 유행하기 시작했다고 예측하는 방식이었죠. 기존의 전통적인 보건 당국의 독감 보고 시스템보다 1~2주 빠르게 독감 유행을 감지할 수 있었습니다.


매주 약 5000만개의 검색어 데이터를 수집하고, 이 중 독감과 관련된 상위 45개의 검색어를 선별하여 미국 질병통제예방센터(CDC)의 독감 데이터를 기반으로 모델을 훈련시켰습니다.


초기에는 GFT가 독감 발생을 빠르게 탐지하는 데 성공하며 주목받았습니다


구글 플루 트렌드는 첫 공개 후 즉각적인 이목을 끌었습니다. 예측은 CDC의 실제 독감 발생 보고와 매우 유사했고, 이는 빅데이터의 힘을 보여주는 사례로 입길에 올랐죠.


"엉터리다" 터져나오기 시작한 불만 
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 빅데이터를 묘사한 이미지. 픽사베이

시간이 흐르면서, 점차 불만이 터져나오기 시작했습니다. "엉터리다", "너무 과장됐다"는 등의 지적이 나오기 시작했죠. 한해는 겨울 독감 유행을 실제보다 거의 두 배나 과대 예측하는 오류를 범했습니다. 2013년 구글은 모델을 재훈련시키고 미세 조정을 거듭했으나, 예측 정확도는 크게 나아지지 않았죠. 결국 2015년 구글은 이 서비스를 중단하기에 이릅니다.


왜 이런 일이 벌어졌을까요? 먼저 '미디어 효과'을 간과했습니다. 미디어, 언론은 뉴스를 찾아헤맵니다. 뭔가 그전에 없던 일이 조금이라도 생기면, 관심을 갖고 추적하고 보도하죠. 독감도 마찬가지입니다. 지역 사회에 약간의 독감 유행이라도 감지되면, 언론은 뉴스를 만듭니다. 일부 성급한(?) 언론은 이런 식의 헤드라인을 달겠죠.


'콜록콜록' OO시 독감 대유행 전조…보건당국은 뭐하나
전염병 예산 대폭 삭감하고 인력 축소...예고된 '인재'

이와 비슷한, 독감에 관한 뉴스 보도가 갑자기 늘어납니다. 그러면 사람들은 독감 관련 뉴스를 더 많이 찾아보게 됩니다.

'나도 걸렸나?', '증상이 뭐지?', '어떻게 예방하지?'라는 물음이 자연히 떠오르고, 검색도 하죠. 그런데 여기에 문제가 있습니다. 이러한 검색량의 급증이, 실제 독감 환자의 증가를 반드시 의미하지는 않는다는 겁니다.


검색어 증가와 독감 발생 증가 사이에는 분명 상관관계가 있었습니다. 하지만 상관관계가 인과관계를 의미하는 것은 아닙니다. 사람들이 독감 증상을 더 많이 검색한다고 해서 반드시 더 많은 사람이 독감에 걸렸다는 것을 의미하지 않습니다. 검색 증가의 원인은 실제 증상 경험, 미디어 보도, 주변인의 영향 등 다양할 수 있습니다. 구글 플루 트렌드는 이런 미디어를 통한 증폭 효과를 고려하지 못했던 겁니다.


'계절'이라는 특수성도 있습니다. 면역력이 떨어지는 환절기, 겨울철에는 독감 외에도 다양한 계절성 질병이 늘어나는 경향이 있죠. 초기 증상도 대체로 유사합니다. 발열, 오한, 기침, 피로감 등이죠. 즉 사람들은 다양한 질병에 관해 유사한 키워드로 검색합니다. 독감만의 신호를 정확히 분리해내기 어려운 환경이죠.


구글 플루 트렌드의 실패에서 얻을 수 있는 교훈
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 많은 양의 데이터는 중요합니다. 동시에 많은 데이터를 적절히 가공·정제하고 연결하는 역량도 중요합니다. 픽사베이

비록 구글 플루 트렌드 서비스는 종료됐지만, 그 발자국은 많은 가치를 남겼습니다. 빅데이터는 물론 AI 분야에도 여러 중요한 교훈을 남겼죠.


구글 플루 트렌드의 실패 이후, 2015년 하버드 대학교의 연구팀은 기존 모델의 문제점을 분석하고 이를 개선한 'ARGO(AutoRegression with GOogle search)'라는 새로운 모델을 개발했습니다. 이 모델은 사람들의 검색 방법의 동적 특성과 질병의 계절성을 고려하는 등 더 정교한 접근법을 사용했습니다. 그 결과 CDC의 실제 보고 수치와 잘 맞는 예측 성능을 보여줬죠.실패를 통해 학습하고, 더 나은 방법을 개발할 수 있다는 것을 보여주는 전형적인 사례입니다.


또한 후세대에게 '데이터 자체만큼이나 분석 방법도 중요하다'는 사실을 상기시켜줬습니다. 빅데이터의 양이 아무리 많아도 분석 방법이 부적절하면 가치 있는 결과를 뽑아낼 수 없습니다. 구글은 엄청난 양의 검색 데이터를 가지고 있었지만, 이를 해석하고 활용하는 영역에선 실수를 보였죠.


데이터 출처를 다양화하는 것도 중요합니다. 단일 데이터 출처에만 의존하면 한계가 있습니다. ARGO 모델이 더 정확한 예측을 할 수 있었던 이유 중 하나는 검색 데이터 외에도 다양한 정보를 활용했기 때문이죠. 전자건강기록(EHR) 정보까지 결합하면 예측 정확도를 더욱 높일 수 있다고 합니다.


구글 플루 트렌드의 실패는 AI와 빅데이터의 한계를 보여주는 동시에, 더 나은 방향으로 발전할 수 있는 가능성도 함께 보여줬습니다.


AD

데이터와 알고리즘 자체만으로는 충분하지 않으며, 그 데이터가 의미하는 바를 정확히 이해하고 다양한 관점에서 검증하는 과정이 필요하다는 것을 재확인했죠. AI 시스템을 개발할 때는 단순히 기술적인 측면만이 아니라, 데이터가 생성되는 사회적, 문화적 맥락까지 고려해야 한다는 점을 기억할 필요가 있습니다.




김동표 기자 letmein@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 26.02.2508:00
    음악 넘어 문학·음식으로 영토 넓혔다…150만 빅데이터가 증명한 한류의 진화
    음악 넘어 문학·음식으로 영토 넓혔다…150만 빅데이터가 증명한 한류의 진화

    K팝에 의존했던 한류 소비 지형이 문학과 영화, 음식으로 다변화했다. 지식재산권(IP)이 한국의 브랜드 가치를 높이고, 실질적인 관광 수요와 수출 수익까지 견인하는 핵심 산업 동력으로 진화했다. 문화체육관광부와 한국문화정보원은 25일 이 같은 현상을 입증하는 '2025 외신·소셜데이터로 보는 글로벌 한류 트렌드 분석 보고서'를 발표했다. 서른 나라 매체와 누리소통망(SNS) 자료 150만 건을 샅샅이 분석해 한류의 확산 구조

  • 26.02.2508:00
    화면 뚫고 나온 IP…넷플릭스 1위 애니가 실물 경제를 집어삼켰다
    화면 뚫고 나온 IP…넷플릭스 1위 애니가 실물 경제를 집어삼켰다

    영상 콘텐츠의 흥행이 온라인 화면을 뚫고 나와 실물 경제를 견인한다. 넷플릭스 애니메이션 영화 '케이팝 데몬 헌터스(케데헌)'가 입증한 지식재산권(IP)의 힘이다. 단순한 영상 소비를 넘어 관광, 식음료, 정보통신기술(IT) 등 산업 전반을 집어삼키며 글로벌 라이프스타일 판도를 바꾼다. 이 작품은 시청 수 3억2510만 회를 기록하며 역대 넷플릭스 영화 시청 1위라는 대기록을 썼다. 15주 연속 시청 순위 10위권에 진입하며 영

  • 26.02.2508:00
    '레몬' 대신 '감귤'…치밀한 현지화가 K드라마 장르 한계 깼다
    '레몬' 대신 '감귤'…치밀한 현지화가 K드라마 장르 한계 깼다

    피 튀기는 장르물에 집중했던 한국 드라마의 성공 공식이 진화했다. 넷플릭스 드라마 '폭싹 속았수다'가 다각적 현지화 전략의 실효성을 입증했다. 제주도를 배경으로 한 이 로맨스물은 자극적인 소재 없이 세계적인 흥행을 달성했다. 비한류권인 멕시코에서조차 9주 연속 넷플릭스 시청 수 10위권에 진입하며 지식재산권(IP)의 장르적 스펙트럼과 소비 영토를 동시에 넓혔다. 압도적 성과의 이면에는 각국의 문화적 맥락을 파고든

  • 26.02.2508:00
    장벽 깬 거대 IP의 명암…'오징어 게임' 평점 6.7점 추락이 남긴 경고
    장벽 깬 거대 IP의 명암…'오징어 게임' 평점 6.7점 추락이 남긴 경고

    한국 영상 콘텐츠가 글로벌 엔터테인먼트 산업의 주류로 안착했다. 넷플릭스 드라마 '오징어 게임' 시리즈가 지식재산권(IP)의 폭발력을 명확히 증명했다. 이 작품은 넷플릭스 역대 비영어권 TV 부문에서 시즌 1, 2, 3이 나란히 시청 수 1, 2, 3위를 싹쓸이하는 전무후무한 대기록을 썼다. 흥행은 화면을 넘어 실물 경제와 문화 산업 전반으로 파급력을 넓혔다. 글로벌 식음료 및 패션 브랜드와의 연이은 협업이 이를 증명한다. KF

  • 26.02.2508:00
    5·18 비극이 홀로코스트 위로했다…세계 상처 어루만진 K문학
    5·18 비극이 홀로코스트 위로했다…세계 상처 어루만진 K문학

    한국 문학이 변방의 언어라는 태생적 굴레를 벗고 세계 문학의 중심부로 진입했다. 한강 작가의 노벨문학상 수상이 결정적 전환점으로 작용했다. 일회성 호기심에 그치지 않고 전 세계의 지적 독서로 번졌다. 한국문화정보원의 빅데이터 분석은 이를 객관적 수치로 입증한다. 노벨문학상 수상 직후 한국 문학 관련 외신 보도 비중은 전 분기 1.2%에서 32.4%로 30%포인트 이상 뛰었다. 유력 매체들은 '채식주의자'와 '소년이 온다'

  • 26.02.2715:30
    '이재명 신세력' '뉴이재명'은 누구인가
    '이재명 신세력' '뉴이재명'은 누구인가

    ■방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 최근 이재명 대통령의 대표적인 팬클럽이라고 할 수 있는 '재명이네 마을'이 정청래 민주당 대표와 이성윤 최고위원, 두 사람을 강제로 퇴출했다. 현재의 흐름을 보여주는 상징적인 사건이라고 볼 수 있다. 사건의 기폭제가 된

  • 26.02.2615:31
    성치훈 "송영길, 계양을 김남준에 양보해야"
    성치훈 "송영길, 계양을 김남준에 양보해야"

    ■방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 강전애 전 국민의힘 대변인, 성치훈 더불어민주당 부대변인(2월 25일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 소종섭의 시사쇼 시작하겠습니다. 강전애 전 국민의힘 대변인, 성치훈 더불어민주당 부대변인과 함께 오늘 생생토

  • 26.02.2514:37
    박원석 "김어준 선 넘어, 이언주 자중해야",이태규 "공취모, 비민주·반민주적"
    박원석 "김어준 선 넘어, 이언주 자중해야",이태규 "공취모, 비민주·반민주적"

    ■방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 박원석 전 의원, 이태규 전 의원(2월 23일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분, 안녕하십니까. 소종섭의 시사쇼 시작하겠습니다. 오늘은 이태규 전 국민의힘 의원 그리고 박원석 전 정의당 의원 두 분 모시고 핫이슈 생생토크 하겠습니

  • 26.02.2310:59
    정성장 "김여정 VS 김주애 권력투쟁 가능성 희박"
    정성장 "김여정 VS 김주애 권력투쟁 가능성 희박"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD ■ 출연 : 정성장 세종연구소 부소장(2월 20일) ※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까? 소종섭의 시사쇼 시작하겠습니다. 북한의 9차 당대회가 19일 개막했습니다. 최근 김정은 위원장의 딸 김주애의 세습과 관련해서 9차 당대회에서

  • 26.02.2015:42
    김윤형 "송영길 100% 전대 출마", 하헌기 "전략공천 해야"
    김윤형 "송영길 100% 전대 출마", 하헌기 "전략공천 해야"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 여러분 안녕하십니까. 소종섭의 시사쇼 시작하겠습니다. 오늘은 하헌기 더불어민주당 전 부대변인과 김윤형 전 국민의힘 부대변인 모시고 핫이슈 관련해서 얘기 나누도록 하겠습니다. 소종섭 :민주당 얘기 좀 해볼까요? 송영길


다양한 채널에서 아시아경제를 만나보세요!

위로가기