본문 바로가기
bar_progress

글자크기 설정

닫기

'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트]

시계아이콘02분 31초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

(30) '독감' 검색량으로 질병 예측 시도
혁신적이던 '구글 플루 트렌드'의 중단
"상관관계는 인과관계가 아니다" 교훈

편집자주실패를 살펴보는 것은 성공으로 가는 지름길입니다. 'AI오답노트'는 AI와 관련한 제품과 서비스, 기업, 인물의 실패 사례를 탐구합니다.

모니터를 바라보며 키보드를 두드립니다.


'독감 증상'


누군가가 이렇게 검색했다면, 그 사람은 감기에 걸렸을 확률이 높을 겁니다.


그리고 부산에서 갑자기 이런 '독감', '독감 증상', '독감 증세'와 같은 키워드의 검색량이 늘어난다면, 이 지역에 독감이 유행한다고 볼 수 있을 겁니다.


구글의 엔지니어들은 이런 단순하면서도 기발한 아이디어를 떠올렸습니다. 그리고 금방 이를 서비스로 구현했습니다. 2008년 '구글 플루 트렌드(Google Flu Trends)'의 탄생이었죠.


당시로서는 신선한 발상이었습니다. 기존 보건 당국이 병원 보고서를 수집하고 분석하는 동안, 구글은 이미 사람들의 검색 데이터를 통해 독감 유행을 예측하고 있었으니까요.


구글 플루 트렌드 : 검색어로 질병을 예측한다
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 상승하는 그래프. 픽사베이
AD

구글 플루 트렌드는 사람들이 검색창에 입력하는 독감 관련 검색어를 분석해 실시간으로 독감 유행을 예측하는 시스템이었습니다. 참신한 아이디어였죠.


예를 들어, 어떤 지역에서 '기침', '발열', '독감 증상' 같은 검색어가 갑자기 많아지면, 그 지역에서 독감이 유행하기 시작했다고 예측하는 방식이었죠. 기존의 전통적인 보건 당국의 독감 보고 시스템보다 1~2주 빠르게 독감 유행을 감지할 수 있었습니다.


매주 약 5000만개의 검색어 데이터를 수집하고, 이 중 독감과 관련된 상위 45개의 검색어를 선별하여 미국 질병통제예방센터(CDC)의 독감 데이터를 기반으로 모델을 훈련시켰습니다.


초기에는 GFT가 독감 발생을 빠르게 탐지하는 데 성공하며 주목받았습니다


구글 플루 트렌드는 첫 공개 후 즉각적인 이목을 끌었습니다. 예측은 CDC의 실제 독감 발생 보고와 매우 유사했고, 이는 빅데이터의 힘을 보여주는 사례로 입길에 올랐죠.


"엉터리다" 터져나오기 시작한 불만 
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 빅데이터를 묘사한 이미지. 픽사베이

시간이 흐르면서, 점차 불만이 터져나오기 시작했습니다. "엉터리다", "너무 과장됐다"는 등의 지적이 나오기 시작했죠. 한해는 겨울 독감 유행을 실제보다 거의 두 배나 과대 예측하는 오류를 범했습니다. 2013년 구글은 모델을 재훈련시키고 미세 조정을 거듭했으나, 예측 정확도는 크게 나아지지 않았죠. 결국 2015년 구글은 이 서비스를 중단하기에 이릅니다.


왜 이런 일이 벌어졌을까요? 먼저 '미디어 효과'을 간과했습니다. 미디어, 언론은 뉴스를 찾아헤맵니다. 뭔가 그전에 없던 일이 조금이라도 생기면, 관심을 갖고 추적하고 보도하죠. 독감도 마찬가지입니다. 지역 사회에 약간의 독감 유행이라도 감지되면, 언론은 뉴스를 만듭니다. 일부 성급한(?) 언론은 이런 식의 헤드라인을 달겠죠.


'콜록콜록' OO시 독감 대유행 전조…보건당국은 뭐하나
전염병 예산 대폭 삭감하고 인력 축소...예고된 '인재'

이와 비슷한, 독감에 관한 뉴스 보도가 갑자기 늘어납니다. 그러면 사람들은 독감 관련 뉴스를 더 많이 찾아보게 됩니다.

'나도 걸렸나?', '증상이 뭐지?', '어떻게 예방하지?'라는 물음이 자연히 떠오르고, 검색도 하죠. 그런데 여기에 문제가 있습니다. 이러한 검색량의 급증이, 실제 독감 환자의 증가를 반드시 의미하지는 않는다는 겁니다.


검색어 증가와 독감 발생 증가 사이에는 분명 상관관계가 있었습니다. 하지만 상관관계가 인과관계를 의미하는 것은 아닙니다. 사람들이 독감 증상을 더 많이 검색한다고 해서 반드시 더 많은 사람이 독감에 걸렸다는 것을 의미하지 않습니다. 검색 증가의 원인은 실제 증상 경험, 미디어 보도, 주변인의 영향 등 다양할 수 있습니다. 구글 플루 트렌드는 이런 미디어를 통한 증폭 효과를 고려하지 못했던 겁니다.


'계절'이라는 특수성도 있습니다. 면역력이 떨어지는 환절기, 겨울철에는 독감 외에도 다양한 계절성 질병이 늘어나는 경향이 있죠. 초기 증상도 대체로 유사합니다. 발열, 오한, 기침, 피로감 등이죠. 즉 사람들은 다양한 질병에 관해 유사한 키워드로 검색합니다. 독감만의 신호를 정확히 분리해내기 어려운 환경이죠.


구글 플루 트렌드의 실패에서 얻을 수 있는 교훈
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 많은 양의 데이터는 중요합니다. 동시에 많은 데이터를 적절히 가공·정제하고 연결하는 역량도 중요합니다. 픽사베이

비록 구글 플루 트렌드 서비스는 종료됐지만, 그 발자국은 많은 가치를 남겼습니다. 빅데이터는 물론 AI 분야에도 여러 중요한 교훈을 남겼죠.


구글 플루 트렌드의 실패 이후, 2015년 하버드 대학교의 연구팀은 기존 모델의 문제점을 분석하고 이를 개선한 'ARGO(AutoRegression with GOogle search)'라는 새로운 모델을 개발했습니다. 이 모델은 사람들의 검색 방법의 동적 특성과 질병의 계절성을 고려하는 등 더 정교한 접근법을 사용했습니다. 그 결과 CDC의 실제 보고 수치와 잘 맞는 예측 성능을 보여줬죠.실패를 통해 학습하고, 더 나은 방법을 개발할 수 있다는 것을 보여주는 전형적인 사례입니다.


또한 후세대에게 '데이터 자체만큼이나 분석 방법도 중요하다'는 사실을 상기시켜줬습니다. 빅데이터의 양이 아무리 많아도 분석 방법이 부적절하면 가치 있는 결과를 뽑아낼 수 없습니다. 구글은 엄청난 양의 검색 데이터를 가지고 있었지만, 이를 해석하고 활용하는 영역에선 실수를 보였죠.


데이터 출처를 다양화하는 것도 중요합니다. 단일 데이터 출처에만 의존하면 한계가 있습니다. ARGO 모델이 더 정확한 예측을 할 수 있었던 이유 중 하나는 검색 데이터 외에도 다양한 정보를 활용했기 때문이죠. 전자건강기록(EHR) 정보까지 결합하면 예측 정확도를 더욱 높일 수 있다고 합니다.


구글 플루 트렌드의 실패는 AI와 빅데이터의 한계를 보여주는 동시에, 더 나은 방향으로 발전할 수 있는 가능성도 함께 보여줬습니다.


AD

데이터와 알고리즘 자체만으로는 충분하지 않으며, 그 데이터가 의미하는 바를 정확히 이해하고 다양한 관점에서 검증하는 과정이 필요하다는 것을 재확인했죠. AI 시스템을 개발할 때는 단순히 기술적인 측면만이 아니라, 데이터가 생성되는 사회적, 문화적 맥락까지 고려해야 한다는 점을 기억할 필요가 있습니다.




김동표 기자 letmein@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 25.12.1510:17
    "눈에 띄게 달라졌다" 36억 투입해 '자동화·자원화' 확 달라진 도축장⑤
    "눈에 띄게 달라졌다" 36억 투입해 '자동화·자원화' 확 달라진 도축장⑤

    정부가 추진해 온 자유무역협정(FTA) 국내보완대책이 도축·가공 현장의 체질 개선으로 이어지고 있다. 부산·경남권의 핵심 거점인 부경양돈협동조합 통합부경축산물공판장과 대전·충남권의 대전충남양돈농협 산하 포크빌축산물공판장은 시설 현대화를 통해 생산성과 위생, 환경 성과를 동시에 끌어올리며 국내 축산물 경쟁력 강화의 실증 사례로 평가받고 있다. 수입 축산물과의 경쟁이 불가피한 상황에서, 공판장의 역할이 단순

  • 25.12.1209:58
    '똥값의 역전'…70억 투입하자 악취 나던 분뇨가 돈이 됐다 ④
    '똥값의 역전'…70억 투입하자 악취 나던 분뇨가 돈이 됐다 ④

    정부가 추진해 온 자유무역협정(FTA) 국내보완대책이 제주 축산 현장에서 실질적인 성과를 내고 있다. 제주 한라산바이오는 그 대표적인 사례로, 가축분뇨를 재생에너지와 비료로 전환하며 지역 축산업의 환경 기반을 바꾼 시설로 꼽힌다. 제주에서는 약 55만~60만마리의 돼지가 사육되며 하루 2500t 가까운 분뇨가 발생하는데, 한라산바이오는 이를 안정적으로 처리하고 자원화하는 데 핵심 역할을 하고 있다. 현장에서는 "분뇨가

  • 25.12.1108:51
    멀쩡한 사과 보더니 "이건 썩은 거예요" 장담…진짜 잘라보니 '휘둥그레' 비결은?③
    멀쩡한 사과 보더니 "이건 썩은 거예요" 장담…진짜 잘라보니 '휘둥그레' 비결은?③

    "자유무역협정(FTA) 국내 보완대책을 통해 설립된 '충주 거점 산지유통센터(APC)'는 단양과 제천, 음성, 괴산 등 충북 북부권에 위치한 농가 650곳에서 생산한 사과를 세척·선별·포장·출하하는 과실 전문 APC입니다. 생산단계부터 관리하고 사과 브랜드화를 통해 경쟁력을 확보하고 있습니다. 또 저온저장고와 선별기 등을 통해 비용을 줄여 농가엔 더 큰 수익을, 소비자들에겐 품질 좋은 사과를 안정적으로 공급하고 있습니다.

  • 25.12.1010:18
    고품질 韓 조사료 키워 사료비·수입의존도↓ ②
    고품질 韓 조사료 키워 사료비·수입의존도↓ ②

    59개 국가와의 (자유무역협정FTA) 체결 이후 축산농가의 부담을 줄이고 경쟁력을 강화하기 위한 정부의 국내보완대책 가운데 하나가 '조사료생산기반확충 사업'이다. 조사료는 볏짚이나 목초 등 거친 섬유질 위주의 사료로, 이 사업을 통해 국산 조사료의 생산·유통·가공 기반을 갖춘 지역 단위 가공·유통센터가 확충되면서 국산 조사료 품질과 시장 신뢰도가 눈에 띄게 개선됐다는 평가가 나온다. 전북 김제에 위치한 전주김제

  • 25.12.0909:11
    "1인당 3500만원까지 받는다"…'직접 지원'한다는 FTA국내보완책①
    "1인당 3500만원까지 받는다"…'직접 지원'한다는 FTA국내보완책①

    올해 3분기 기준 한국은 22개의 자유무역협정(FTA) 발효를 통해 59개 국가와 FTA를 활용한 무역에 나서고 있다. 한국의 첫 FTA인 한-칠레 FTA가 발효된 2004년 4월 이후 약 21년 5개월 만의 성과다. 정부는 현재 전 세계 국내총생산(GDP) 85% 수준인 FTA 네트워크를 글로벌 1위인 90%까지 더 넓고 촘촘하게 확충할 방침이다. FTA 네트워크 확대에 따라 한국의 수출 시장이 넓어진 만큼 수출액도 2004년 2538억달러에서 2024년 6836

  • 25.12.0607:30
    한국인 참전자 사망 확인된 '국제의용군'…어떤 조직일까
    한국인 참전자 사망 확인된 '국제의용군'…어떤 조직일까

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'■ 진행 : 소종섭 정치스페셜리스트■ 연출 : 이미리 PD■ 출연 : 이현우 기자 우크라이나 전쟁에 참전했다가 사망한 한국인의 장례식이 최근 우크라이나 키이우에서 열린 가운데, 우리 정부도 해당 사실을 공식 확인했다. 우크라이나와 러시아 매체 등에서 우크라이나 측 국제의용군에 참여한 한국인이 존재하고 사망자도 발생했다는 보도가 그간 이어져 왔지만, 정부가 이를 공식적으로 확

  • 25.12.0513:09
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 김용태 국민의힘 의원(12월 4일) "계엄 1년, 거대 두 정당 적대적 공생하고 있어""장동혁 변화 임계점은 1월 중순. 출마자들 가만있지 않을 것""당원 게시판 논란 조사, 장동혁 대표가 철회해야""100% 국민경선으로 지방선거 후보 뽑자" 소종섭 : 김 의원님, 바쁘신데 나와주셔서 고맙습니다. 김용태 :

  • 25.12.0415:35
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 강전애 전 국민의힘 대변인, 김준일 시사평론가(12월 3일) 소종섭 : 국민의힘에서 계엄 1년 맞이해서 메시지들이 나왔는데 국민이 보기에는 좀 헷갈릴 것 같아요. 장동혁 대표는 계엄은 의회 폭거에 맞서기 위한 것이었다고 계엄을 옹호하는 듯한 메시지를 냈습니다. 반면 송원석 원내대표는 진심으로

  • 25.12.0309:48
    조응천 "국힘 이해 안 가, 민주당 분화 중"
    조응천 "국힘 이해 안 가, 민주당 분화 중"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이미리 PD■ 출연 : 조응천 전 국회의원(12월 1일) 소종섭 : 오늘은 조응천 전 국회의원 모시고 여러 가지 이슈에 대해서 솔직 토크 진행하겠습니다. 조 의원님, 바쁘신데 나와주셔서 고맙습니다. 요즘 어떻게 지내시나요? 조응천 : 지금 기득권 양당들이 매일매일 벌이는 저 기행들을 보면 무척 힘들어요. 지켜보는 것

  • 25.11.2709:34
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 윤희석 전 국민의힘 대변인(11월 24일) 아시아경제 '소종섭의 시사쇼'에 출연한 윤희석 전 국민의힘 대변인은 "장동혁 대표의 메시지는 호소력에 한계가 분명해 변화가 필요하다"고 진단했다. 또한 "이대로라면 연말 연초에 내부에서 장 대표에 대한 문제제기가 불거질 것"이라고 내다봤다. 한동훈 전


다양한 채널에서 아시아경제를 만나보세요!

위로가기