본문 바로가기
bar_progress

글자크기 설정

닫기

'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트]

시계아이콘02분 31초 소요
숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기 글자크기

(30) '독감' 검색량으로 질병 예측 시도
혁신적이던 '구글 플루 트렌드'의 중단
"상관관계는 인과관계가 아니다" 교훈

편집자주실패를 살펴보는 것은 성공으로 가는 지름길입니다. 'AI오답노트'는 AI와 관련한 제품과 서비스, 기업, 인물의 실패 사례를 탐구합니다.

모니터를 바라보며 키보드를 두드립니다.


'독감 증상'


누군가가 이렇게 검색했다면, 그 사람은 감기에 걸렸을 확률이 높을 겁니다.


그리고 부산에서 갑자기 이런 '독감', '독감 증상', '독감 증세'와 같은 키워드의 검색량이 늘어난다면, 이 지역에 독감이 유행한다고 볼 수 있을 겁니다.


구글의 엔지니어들은 이런 단순하면서도 기발한 아이디어를 떠올렸습니다. 그리고 금방 이를 서비스로 구현했습니다. 2008년 '구글 플루 트렌드(Google Flu Trends)'의 탄생이었죠.


당시로서는 신선한 발상이었습니다. 기존 보건 당국이 병원 보고서를 수집하고 분석하는 동안, 구글은 이미 사람들의 검색 데이터를 통해 독감 유행을 예측하고 있었으니까요.


구글 플루 트렌드 : 검색어로 질병을 예측한다
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 상승하는 그래프. 픽사베이
AD

구글 플루 트렌드는 사람들이 검색창에 입력하는 독감 관련 검색어를 분석해 실시간으로 독감 유행을 예측하는 시스템이었습니다. 참신한 아이디어였죠.


예를 들어, 어떤 지역에서 '기침', '발열', '독감 증상' 같은 검색어가 갑자기 많아지면, 그 지역에서 독감이 유행하기 시작했다고 예측하는 방식이었죠. 기존의 전통적인 보건 당국의 독감 보고 시스템보다 1~2주 빠르게 독감 유행을 감지할 수 있었습니다.


매주 약 5000만개의 검색어 데이터를 수집하고, 이 중 독감과 관련된 상위 45개의 검색어를 선별하여 미국 질병통제예방센터(CDC)의 독감 데이터를 기반으로 모델을 훈련시켰습니다.


초기에는 GFT가 독감 발생을 빠르게 탐지하는 데 성공하며 주목받았습니다


구글 플루 트렌드는 첫 공개 후 즉각적인 이목을 끌었습니다. 예측은 CDC의 실제 독감 발생 보고와 매우 유사했고, 이는 빅데이터의 힘을 보여주는 사례로 입길에 올랐죠.


"엉터리다" 터져나오기 시작한 불만 
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 빅데이터를 묘사한 이미지. 픽사베이

시간이 흐르면서, 점차 불만이 터져나오기 시작했습니다. "엉터리다", "너무 과장됐다"는 등의 지적이 나오기 시작했죠. 한해는 겨울 독감 유행을 실제보다 거의 두 배나 과대 예측하는 오류를 범했습니다. 2013년 구글은 모델을 재훈련시키고 미세 조정을 거듭했으나, 예측 정확도는 크게 나아지지 않았죠. 결국 2015년 구글은 이 서비스를 중단하기에 이릅니다.


왜 이런 일이 벌어졌을까요? 먼저 '미디어 효과'을 간과했습니다. 미디어, 언론은 뉴스를 찾아헤맵니다. 뭔가 그전에 없던 일이 조금이라도 생기면, 관심을 갖고 추적하고 보도하죠. 독감도 마찬가지입니다. 지역 사회에 약간의 독감 유행이라도 감지되면, 언론은 뉴스를 만듭니다. 일부 성급한(?) 언론은 이런 식의 헤드라인을 달겠죠.


'콜록콜록' OO시 독감 대유행 전조…보건당국은 뭐하나
전염병 예산 대폭 삭감하고 인력 축소...예고된 '인재'

이와 비슷한, 독감에 관한 뉴스 보도가 갑자기 늘어납니다. 그러면 사람들은 독감 관련 뉴스를 더 많이 찾아보게 됩니다.

'나도 걸렸나?', '증상이 뭐지?', '어떻게 예방하지?'라는 물음이 자연히 떠오르고, 검색도 하죠. 그런데 여기에 문제가 있습니다. 이러한 검색량의 급증이, 실제 독감 환자의 증가를 반드시 의미하지는 않는다는 겁니다.


검색어 증가와 독감 발생 증가 사이에는 분명 상관관계가 있었습니다. 하지만 상관관계가 인과관계를 의미하는 것은 아닙니다. 사람들이 독감 증상을 더 많이 검색한다고 해서 반드시 더 많은 사람이 독감에 걸렸다는 것을 의미하지 않습니다. 검색 증가의 원인은 실제 증상 경험, 미디어 보도, 주변인의 영향 등 다양할 수 있습니다. 구글 플루 트렌드는 이런 미디어를 통한 증폭 효과를 고려하지 못했던 겁니다.


'계절'이라는 특수성도 있습니다. 면역력이 떨어지는 환절기, 겨울철에는 독감 외에도 다양한 계절성 질병이 늘어나는 경향이 있죠. 초기 증상도 대체로 유사합니다. 발열, 오한, 기침, 피로감 등이죠. 즉 사람들은 다양한 질병에 관해 유사한 키워드로 검색합니다. 독감만의 신호를 정확히 분리해내기 어려운 환경이죠.


구글 플루 트렌드의 실패에서 얻을 수 있는 교훈
'이재명' 검색량 늘면 당선 가능성 높아질까 [AI오답노트] 많은 양의 데이터는 중요합니다. 동시에 많은 데이터를 적절히 가공·정제하고 연결하는 역량도 중요합니다. 픽사베이

비록 구글 플루 트렌드 서비스는 종료됐지만, 그 발자국은 많은 가치를 남겼습니다. 빅데이터는 물론 AI 분야에도 여러 중요한 교훈을 남겼죠.


구글 플루 트렌드의 실패 이후, 2015년 하버드 대학교의 연구팀은 기존 모델의 문제점을 분석하고 이를 개선한 'ARGO(AutoRegression with GOogle search)'라는 새로운 모델을 개발했습니다. 이 모델은 사람들의 검색 방법의 동적 특성과 질병의 계절성을 고려하는 등 더 정교한 접근법을 사용했습니다. 그 결과 CDC의 실제 보고 수치와 잘 맞는 예측 성능을 보여줬죠.실패를 통해 학습하고, 더 나은 방법을 개발할 수 있다는 것을 보여주는 전형적인 사례입니다.


또한 후세대에게 '데이터 자체만큼이나 분석 방법도 중요하다'는 사실을 상기시켜줬습니다. 빅데이터의 양이 아무리 많아도 분석 방법이 부적절하면 가치 있는 결과를 뽑아낼 수 없습니다. 구글은 엄청난 양의 검색 데이터를 가지고 있었지만, 이를 해석하고 활용하는 영역에선 실수를 보였죠.


데이터 출처를 다양화하는 것도 중요합니다. 단일 데이터 출처에만 의존하면 한계가 있습니다. ARGO 모델이 더 정확한 예측을 할 수 있었던 이유 중 하나는 검색 데이터 외에도 다양한 정보를 활용했기 때문이죠. 전자건강기록(EHR) 정보까지 결합하면 예측 정확도를 더욱 높일 수 있다고 합니다.


구글 플루 트렌드의 실패는 AI와 빅데이터의 한계를 보여주는 동시에, 더 나은 방향으로 발전할 수 있는 가능성도 함께 보여줬습니다.


AD

데이터와 알고리즘 자체만으로는 충분하지 않으며, 그 데이터가 의미하는 바를 정확히 이해하고 다양한 관점에서 검증하는 과정이 필요하다는 것을 재확인했죠. AI 시스템을 개발할 때는 단순히 기술적인 측면만이 아니라, 데이터가 생성되는 사회적, 문화적 맥락까지 고려해야 한다는 점을 기억할 필요가 있습니다.




김동표 기자 letmein@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 25.05.1414:34
    4050 채용도 어려운 中企 "정년 따질 때가 아니죠"
    4050 채용도 어려운 中企 "정년 따질 때가 아니죠"

    시화공단 현장 르포 '쿵' 하는 소리를 내며 작동하는 육중한 프레스 기계. 쉴 새 없이 움직이는 이 대형 설비 앞에서 재빠른 몸놀림으로 작업 중인 신송남씨는 단 한시도 긴장을 늦출 수가 없다. 옆 사람의 말소리마저 집어삼킬 만큼 커다란 굉음을 내뿜으며 엘리베이터에 들어가는 부품을 찍어내는 이 설비 앞에서 방심은 곧 대형 사고로 이어지기 때문이다. 지난 12일 찾아간 경기도 시화공단 내 정일산업 공장에서 처음 마주한

  • 25.05.1410:34
    70세 이상 상용직 10년새 4배 증가
    70세 이상 상용직 10년새 4배 증가

    법정 정년 이후 고용문제는 단순히 60세 이상에만 그치지 않는다. 기대수명 연장으로 고령화 추세가 이어지면서 직업을 가진 70세 이상 고령 근로자도 뚜렷하게 증가하는 것으로 나타났다. 한때 생계형 임시·일용직 중심이던 고령자 일자리는 점차 상용직과 전문직으로 옮겨가고 있다. 단순한 노인 일자리 확대를 넘어 고령 인력을 안정적으로 활용하는 구조로 이행하는 흐름이 나타나고 있는 것이다. 이 때문에 정년을 연장하는

  • 25.05.1409:46
    66세 K방산 베테랑 "정년 연장에 할 수 있는 일도 늘었다"
    66세 K방산 베테랑 "정년 연장에 할 수 있는 일도 늘었다"

    지난 12일 경북 구미시 LIG넥스원 구미 하우스에서 만난 조강현 수석매니저는 흡사 군(軍) 지휘관의 눈빛을 하고 있었다. L3동 2층 TMMR 생산공장에서 근무하는 200여명의 직원 한 명 한 명을 그는 매의 눈으로 지켜봤다. 그리고 핵심만 짚은 조언이 이어졌다. 그는 "통신 장비개발에만 있다 보니 라인별 생산공정에서 잘못된 점이 한눈에 보인다"며 "완성도를 높이기 위한 방안을 매일 고민 중"이라고 했다. 군 지휘관처럼 생산 현

  • 25.05.1409:44
    60세 넘어도 월급 안 깎고 정규직…"4050 채용 어려우니 71세 큰형님도 소중"
    60세 넘어도 월급 안 깎고 정규직…"4050 채용 어려우니 71세 큰형님도 소중"

    '쿵' 하는 소리를 내며 작동하는 육중한 프레스 기계. 쉴 새 없이 움직이는 이 대형 설비 앞에서 재빠른 몸놀림으로 작업 중인 신송남씨는 단 한시도 긴장을 늦출 수가 없다. 옆 사람의 말소리마저 집어삼킬 만큼 커다란 굉음을 내뿜으며 엘리베이터에 들어가는 부품을 찍어내는 이 설비 앞에서 방심은 곧 대형 사고로 이어지기 때문이다. 지난 12일 찾아간 경기도 시화공단 내 정일산업 공장에서 처음 마주한 장면은 소음 탓에 귀

  • 25.05.1211:02
    "정부는 큰 틀만 설계‥시행은 자율에 맡겨야"
    "정부는 큰 틀만 설계‥시행은 자율에 맡겨야"

    기업들은 정년을 65세까지 연장하는 제도 자체보다 이를 누가, 어떻게 시행할지에 더 큰 관심을 보였다. 대부분의 기업은 정부가 제도의 큰 틀만 설계하고, 실제 시행 여부는 기업이 자율적으로 결정할 수 있어야 한다는 입장을 밝혔다. 획일적 적용보다는 각 조직의 여건을 고려한 유연한 도입 방식을 선호한다는 것이다. 실제 조사에서 응답 기업의 59.4%는 정년연장 제도를 정부가 설계하더라도 시행 여부는 기업 자율에 맡겨야

  • 25.05.1706:00
    트럼프 때문에 재점화 된 '캘렉시트' 논란…캐나다에 역합병되나
    트럼프 때문에 재점화 된 '캘렉시트' 논란…캐나다에 역합병되나

    미국 서부 최대 경제 중심지인 캘리포니아에서 미국으로부터의 분리 독립 운동이 본격화되고 있다. 소위 '캘렉시트(Calexit)'로 불리는 이 움직임은 도널드 트럼프 대통령의 2기 집권과 관세 전쟁에 따른 경제적 피해가 직접적인 계기가 된 것으로 분석된다. 캘리포니아 내에서는 분리독립을 위한 주민투표 절차가 이미 시작됐다. 현재 주 내에서 서명 운동이 진행 중이며, 오는 7월 말까지 54만 명의 청원 서명을 모으면 분리 독립

  • 25.05.1515:48
    이정현 "이준석 호랑이굴로 돌아와라, 한동훈은 선대위 참여해야"
    이정현 "이준석 호랑이굴로 돌아와라, 한동훈은 선대위 참여해야"

    이정현 국민의힘 공동선대위원장이 5월 14일 오후 4시, 아시아경제 유튜브 'AK라디오'에 출연했다. 이 위원장은 "윤석열 전 대통령이 당을 위해서, 선거에 도움이 된다면 스스로 결단해줘야 한다"며 "한동훈 전 대표도 당장 선대위에 들어와야 한다"고 강조했다. 1시간 동안 진행된 인터뷰 내내 이 위원장은 특유의 열정적인 목소리로 자기 생각을 밝혔다. 인터뷰 핵심 내용을 요약했다. 대선 전체 판도를 어떻게 보나.투표가 임박

  • 25.05.1415:51
    윤희웅 "이재명, TK에서 역대 최고 득표 가능성"[AK라디오]
    윤희웅 "이재명, TK에서 역대 최고 득표 가능성"[AK라디오]

    대통령 선거 투표일이 20일 남았다. 이재명 더불어민주당·김문수 국민의힘·이준석 개혁신당 등 주요 후보들은 대구·경북과 부산·경남을 훑는 것으로 선거 운동을 본격화했다. 대선전 초반 여론 흐름을 어떻게 봐야 할까. 여론조사 전문가인 윤희웅 오피니언즈 대표에게 물었다. 윤 대표와의 인터뷰는 5월 14일 오전 9시, 서울 중구 초동에 있는 아시아경제 유튜브 채널 'AK라디오' 스튜디오에서 진행됐다. 이재명 후보 지지율

  • 25.05.1107:00
    145% 美 관세에 中 '원산지 세탁업' 호황…동남아산으로 둔갑
    145% 美 관세에 中 '원산지 세탁업' 호황…동남아산으로 둔갑

    중국에서 최근 원산지를 세탁해 주는 불법 중개업체들이 역대급 호황을 맞이하고 있는 것으로 나타났다. 미국 정부가 중국 제품에 부과한 관세가 총합 145%로 치솟으면서 중국 수출업체들이 이를 회피할 방법을 찾고 있기 때문이다. 외신들에 따르면 중국 SNS에서는 현재 제3국 경유 원산지 세탁 방식을 홍보하는 물류 중개업체들의 게시글과 영상이 급증하고 있다. 이들 광고는 말레이시아나 베트남 등 동남아시아 국가로 원산지를

  • 25.05.1008:30
    트럼프 '캐나다 합병' 농담인줄 알았는데…'이 여성' 폭탄선언에 긴장감 고조
    트럼프 '캐나다 합병' 농담인줄 알았는데…'이 여성' 폭탄선언에 긴장감 고조

    캐나다 서부 앨버타주가 캐나다 연방에서의 분리독립 가능성을 공식 언급하면서 북미 지역의 지정학적 긴장이 고조되고 있다. 도널드 트럼프 미국 대통령이 취임 이후 지속적으로 캐나다 합병 발언을 이어가는 상황에서, 앨버타주의 이번 발표는 단순한 위협이 아닌 실현 가능한 시나리오로 부상하고 있다. 데니얼 스미스 앨버타 주총리는 지난 6일(현지시간) 캐나다 연방정부를 향해 강경한 메시지를 전달했다. 그는 "중앙정부가


다양한 채널에서 아시아경제를 만나보세요!

위로가기