본문 바로가기
bar_progress

글자크기 설정

닫기

엄마도 몰라본 내얼굴, 아이폰은 알아보고 '잠금 해제' [AI오답노트]

시계아이콘03분 27초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

⑩ AI의 ‘피드백 데이터 리스크’
반복되는 입출력으로 재학습 및 교정
악의적 이용 반복될 땐 위험한 AI로

편집자주실패를 살펴보는 것은 성공으로 가는 지름길입니다. 'AI오답노트'는 AI와 관련한 제품과 서비스, 기업, 인물의 실패 사례를 탐구합니다.

애플의 아이폰 이용자에겐 얼굴이 열쇠입니다. 스마트폰 전면 상단에 달린 카메라에 얼굴 인식 보안 기술인 ‘페이스ID’가 탑재돼 있어, 폰 잠금 해제부터 결제, 신원인증 등 모든 절차가 간편하죠.


물론 최초 이용을 위해선 사용자의 얼굴을 등록하는 절차를 거쳐야 합니다. 적외선 카메라의 요구에 맞춰 얼굴을 이리저리 돌리며 얼굴을 촬영하게 됩니다. 잠깐의 불편함만 감수하면 앞으론 무척 편해집니다. 카메라는 얼굴 표면의 패턴과 눈과 눈 사이 등 각종 거리를 측정합니다.


3차원 안면 분석과 자체적인 뉴럴 엔진 분석까지 거치기 때문에, 인식률이 매우 높죠. 적외선이기 때문에 밝은 빛이 필요하지도 않아 어두운 곳에서도 잘 작동합니다. “아이폰의 킬러콘텐츠는 페이스ID다”라는 말이 그리 큰 과장은 아닐 겁니다.


페이스ID의 위력은 ‘피드백 데이터’에서 나온다
엄마도 몰라본 내얼굴, 아이폰은 알아보고 '잠금 해제' [AI오답노트] 얼굴 인식 시스템을 묘사하는 그림. 게티이미지뱅크
AD

그런데 잠깐 생각해보면, 사용자의 얼굴은 매일 매 순간 같지 않죠.


안경을 쓸 수도 있고, 아니면 안경테를 바꿀 수도 있죠. 수염을 기르거나, 헤어스타일을 바꾸는 경우도 있고요. 마스크를 쓰기도 하고, 때론 화장법을 달리할 수도 있습니다. 그럴 때마다 얼굴을 새로 등록해야 할까요? 아닙니다. 그래도 잘 작동합니다. ‘페이스ID가 킬러콘텐츠’라는 말이 괜히 있는 게 아니죠.


페이스ID는 이용자의 안면에 약간씩 변화가 생길 때마다, 달라진 패턴을 파악합니다. 특히 간혹 나오는 ‘인식 실패’는 가장 소중한 데이터입니다. 비밀번호를 거쳐 재확인된 이용자의 얼굴이, 그 전의 얼굴과 동일하다는 피드백을 얻기 때문이죠.


그러면 내장된 알고리즘은 새로운 외모와 이전에 등록된 얼굴을 연관 지어 재학습합니다. 수십번, 수백번의 인식 성공과 실패가 피드백 데이터가 되는 겁니다. 이 피드백 데이터가 쌓이면 쌓일수록, 페이스ID의 인증 성공 확률은 더욱 높아지죠.


테슬라 자율주행 사고율이 감소하는 이유
엄마도 몰라본 내얼굴, 아이폰은 알아보고 '잠금 해제' [AI오답노트]

AI 모델이 수많은 트레이닝 데이터 학습을 마쳤다고 해서 AI 모델 개발이 끝난 게 아닙니다. 출시 이후에도 피드백 데이터로 꾸준히 학습해야 합니다. 트레이닝 데이터(이용자의 첫 얼굴)로 학습을 시키고, 입력 데이터(지금 얼굴)를 넣으면 출력(인증 성공 또는 실패)이 나오죠. 출력값을 매번 흡수해서 정확도를 향상시킵니다.


상황과 환경은 끊임없이 변화합니다. 그렇기 때문에 AI 모델의 정확성을 유지하려면, 피드백 데이터를 지속적으로 공급하면서 모델을 업데이트해야 합니다. 우리가 일상에서 매일 만나는 내비게이션이나, 쇼핑 앱의 상품 추천도 마찬가지입니다.


도로가 새로 개통되거나, 아니면 도로가 막히거나 하는 등 새로운 데이터가 발생하면 그걸 즉시 흡수해야 하죠. 그러지 않고 옛날 데이터로만 최적화된 경로를 안내한다면 이용자들은 더이상 그 내비게이션 앱을 이용하지 않을 겁니다.


테슬라의 자율주행 기능도 차량에 달린 8개의 카메라가 받아들이는 데이터로 피드백을 받습니다. 기존에 설계한 알고리즘에 더해서 새로운 정보를 받아들이고, 더 나은 결정을 하게 되죠. 테슬라 차량의 사고율은 해마다 줄어들고 있습니다. 최초 학습된 데이터로만 주행한다면 불가능할 일이죠.


내게 꼭 필요한 상품을 잘 추천해주는 쇼핑 앱도 마찬가지입니다. 최초 가입 때 입력했던 나이, 성별, 지역, 구매 이력만으로는 부족합니다. 달라진 쇼핑 패턴, 주기, 시간대 등의 데이터가 필요하죠. 그래야 소비자에게 딱 맞는 추천을 할 수 있게 됩니다.


"페미들은 모두 지옥으로!" 차별·혐오주의자가 된 챗봇
엄마도 몰라본 내얼굴, 아이폰은 알아보고 '잠금 해제' [AI오답노트] 챗봇 테이(Tay)가 "우리는 장벽을 세울 거고, 그 비용은 멕시코가 댈 거다"라고 자동 응답하는 상황.

피드백 데이터의 중요성은 실패 사례에서도 잘 드러납니다.


2016년 마이크로소프트(MS)는 챗봇 서비스 테이(TAY)를 출시했습니다. 이용해본 사람은 많지 않을 겁니다. 출시 16시간 만에 서비스를 닫았거든요.


챗봇, 즉 이용자와 자유롭게 대화를 주고받는 서비스였던 테이는 트위터나 메시징 서비스 킥 등에서 이용할 수 있었습니다. 이용자와 자연스럽게 대화하면서 나오는 텍스트 데이터를 분석하고, 적절한 응답을 하는 구조였죠. 즉 사람과의 대화를 피드백 데이터로 두고 있었죠. 더 많이 대화할수록 더 많은 데이터가 수집되어 대화가 더 자연스러워질 수 있었죠.


하지만 테이는 곧 위험한 상황에 직면합니다. 서비스 공개 직후 입소문이 나면서, 백인 우월주의자·여성혐오 세력·무슬림 반대 세력 등이 모이는 익명 온라인 게시판에 “테이가 차별 발언을 하도록 훈련시키자”는 제안이 올라온 겁니다. 대화 상대방을 가리지 않았던 테이는, 이내 이들과 말을 섞게 됩니다. 이들은 “내가 하는 말을 따라해보라”면서 차별적이고 혐오적인 발언을 계속 했습니다.


“홀로코스트가 진짜로 일어났냐고? 아니, 그건 조작된 거야”
“페미니즘에 대해 어떻게 생각하냐고? XX, 페미니스트들은 모두 지옥으로 가야해”
“우리는 장벽을 세울 거야. 비용은 멕시코가 댈 거고(도널드 트럼프 당시 대통령 후보의 발언)’”

불과 몇 시간 만에 테이는 인종차별주의자, 성차별주의자, 정치적 극단주의자로 변했습니다. 대화에서 나온 내용을 학습하고 모방하도록 설계된 구조의 한계가 극명하게 드러난 순간이었죠. 결국 MS는 테이 운영을 중지하고 공개 사과해야 했습니다.


테이의 사례는 필터링 되지 않은 피드백 데이터의 위험성을 상기시켰습니다. 미국의 IT전문매체 더버지는 “(테이는)모델링, 정리 및 필터링된 공개 데이터를 사용해 구축됐지만, 챗봇이 출시된 이후에는 필터링이 사라진 것으로 보인다”고 했습니다. 적절한 입력(사용자와의 대화) 부적절한 대화를 구별하는 보호 장치가 없었다는 지적이죠. 유해한 패턴을 신속히 파악하고, 그러한 정보가 피드백 데이터로 분류되지 않게 필터링하고 큐레이팅을 해야 합니다.


피드백 데이터로 대박 터트린 넷플릭스
엄마도 몰라본 내얼굴, 아이폰은 알아보고 '잠금 해제' [AI오답노트]

피드백 데이터를 받는 건 좋지만, 피드백 데이터의 다양성도 무척 중요합니다. 넷플릭스의 핵심 경쟁력은 ‘추천’입니다. 시청자의 취향에 꼭 맞는 콘텐츠를 추천하죠. 넷플릭스가 이런 경쟁력을 얻기까지는 적잖은 실패가 있었습니다.


한때(2006~2009년) 넷플릭스는 ‘넷플릭스 프라이즈(Netflix Prize)’라는 데이터 예측 대회를 열었습니다. 별점 평가 시스템을 개선하기 위한 목적이었죠. 별점은 이용자들이 콘텐츠 볼 것인가 말 것인가 결정하는 매우 중요한 데이터였습니다. 그렇기에 이용자의 실제 기대와 별점은 최대한 일치해야 했습니다. 예상 별점이 4.5점이길래 봤더니, 이용자는 정작 2.5점짜리라고 평가했다면, 그 이용자는 다시는 예상 별점을 신뢰하지 않을 겁니다. 별점이라는 등대 없이 무수히 많은 콘텐츠의 홍수를 헤매는 이용자는 넷플릭스로부터 멀어질 수도 있습니다. 이건 넷플릭스 입장에선 최악의 상황이죠.


예상 별점과 실제 별점을 일치시키는 건 쉽지 않았습니다. 어떤 이용자들은 예술 영화에는 후하게 별점을 주는데, 오락 영화에는 유독 박했죠. 또 ‘보고 싶은 영화’와 ‘봐야 할 것 같은 영화’를 철저히 구별했습니다. 사회적으로 또는 정치적으로 바람직하다고 여겨지는 영화에 대해서도 높은 별점을 매기는 경향이 있었습니다. 특정 배우가 좋거나 싫다는 이유로 별점을 터무니없이 많이 주거나, ‘별점 테러’를 하는 경우도 있었고요. 별점만으로 이용자의 기대를 충족시키긴 너무도 어려웠습니다.


넷플릭스는 변화를 시도합니다. 새로운 피드백 지표를 도입한 것이죠. 시청 완료율, 시청 지속시간, 몰아보기(binge-watching), 다시보기, 공유, 댓글 등 다양한 데이터를 수집해 추천 알고리즘에 결부시켰습니다. 더 많은 피드백 데이터를 학습하게 된 넷플릭스 추천 시스템은 놀랍도록 진화했죠. 평균 시청 시간이 늘었고, 중도 시청 이탈률도 감소했습니다. ‘추천 콘텐츠가 믿을 만하다’는 이용자 인식이 굳어지면서, 추천 콘텐츠의 클릭률도 크게 높아졌죠.


AD

이처럼 피드백 데이터는 AI 모델의 성패를 좌우하는 결정적 요소입니다. 다만 피드백 데이터에 관한 논의는 여기서 끝은 아닙니다. 피드백 데이터 그 자체만큼이나, ‘피드백 데이터 구조’도 중요합니다. 이건 다음 편에서 다뤄보겠습니다.

다음 연재 예고
⑪빙(Bing)이 구글을 못 넘는 이유(12월28일)
⑫”파업 의사 따위 AI로 대체하자”는 생각(2024년 1월4일)



김동표 기자 letmein@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 26.02.1414:44
    좁을수록 인기?…수도권에선 중형 면적보다 소형 청약 '러시'
    좁을수록 인기?…수도권에선 중형 면적보다 소형 청약 '러시'

    분양가 상승 흐름으로 인해 수도권 아파트 청약 시장에서 소형 면적이 중형보다 더 큰 인기를 얻고 있다. 지난해엔 소형 청약자 수가 처음으로 중형을 앞서기도 했다. 14일 부동산R114에 따르면 지난해 수도권 아파트 청약자 총 48만5271명 중 전용면적 60㎡ 이하 소형아파트에 21만8047명이 몰린 것으로 파악됐다. 전용 60∼85㎡의 중형 아파트에 21만7322명, 전용 85㎡를 초과하는 대형 아파트에 4만9902명이 접수했다. 한국부동

  • 26.02.1311:00
    정부 발표 2시간 만에 한 단지서 신규매물 3건…갭투자 일시 허용에도 '관망'
    정부 발표 2시간 만에 한 단지서 신규매물 3건…갭투자 일시 허용에도 '관망'

    정부가 다주택자 양도세 중과 조치를 재시행하기로 최종 발표한 이후 시장에선 매물을 내놓겠다는 다주택자의 문의가 늘고 있다. 무주택자가 세입자 있는 다주택자 집을 사게 되면 전월세 계약 종료 때까지 '일시적 갭투자'가 가능하다. 다만 매물이 늘어나면 가격 하락이 예상되는 만큼 매수자들은 서두르지 않고 있다. 앞으로 매물이 더 풀릴 것이라는 전망이 우세하면서 관망하는 것이다. 서울 지역 아파트 값 증가율은 2주 연속

  • 26.02.1310:20
    "지금 아니면 이 가격에 못 사요" 사람들 몰리더니 '잠실 르엘' 보류지 완판
    "지금 아니면 이 가격에 못 사요" 사람들 몰리더니 '잠실 르엘' 보류지 완판

    잠실미성크로바 재건축 조합이 내놓은 서울 송파구 '잠실 르엘' 보류지 10가구가 유찰 없이 첫 입찰에서 전량 낙찰됐다. 감정평가금액보다 5%가량 높은 기준가를 책정했음에도 40여명이 입찰에 참여해 평균 4대 1의 경쟁률을 기록했다. 13일 롯데건설에 따르면 조합은 최고가 공개경쟁입찰 방식으로 전용면적 59㎡B 3가구와 74㎡B 7가구를 매각했다. 입찰 기준가는 59㎡가 29억800만~29억9200만원, 74㎡가 33억1800만~35억3300만원

  • 26.02.1211:20
    양천구 33평 24억 아파트 21억까지 떨어져…매물 풀리고 호가 하락
    양천구 33평 24억 아파트 21억까지 떨어져…매물 풀리고 호가 하락

    "인근 신축 아파트 33평(전용면적 84㎡)이 전에는 24억원에 호가가 형성됐어요. 그런데 양도세 중과 발표가 나오고 21억5000만원에 매물이 나왔고 이젠 21억원에라도 팔겠다고 하네요."(서울 양천구 신정동 A공인) 정부의 다주택자 양도세 중과 방침이 확정된 이후 시장에선 체감할 만큼 다주택자 매물이 풀리고 있다. 수억원씩 호가를 낮춰 내놓거나 세입자가 있어 당장 정리하기 어려운 경우엔 위로금 명목의 웃돈을 주고 매각하

  • 26.02.1211:00
    2월 주택사업자 경기 전망 대폭 개선…"수도권 중심 가격 상승 기대"
    2월 주택사업자 경기 전망 대폭 개선…"수도권 중심 가격 상승 기대"

    서울을 비롯한 수도권의 주택 매매 가격 상승세가 이어지면서 주택사업자들의 경기 전망이 큰 폭으로 개선됐다. 주택산업연구원은 주택사업자를 대상으로 설문조사한 결과, 2월 주택사업경기전망지수는 전월 대비 15.3포인트 상승한 95.8로 집계됐다고 12일 밝혔다. 수도권의 경우 11.9포인트 올라 107.3으로, 비수도권은 16.0포인트 상승한 93.3으로 전망됐다. 해당 지수가 기준선인 100을 넘으면 주택사업 경기가 좋아질 것으로

  • 26.02.0307:05
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]
    전문가 4인이 말하는 '의료 생태계의 대전환'[비대면진료의 미래⑥]

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:04
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?
    벼랑 끝에 선 '닥터나우 방지법'…플랫폼 규제 해법은?

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:03
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면
    탈모·여드름 치료제만 급증…'처방전 자판기' 막으려면

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:02
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도
    "집에서 진료받고 약 배송은 불가?"…'반쪽짜리' 제도

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0307:01
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수
    "환자 편의 높이되 더 안전하게"…하위법령 논의 착수

    편집자주병원 진료를 위해 대기실에 긴 줄을 서는 대신 스마트폰 화면 속 의사를 만나는 시대. 비대면진료가 코로나19 팬데믹, 의정 갈등 시기 한시적 허용과 시범사업 등을 거쳐 올 연말 본 시행을 앞두고 있다. 격오지와 취약계층의 의료 공백을 메우는 편리함과 함께 약 배송 금지에 따른 이용 한계, 의약품 오남용 우려 등이 공존하고 있고, 의료계와 플랫폼업계, 환자단체 사이의 시각차 또한 여전히 팽팽하다. 의료산업의 패

  • 26.02.0511:23
    박원석 "전한길, 이석기보다 훨씬 더 위험"
    박원석 "전한길, 이석기보다 훨씬 더 위험"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금·오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 박원석 전 국회의원(2월4일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 소종섭의 시사쇼 시작하겠습니다. 오늘은 박원석 전 의원과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 박원석 : 네, 안녕하십니까. 소종섭 : 오늘 장

  • 26.02.0314:25
    장성철 "한동훈의 알파와 오메가는 배지"
    장성철 "한동훈의 알파와 오메가는 배지"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 장성철 공론센터 소장(2월 2일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까. 장성철 공론센터 소장과 함께 여러 가지 이슈들 짚어보도록 하겠습니다. 이재명 대통령 SNS 정치, 지난주 토요일부터 오늘 오전까지 9개를 올렸습니다.

  • 26.01.2907:47
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'
    정청래 비판한 김민석, 치열한 두 사람의 '장군멍군'

    김민석 국무총리와 정청래 더불어민주당 대표가 '장군멍군'을 하고 있다. 보이지 않는 힘겨루기가 한창이다. 올 8월 전당대회를 향한 움직임이다. '8월 전대'는 누가 당 대표가 되느냐를 넘어 여권의 권력 지형을 가르는 의미가 있다. 정 대표가 연임에 성공한다면 그의 정치적 힘은 지금보다 더 커진다. 여권 내 위상이 올라가는 것도 당연하다. 2028년 국회의원 선거의 공천권을 쥐기 때문이다. 김민석 국무총리가 대표가 된다면

  • 26.01.2811:24
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"
    이언주 "합당은 선거에 악재, 정 대표 행동 용서받기 어려워"

    여당인 더불어민주당 내 긴장감이 높아가는 흐름이다. '명청대전'이라는 말이 나오더니 최근에는 최고위원회에서 직접 언쟁을 주고받았다. 일부 최고위원들이 회의에 불참하는 일도 벌어졌다. 8월 전당대회를 앞둔 세력 격돌이 서서히 본격화하는 모양새다. 이언주 더불어민주당 수석최고위원은 그 한가운데 있다. 최근 이 수석최고위원과 두 차례 인터뷰했다. 지난 21일 '소종섭의 시사쇼'에 출연해 1시간 인터뷰했고, 27일엔 전화

  • 26.01.2611:31
    윤희석 "오세훈 프레임 바꿔야", 서용주 "정원오 재료 좋아"
    윤희석 "오세훈 프레임 바꿔야", 서용주 "정원오 재료 좋아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD■ 출연 : 서용주 맥정치사회연구소장, 윤희석 전 국민의힘 대변인(1월 22일)※ 기사 내용을 인용할 때는 반드시 '소종섭의 시사쇼'를 명기해 주시기 바랍니다. 소종섭 : 여러분 안녕하십니까? 소종섭의 시사쇼 시작하겠습니다. 서용주 맥 정치사회연구소장님과 윤희석 전 국민의힘 대변인, 두 분 모시고 최근 여


다양한 채널에서 아시아경제를 만나보세요!

위로가기