장효원기자
연세대학교 김한샘 교수 연구팀과 티사이언티픽 기업부설연구소는 지난달 30일 공동 연구를 통해 ‘인공지능(AI)을 이용한 개인정보보호’ 관련 논문을 발행했다고 7일 밝혔다.
이번 연구는 개인정보보호위원회와 한국인터넷진흥원에서 지원하는 ‘개인정보 강화 기술 R&D 사업?대화형 텍스트 데이터에서 AI 기반 개인정보 탐지 및 비식별화 기술 개발’ 사업의 연구 결과다. 이 사업은 티사이언티픽이 주관 기관을 맡아 연세대학교, 월드버텍, 아임클라우드와 공동 수행 중이다.
최근 온라인 소셜미디어 사용 급증 및 온라인 정보의 증가로 정보 유출에 대한 우려가 높아지고 있다. 특히 한국어의 경우 영어나 중국어와 같이 사용 인구가 적어 기술적 진보가 상대적으로 더딘 상황이다.
이에 논문에는 ▲한국어 개인 식별 정보(PII) 분류 체계를 확립 ▲대규모 한국어 PII 데이터셋 구축 ▲한국어 PII 처리능력에 대해 다양한 언어 모델 평가 ▲개인정보 보호 기술 발전에 논의 촉발 등의 내용을 담았다.
연구과제 총괄 PM인 티사이언티픽 이종규 연구소장은 “정부의 지원을 받아 수행한 연구 결과를 논문 형식으로 공유해 우리나라 개인정보보호 연구 부문에서 한국어의 체계적인 분석에 일조하기를 바란다”며 “이번 연구 결과의 실제 활용을 위해 ‘P3R for AI’라는 제품 이름으로 현재 GS(Good Software) 인증을 진행 중”이라고 말했다.
한편 이번 논문의 집필을 주도한 연세대학교 한국어 언어자원 연구실은 다양한 도메인의 한국어 말뭉치 구축과 AI언어 능력 평가 연구 등을 활발히 수행 중이다.