강나훔기자
디지털전환 시대를 맞아 많은 산업군에서 빅데이터의 구축과 활용에 대한 필요성이 높아지고 있다. 오늘날엔 많은 데이터가 디지털기기, 미디어 친화적으로 생산·보관되고 있지만 과거엔 오랜 기간 데이터의 생산 및 보관은 활자 인쇄물이 주를 이뤘다. 따라서 오랜 기간 축적돼 온 방대한 활자 인쇄물을 빅데이터로써 활용하기 위한 광학 문자 판독(OCR) 기술의 수요 역시 증대되고 있다. OCR이란 인쇄된 문서를 디지털 이미지 파일로 변환하는 기술이다. 국내에서 AI를 활용한 OCR 기술로 시장을 선도하는 기업이 있어 주목받고 있다. 바로 로민이다.
강지홍 로민 대표는 7일 아시아경제를 만난 자리에서 "문서 업무를 어떻게 하면 더 효율화하고 자동화할 수 있을까라는 고민을 오랜시간 해왔고 ‘도큐멘트 AI’라는 기술을 구상하게 됐다"며 "전세계 모든 기업들이 문서 업무 자동화를 쉽게 할 수 있도록 플랫폼을 만들어 기술을 고도화 하는 중"이라고 말했다.
로민의 주력 서비스는 ‘텍스트스코프 스튜디오’다. 이는 문서 데이터를 자동으로 처리하고 활용할 수 있는 플랫폼이다. 딥러닝 기반의 컴퓨터 비전(CV), 자연어처리(NLP) 등 최신 AI 기술이 뒷받침하는 OCR을 활용해 문서를 식별 및 분류하고 업무에 필요한 데이터만 정확하고 빠르게 추출한다. 다양한 형태의 문서를 활용할 수 있는 형태의 데이터로 변환하고 가장 효율적인 방법으로 문서 처리 자동화를 구현할 수 있도록 지원한다. 또 변환된 데이터를 더욱 가치있게 활용할 수 있도록 다양한 연계 AI 기술을 제공한다.
텍스트스코프 스튜디오의 최대 장점은 높은 인식률이다. 저화질, 저품질 문서와 필기체 문서를 높은 정확도로 인식한다. 인쇄체 인식률 98.07%, 필기체 검출 성능 98.38%, 타자체 인식률 98.3%를 자랑한다.
강 대표는 "문자 인식 기술은 오래된 기술이지만 딥러닝이 적용된 것은 그리 오래되지 않았다. 2016년부터 딥러닝을 활용한 기술에 집중을 해서 꾸준히 계속 연구 개발을 해왔다"고 설명했다.
로민은 기술력을 바탕으로 국내 유수 금융기업과 협업하며 신뢰를 쌓아가고 있다. 카카오뱅크에선 비대면 주택담보대출에 로민의 기술이 적용되고 있다. 등기권리증, 신분증, 인감증명서, 재직증명서 등 각종 서류를 자동 인식해 정보를 처리해준다. KB국민카드의 경우 고객 신분증 인증뿐 아니라 신용카드 가맹점 심사 과정에서 로민의 기술들이 활용된다.
강 대표는 "금융업은 B2C 업무를 많이 하기 때문에 다양한 산업군 중에서도 가장 많은 서류를 처리하는 업종이다. 문서 업무 처리 자동화 수요가 많을 수밖에 없다"며 "비용 절감 측면에서도 인건비를 대폭 줄일 수 있어 우리 기술을 활용하는 금융사가 많다"고 말했다.
로민은 개인정보보호 기술도 고도화 중이다. 최근엔 AI 기반 개인정보 필터링 및 비식별화 솔루션 ‘텍스트스코프 프라이버시가드’ 서비스를 내놨다. 개인정보 탐지 및 비식별화 솔루션으로 이미지 문서나 텍스트 문서 내 이미지에서도 개인정보를 정확히 탐지하며 목적에 맞는 비식별화 기능을 제공한다. 특히 그래픽 서체 및 손글씨로 작성된 개인정보, 저화질 이미지에서도 정확한 탐지할 수 있다. 예를 들어 주민번호가 식별되면 자동으로 마스킹하는 방식이다.
강 대표는 "최근 이름·주민등록번호·주소 등을 가리지 않아 개인정보가 노출된 사고가 빈번히 벌어지고 있다. 정부산하 기관과 더불어 거대플랫폼 기업 및 금융권 등에서도 개인정보 보안이 더욱 중요해질 것"이라고 전망했다.
강 대표는 올해 목표 중 하나로 영미권 진출을 꼽았다. 그는 "우리가 제공하는 서비스의 가치는 인건비와 시간 절감에 있다. 때문에 인건비가 높은 영미권에 미국이나 유럽 등 '소위 잘 사는 나라'에서 수요가 높을 것으로 예상한다"고 말했다.