[파워K-우먼]'AI 붐이 찾아왔다…미래 쫓지 말고 미리 가 있어라'

AI 스타트업 업스테이지 박은정 최고과학책임자(CSO)
네이버에서 AI 높임말 번역 개발…업스테이지 공동 창업
가보지 않은 길이라도 과감하게 발걸음 내디뎌
"지금 기준 아닌 1년 후, 10년 후 미래 그려야"

"미래를 쫓아가기보다는 미래가 올 곳에 미리 가 있어야죠."

새로운 기술이 쏟아지는 인공지능(AI) 산업에서 업스테이지는 누구보다도 빠르게 움직이는 기업이다. 생성형 AI 붐을 일으킨 오픈AI가 챗GPT 개발 도구를 공개하자마자 카카오톡과 라인에 붙여 서비스했다. 챗GPT 대항마로 오픈소스 대규모언어모델(LLM)이 부상하자 자체 모델로 글로벌 오픈소스 LLM 리그에서 1위를 차지했다. 지난 9월에는 LLM 전담팀을 조직한 지 한 달 만에 자체 모델 '솔라'를 개발했다. 회사의 성장도 기술 개발 속도만큼 빠르다. 2020년 네이버 출신 개발자 3명이 뭉친 회사 인력은 3년이 안 돼 160명으로 늘었다.

박은정 업스테이지 최고과학책임자(CSO)는 3명의 공동창업자 중 하나다. "내가 있는 곳으로 미래가 온 경우"라고 겸손하게 말하지만 미래를 먼저 내다보고 준비했다. 바둑 두는 AI 알파고로 붐이 일기 전부터 AI 시작점인 데이터 마이닝을 연구했다. 지금은 AI 주권의 핵심으로 떠오른 한국어 연구에 아무도 관심이 없을 때 한국어 높임말 번역을 개발했다. 가보지 않은 길이라도 과감하게 내디딘 발걸음이 그를 미래로 이끈 셈이다.

박은정 업스테이지 최고과학책임자(CSO). 사진=허영한 기자 younghan@

미래 보고 과감한 베팅…관심 밖 한국어 데이터 연구

박 CSO가 데이터 마이닝을 시작한 것은 대학원 때다. 데이터 마이닝은 데이터에서 숨겨진 패턴과 관계를 찾아 가치 있는 정보를 발견하는 것이다. 데이터라는 원석에서 다이아몬드 같은 인사이트를 캐낸다는 점에서 매력을 느꼈다. 반도체 공정 데이터에서 불량 웨이퍼 탐지하기, 기업 공시자료를 토대로 주가 예측하기 등을 연구하며 머신러닝을 활용했다. 머신러닝은 대량의 데이터로 다음에 일어날 일을 예측하는 것으로 AI의 한 분야다. 데이터를 파헤칠수록 박 CSO는 AI가 세상을 흔들 것이라 직감했다. AI는 쉽게 말해 데이터를 넣어 특정 업무를 잘하는 함수를 만드는 것이다. 비교적 단순한 일이지만 활용처가 무궁무진하다. 박사 과정을 마칠 때쯤 알파고가 이세돌 9단을 꺾었다. 그의 직감은 확신으로 바뀌었다.

박 CSO는 확신하는 일에 과감하게 베팅하는 편이다. 파이선 개발자들의 축제인 파이콘 1회가 한국에서 열릴 때 코엔엘파이(KoNLPy)를 선보였다. 한국어 데이터를 컴퓨터가 이해할 수 있도록 분석해주는 도구다. 당시 파이선은 아무도 쓰지 않는 프로그래밍 언어였다. 한국어 역시 아무도 관심을 갖지 않는 비주류 언어였다. 박 CSO는 "파이선을 써보니 너무 편해서 앞으로 주류 언어가 될 거라 봤다"며 "지금을 기준으로 생각하기보단 1년 후, 10년 후는 어떻게 될지를 생각해야 미래가 있는 곳에 가 있을 수 있다"고 강조했다. KoNLPy는 지금까지 AI 개발자들이 많이 쓰는 프로그램이다. 업스테이지에 합류하는 개발자 중에선 이 프로그램 때문에 입사를 선택하는 경우가 있을 정도다.

박은정 업스테이지 최고과학책임자(CSO). 사진=허영한 기자 younghan@

한국어 데이터에 대한 관심은 2016년 네이버 입사로 이어졌다. 네이버에서 AI 번역을 개발하는 파파고 리더로부터 제안받았다. 당시 박 CSO는 컴퓨터에 인간의 언어를 이해시키는 자연어처리(NPL)에 집중하고 있었다. NPL 분야에서도 꽃으로 불리는 번역 서비스에 뛰어든 것이다. 글로벌 IT 회사에서도 영입 제안을 받았지만 한국어를 다뤄보고 싶다는 생각에 네이버를 택했다.

네이버에선 높임말 번역을 개발했다. AI가 한국어 특유의 높임말을 소화하지 못해 번역 품질이 떨어진다고 판단했기 때문이다. 처음 몇 년은 실패의 연속이었다. 주체 높임, 객체 높임 같은 문법부터 해요체, 하게체 같은 단계까지 복잡한 높임말을 간단한 함수로 표현하기가 어려웠다. 박 CSO는 의외로 단순한 방법에서 돌파구를 찾았다. 복잡한 문법, 표현은 생략하고 높임말을 이진법처럼 구분했다. AI에 '~니다'가 들어가면 높임말, 그렇지 않으면 반말이라고 학습시켰다. 번역기에도 온·오프 스위치를 붙여 스위치를 켜면 높임말 표현으로 번역하도록 했다. 박 CSO는 "복잡하고 팬시(화려)한 기술보다 단순하지만 임팩트 있는 기술에서 답을 찾았다"며 "단순한 결과물(output)을 내는 게 아니라 실질적인 가치(outcome)를 만들어 내는 게 중요하다는 것을 배웠다"고 설명했다.

"AI가 세상 바꾼다…모두를 위한 AI 목표"

네이버에서 입지를 굳힌 그는 2020년 돌연 창업에 도전했다. 당시 네이버에서 AI 개발을 총괄했던 김성훈 업스테이지 대표와 보는 AI인 네이버 클로바를 이끌던 이활석 업스테이지 최고기술책임자(CTO)가 뭉쳤다. 세 개발자는 도원결의하듯 AI로 세상을 바꿔보자고 뜻을 모았다. 네이버에서 특정 서비스를 성공시키기 위한 기술이 아니라 AI 기술 자체를 사업화하자는 것이다. 박 CSO는 "AI가 세상에 엄청난 영향을 미치는 건 분명해 보였다"며 "그렇다면 우리가 할 일은 더 많은 사람이 AI를 쓸 수 있게 만드는 것이라고 생각했다"고 회상했다.

박은정 업스테이지 최고과학책임자(CSO). 사진=허영한 기자 younghan@

어벤저스급 개발자가 모였지만 창업은 쉽지 않았다. 모든 것이 갖춰진 대기업을 나오니 창업자부터 일당백을 소화해야 했다. 박 CSO가 인사를 맡고 이 CTO가 재무까지 담당했다. CSO 본연의 역할도 네이버 기술 리더 때와는 차원이 달랐다. 기술 전략을 넘어 상품과 회사 경영의 관점에서 결정해야 하기 때문이다. 문제에 봉착할 때마다 직접 부딪히며 배우는 수밖에 없었다. 그 과정에서 여러 사람의 의견을 모으고 방향을 설정하는 법을 익혔다. 그는 "회사 하나가 일궈지기까지 A to Z를 경험했다"며 "(아이는 없지만) 아이를 키우는 게 이런 기분일까 싶을 정도로 성장했다"고 말했다.

박 CSO와 함께 회사도 성장 궤도에 올랐다. 기업 고객을 첫 타깃으로 삼고 'AI 팩'을 서비스하고 있다. 문서 이미지에서 원하는 정보를 골라내거나 개인화 추천 시스템 등 기업이 원하는 AI 성능이나 적용 범위를 맞춤형으로 선택할 수 있다. 삼성생명·한화생명·포스코 등 대기업을 고객사로 확보했다. 올해를 솔루션 영업 원년으로 삼고 손익분기점(BEP)을 달성하겠다는 목표다. 지난달에는 자체 LLM 솔라를 선보였다. 기업 내부 데이터만 활용해 보안성을 높였다. 잘못된 정보를 사실처럼 말하는 환각 현상도 최소화했다. 박 CSO는 "마이크로소프트(MS)가 PC를 보급한 것처럼 AI를 보급하는 회사가 되겠다"며 "기업 고객을 시작으로 나중에는 할머니도 쓰는 AI 모델을 만들고 싶다"고 밝혔다.

박 CSO는 AI가 다른 여성 개발자에게도 기회가 될 것으로 내다봤다. 상대적으로 유연한 업무 환경에서 일할 수 있기 때문이다. 업스테이지도 회사 창립부터 100% 원격 근무를 시행하고 있다. 아직은 여성 개발자 비중이 남성보다 적은 게 현실이다. 그러나 에이다 러브레이스처럼 더 많은 롤모델이 나올 것으로 기대하고 있다. 에이다 러브레이스는 1815년 영국에서 태어난 여성으로 최초의 컴퓨터 프로그래머다. 그는 "더 많은 여성이 이 필드에 들어오기를 바란다"며 "미래 관점에서 고민하고 많은 실패를 경험해야 성공할 수 있다"고 조언했다.

▶박은정 CSO는

2004년 서울대학교에서 산업공학을 전공했다. 서울대학교 대학원 데이터 마이닝 분야에서 석사·박사 학위를 받았다. 2016년부터 네이버 파파고팀에 합류해 높임말 번역 등을 개발했다. 2021년 세계적 테크 매체인 'MIT 테크놀로지 리뷰'의 한국 35세 미만 최고 혁신가에 선정됐다. 2022년에는 AI 전문 기업 업스테이지를 창업해 CSO를 맡고 있다.

산업IT부 최유리 기자 yrchoi@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스