본문 바로가기
bar_progress

글자크기 설정

닫기

㈜알토비전 컨소시엄, NIA 과제 ‘추상 요약 사실성 검증 데이터’ 구축 완료

시계아이콘01분 17초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

- AI 학습용 요약문 오류 데이터 10만 세트 구축
- AI 성능 높이고, 오류 발견/수정 AI 제작에 기여

㈜알토비전 컨소시엄이 한국지능정보사회진흥원(이하 NIA)의 ‘추상 요약 사실성 검증 데이터’(이하 추상 요약 사업) 사업으로 AI 학습용 데이터를 10만 세트 구축하며 성공적으로 마무리했다고 지난 21일 밝혔다.


해당 컨소시엄은 ㈜알토비전을 주관기관으로 하고 ㈜나라지식정보와 비플라이소프트㈜가 참여하여 지난 7월부터 사업을 추진해왔다. 비플라이소프트㈜에서 원시데이터 수집 및 정제와 원천데이터 생성을 담당, ㈜알토비전이 데이터 가공, ㈜나라지식정보에서 검수 및 품질 관리를 맡았다.


㈜알토비전 오주양 대표는 “AI 학습용 데이터가 더욱 정교화될수록 AI모델 발전에도 기여할 수 있고 우리의 생활과 AI 기술은 더욱 가까워질 것”이라고 전망했다.


보통 인터넷 기사나 요약 서비스 등에서 활용되고 있는 요약 방식은 추출 요약 방식이다. 네이버, 다음 등 포털과 일부 언론에서 제공하는 기사 요약 서비스에 활용 중인데 문장의 완성도가 높다는 장점이 있지만, 문장의 연결이 어색하거나 중요한 내용의 누락, 비슷한 내용이 중복으로 제시되는 등의 한계가 있다.


반면 추상 요약은 내용을 충실히 요약하는 장점이 있어 추출 요약보다는 한 단계 더 나아간 요약 방식이다. 이번 컨소시엄에서 진행한 추상 요약 방식은 기사 본문에서 핵심 내용을 담고 있는 문장을 골라서 그대로 제시하는 추출 요약 방식과 달리, AI가 본문의 내용을 새로운 문장으로 요약하는 방식이다.


이번에 구축한 추상 요약 오류 데이터를 활용해 추상 요약 AI의 성능을 높이고, 문장의 오류를 발견하거나 수정하는 AI를 제작하는 데에 향후 크게 기여할 수 있을 것으로 기대하고 있다.


추상 요약 사업의 구체적인 내용을 보면, 도메인별(기사, 칼럼, 법률) 원문을 활용하여 AI 기계 요약문과 사람 요약문을 작성하고, 요약문에 포함된 오류를 AI가 학습할 수 있는 데이터로 구축했다. 오류의 유형은 6가지 유형으로 분류되었는데 크게 문장 오류와 내용 오류로 나뉜다.


문장 오류는 △한글맞춤법, 띄어쓰기 오류 △단어 선택 오류 △비문 △미완성 또는 불완전한 문장 등이고 내용 오류는 △키워드 또는 중요 내용 오류 △유사한 내용 반복 오류 등이다. AI가 오류를 학습할 수 있도록 하나의 데이터 세트에 오류 요약문, 요약문 오류의 위치, 오류 유형 정보, 오류를 고친 정보가 들어 있고 json 파일 형태로 구축되었다.


㈜알토비전 오주양 대표는 “추상 요약문 오류 데이터를 활용한다면 새로운 여러 가지 AI 모델을 만들 수 있을 것”이라며 “알토비전은 2023년에 ㈜테디썸과 협업하여 올해 구축한 데이터를 활용해 신문 기사의 문장 오류를 자동으로 수정하는 솔루션을 개발할 계획이다”라고 전했다.


AD

한편 ㈜알토비전은 2020년 설립된 중소기업으로 AI 학습용 데이터 구축 전문 기업이다. NIA의 데이터 구축 사업, 강릉시 용역 사업, 정보통신산업진흥원(NIPA) 사업 등을 수행해 왔다.




정진 기자 peng1@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 25.12.0607:30
    한국인 참전자 사망 확인된 '국제의용군'…어떤 조직일까
    한국인 참전자 사망 확인된 '국제의용군'…어떤 조직일까

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'■ 진행 : 소종섭 정치스페셜리스트■ 연출 : 이미리 PD■ 출연 : 이현우 기자 우크라이나 전쟁에 참전했다가 사망한 한국인의 장례식이 최근 우크라이나 키이우에서 열린 가운데, 우리 정부도 해당 사실을 공식 확인했다. 우크라이나와 러시아 매체 등에서 우크라이나 측 국제의용군에 참여한 한국인이 존재하고 사망자도 발생했다는 보도가 그간 이어져 왔지만, 정부가 이를 공식적으로 확

  • 25.12.0513:09
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 김용태 국민의힘 의원(12월 4일) "계엄 1년, 거대 두 정당 적대적 공생하고 있어""장동혁 변화 임계점은 1월 중순. 출마자들 가만있지 않을 것""당원 게시판 논란 조사, 장동혁 대표가 철회해야""100% 국민경선으로 지방선거 후보 뽑자" 소종섭 : 김 의원님, 바쁘신데 나와주셔서 고맙습니다. 김용태 :

  • 25.12.0415:35
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 강전애 전 국민의힘 대변인, 김준일 시사평론가(12월 3일) 소종섭 : 국민의힘에서 계엄 1년 맞이해서 메시지들이 나왔는데 국민이 보기에는 좀 헷갈릴 것 같아요. 장동혁 대표는 계엄은 의회 폭거에 맞서기 위한 것이었다고 계엄을 옹호하는 듯한 메시지를 냈습니다. 반면 송원석 원내대표는 진심으로

  • 25.12.0309:48
    조응천 "국힘 이해 안 가, 민주당 분화 중"
    조응천 "국힘 이해 안 가, 민주당 분화 중"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이미리 PD■ 출연 : 조응천 전 국회의원(12월 1일) 소종섭 : 오늘은 조응천 전 국회의원 모시고 여러 가지 이슈에 대해서 솔직 토크 진행하겠습니다. 조 의원님, 바쁘신데 나와주셔서 고맙습니다. 요즘 어떻게 지내시나요? 조응천 : 지금 기득권 양당들이 매일매일 벌이는 저 기행들을 보면 무척 힘들어요. 지켜보는 것

  • 25.11.2709:34
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 윤희석 전 국민의힘 대변인(11월 24일) 아시아경제 '소종섭의 시사쇼'에 출연한 윤희석 전 국민의힘 대변인은 "장동혁 대표의 메시지는 호소력에 한계가 분명해 변화가 필요하다"고 진단했다. 또한 "이대로라면 연말 연초에 내부에서 장 대표에 대한 문제제기가 불거질 것"이라고 내다봤다. 한동훈 전


다양한 채널에서 아시아경제를 만나보세요!

위로가기