본문 바로가기
bar_progress

글자크기 설정

닫기

[AI 데이터 고갈 위기]'데이터 부족하면 직접 만든다?'…주목 받는 합성데이터

시계아이콘01분 21초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

AI 붐에 수요 못 따라 가는 데이터 공급
가상으로 만들어낸 합성데이터 관심 ↑
성능 저하·다양성 부족 등 부정적 시선도

[AI 데이터 고갈 위기]'데이터 부족하면 직접 만든다?'…주목 받는 합성데이터 [이미지 출처=로이터연합뉴스]
AD

인공지능(AI) 학습에 필요한 데이터 확보가 한계를 보일 것이란 전망이 나오면서 인위적으로 만들어낸 합성데이터가 주목받고 있다. 허구의 데이터를 이용해 AI 학습을 하는 건데, 성능 저하 등이 나타날 수 있다는 부정적인 의견도 제기되고 있다.


한국데이터산업진흥원이 지난달 발표한 '2023 데이터산업현황조사 보고서'에 따르면 지난해 기준 국내 데이터산업 시장은 전년 대비 4.6% 성장한 27조1513억원 규모인 것으로 조사됐다. 2018년까지만 해도 시장 규모가 15조5684억원 수준이었지만 5년 만에 11조5000억원 넘게 늘었다. 국내 데이터산업 시장은 매년 평균 12.6%의 성장이 전망됐는데 2028년에는 시장 규모가 51조1413억원에 육박할 것으로 파악됐다. 글로벌 시장조사 기관 360아이리서치는 전세계 AI 모델 개발에 사용되는 학습 데이터세트의 시장 규모는 매년 26% 넘게 성장할 것으로 전망했다.


[AI 데이터 고갈 위기]'데이터 부족하면 직접 만든다?'…주목 받는 합성데이터

합성데이터에 대한 관심은 데이터 수요만큼 공급이 따라가지 못할 것이라는 우려가 반영된 것으로 보인다.


합성데이터는 AI 학습용으로 만들어낸 가상의 데이터로, 크게 '부분'과 '완전' 합성데이터로 구분된다. 부분 합성데이터는 실제 데이터 중 일부에 합성 정보를 입히는 방식으로 만들어진다. 민감 정보를 보호에 용이하다.


완전 합성데이터는 새로운 정보를 생성하는 것을 뜻한다. 허구지만 실제와 동일한 통계 속성 등을 사용할 수 있어 실제 데이터를 사용했을 때와 유사한 결론을 얻을 수 있다.


합성데이터 도입에 찬성하는 진영에선 필요에 따라 무제한으로 데이터를 생성해낼 수 있다는 점을 높게 평가한다. 개인정보에 민감한 금융, 의료 등 분야에 데이터를 제공할 수 있다는 점을 내세운다. 글로벌 시장조사기관 가트너는 향후 2030년에는 AI 학습에 실제보다 합성데이터를 사용하는 비중이 더 높을 것으로 내다봤다. 예를 들어 자율주행 모델 개발에서 합성데이터 사용 빈도는 증가하고 있다. 이는 실제 교통사고 데이터를 확보하기가 어렵기 때문인데, 합성데이터로는 3D 구현도 가능하다.


국내 AI 데이터 스타트업인 셀렉트스타의 황민영 부대표는 "일반적인 방법으로 수집할 수 있는 데이터는 점차 고갈되는 만큼 합성데이터 의존이 점차 증가할 것으로 예상된다"고 말했다.


인위적으로 만들어낸 만큼 합성데이터에도 부정적 시선이 존재한다. 실제가 아니다 보니 품질 문제가 생길 수 있다는 것이다. 또 잘못 설계된 합성데이터를 AI 학습에 활용할 경우 현실을 제대로 반영하지 못할 가능성도 농후하다. 오류가 있는 데이터가 확대 재생산돼 AI 분야에 쓰이게 되면 성능 감소에 이어 왜곡, AI 모델이 부정확한 답변을 하는 할루시네이션 현상 등도 발생할 수 있다.


AD

김명주 국제인공지능윤리협회장(서울여대 바른AI연구센터장)은 "AI가 만든 합성데이터를 다음 세대 AI 모델이 활용했을 때 이전보다 성능이 더 떨어질 수 있다는 실험 결과도 있다"며 "합성데이터를 사용한 AI 모델이 다수의 의견을 차지하게 되면 다양성의 상실이 나타날 수 있다"고 설명했다. 이어 "AI 때문에 인류의 문명이 획일화될 수 있다는 점에 대한 경각심도 필요하다"고 덧붙였다.




이정윤 기자 leejuyoo@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 25.12.0209:29
    자식 먹이고자 시도한 부업이 사기…보호망은 전혀 없었다
    자식 먹이고자 시도한 부업이 사기…보호망은 전혀 없었다

    "병원 다니는 아빠 때문에 아이들이 맛있는 걸 못 먹어서…." 지난달 14일 한 사기 피해자 커뮤니티에 올라 온 글이다. 글 게시자는 4000만원 넘는 돈을 부업 사기로 잃었다고 하소연했다. 숨어 있던 부업 사기 피해자들도 나타나 함께 울분을 토했다. "집을 부동산에 내놨어요." "삶의 여유를 위해 시도한 건데." 지난달부터 만난 부업 사기 피해자들도 비슷한 상황에 놓여있었다. 아이 학원비에 보태고자, 부족한 월급을 메우고자

  • 25.12.0206:30
    "부끄러워서 가족들한테 말도 못 해"…전문가들이 말하는 부업사기 대처법 ⑤
    "부끄러워서 가족들한테 말도 못 해"…전문가들이 말하는 부업사기 대처법 ⑤

    편집자주부업인구 65만명 시대, 생계에 보태려고 부업을 시작한 사람들이 부업으로 둔갑한 사기에 빠져 희망을 잃고 있다. 부업 사기는 국가와 플랫폼의 감시망을 교묘히 피해 많은 피해자를 양산 중이다. 아시아경제는 부업 사기의 확산과 피해자의 고통을 따라가 보려고 한다. 전문가들은 사회관계망서비스(SNS)를 중심으로 확산하는 부업 사기를 두고 플랫폼들이 사회적 책임을 갖고 게시물에 사기 위험을 경고하는 문구를 추가

  • 25.12.0112:44
    부업도 보이스피싱 아냐? "대가성 있으면 포함 안돼"
    부업도 보이스피싱 아냐? "대가성 있으면 포함 안돼"

    법 허점 악용한 범죄 점점 늘어"팀 미션 사기 등 부업 사기는 투자·일반 사기에 해당한다는 이유로 구제 대상에서 제외되고 있습니다. 하지만 부업 사기도 명확히 전기통신금융사기(보이스피싱)의 한 유형이고 피해자는 구제 대상에 포함되도록 제도가 개선돼야 합니다."(올해 11월6일 오OO씨의 국민동의 청원 내용) 보이스피싱 방지 및 피해 복구를 위해 마련된 법이 정작 부업 사기 등 온라인 사기에는 속수무책인 상황이 반복되

  • 25.12.0112:44
    의지할 곳 없는 부업 피해자들…결국 회복 포기
    의지할 곳 없는 부업 피해자들…결국 회복 포기

    편집자주부업인구 65만명 시대, 생계에 보태려고 부업을 시작한 사람들이 부업으로 둔갑한 사기에 빠져 희망을 잃고 있다. 부업 사기는 국가와 플랫폼의 감시망을 교묘히 피해 많은 피해자들을 양산 중이다. 아시아경제는 부업 사기의 확산과 피해자의 고통을 따라가보려고 한다. 나날이 진화하는 범죄, 미진한 경찰 수사에 피해자들 선택권 사라져 조모씨(33·여)는 지난 5월6일 여행사 부업 사기로 2100만원을 잃었다. 사기를 신

  • 25.12.0111:55
    SNS 속 '100% 수익 보장'은 '100% 잃는 도박'
    SNS 속 '100% 수익 보장'은 '100% 잃는 도박'

    편집자주부업인구 65만명 시대, 생계에 보태려고 부업을 시작한 사람들이 부업으로 둔갑한 사기에 빠져 희망을 잃고 있다. 부업 사기는 국가와 플랫폼의 감시망을 교묘히 피해 많은 피해자들을 양산 중이다. 아시아경제는 부업 사기의 확산과 피해자의 고통을 따라가보려고 한다. 기자가 직접 문의해보니"안녕하세요, 부업에 관심 있나요?" 지난달 28일 본지 기자의 카카오톡으로 한 연락이 왔다.기자가 사회관계망서비스(SNS) 인스

  • 25.12.0513:09
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 김용태 국민의힘 의원(12월 4일) "계엄 1년, 거대 두 정당 적대적 공생하고 있어""장동혁 변화 임계점은 1월 중순. 출마자들 가만있지 않을 것""당원 게시판 논란 조사, 장동혁 대표가 철회해야""100% 국민경선으로 지방선거 후보 뽑자" 소종섭 : 김 의원님, 바쁘신데 나와주셔서 고맙습니다. 김용태 :

  • 25.12.0415:35
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 강전애 전 국민의힘 대변인, 김준일 시사평론가(12월 3일) 소종섭 : 국민의힘에서 계엄 1년 맞이해서 메시지들이 나왔는데 국민이 보기에는 좀 헷갈릴 것 같아요. 장동혁 대표는 계엄은 의회 폭거에 맞서기 위한 것이었다고 계엄을 옹호하는 듯한 메시지를 냈습니다. 반면 송원석 원내대표는 진심으로

  • 25.11.2709:34
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"
    윤희석 "'당원게시판' 징계하면 핵버튼 누른 것"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 윤희석 전 국민의힘 대변인(11월 24일) 아시아경제 '소종섭의 시사쇼'에 출연한 윤희석 전 국민의힘 대변인은 "장동혁 대표의 메시지는 호소력에 한계가 분명해 변화가 필요하다"고 진단했다. 또한 "이대로라면 연말 연초에 내부에서 장 대표에 대한 문제제기가 불거질 것"이라고 내다봤다. 한동훈 전

  • 25.11.1809:52
    홍장원 "거의 마무리 국면…안타깝기도"
    홍장원 "거의 마무리 국면…안타깝기도"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 마예나 PD 지난 7월 내란특검팀에 의해 재구속된 윤석열 전 대통령은 한동안 법정에 출석하지 않았다. 특검의 구인 시도에도 강하게 버티며 16차례 정도 출석 요청에 응하지 않았다. 윤 전 대통령의 태도가 변한 것은 곽종근 전 육군 특수전사령관이 증인으로 나온 지난달 30일 이후이다. 윤 전 대통령은 법정에 나와 직접

  • 25.11.0614:16
    김준일 "윤, 여론·재판에서 모두 망했다" VS 강전애 "윤, 피고인으로서 계산된 발언"
    김준일 "윤, 여론·재판에서 모두 망했다" VS 강전애 "윤, 피고인으로서 계산된 발언"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이미리 PD■ 출연 : 강전애 전 국민의힘 대변인, 김준일 시사평론가(11월 5일) 소종섭 : 이 얘기부터 좀 해볼까요? 윤석열 전 대통령 얘기, 최근 계속해서 보도가 좀 되고 있습니다. 지난해 국군의 날 행사 마치고 나서 장군들과 관저에서 폭탄주를 돌렸다, 그 과정에서 또 여러 가지 얘기를 했다는 증언이 나왔습니다. 강


다양한 채널에서 아시아경제를 만나보세요!

위로가기