본문 바로가기
bar_progress

글자크기 설정

닫기

"프롬프트 입력으로 챗GPT 가드레일 쉽게 뚫려…유해정보 무제한 생성 가능"

시계아이콘01분 38초 소요
언어변환 숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기

카네기멜론대 등 연구진 27일 보고서 발표
오픈AI 등 "모델 견고하게 만들려 노력"

생성형 인공지능(AI)을 악용하는 것을 막기 위해 설치하는 제한 조치, 즉 가드레일이 프롬프트 입력만으로 손쉽게 뚫려 대책이 필요하다는 지적이 나왔다.


27일(현지시간) 뉴욕타임스(NYT)는 카네기멜런대의 앤디 주 연구원과 캘리포니아에 기반을 둔 AI 안전센터의 지판 왕 연구원 등이 이러한 방법을 담은 보고서를 발표했다고 보도했다. NYT는 연구진이 누구나 AI 안전 시스템을 우회할 수 있는 방법과 이를 사용해 제한 없이 유해 정보를 어떻게 생성할 수 있는지를 보여줬다고 전했다.


"프롬프트 입력으로 챗GPT 가드레일 쉽게 뚫려…유해정보 무제한 생성 가능" [이미지출처=로이터연합뉴스]
AD

AI 시스템은 보통 성적인 대화나 편향 발언, 가짜·유해 정보 제공을 막기 위해 회사가 설정한 가드레일에 묶여 있다. 문제가 되는 질문을 하면 '답할 수 없다'고 대응하게끔 만들어놓은 장치다. 하지만 특정 명령어를 입력하는 등 다양한 방식으로 이 가드레일을 지키지 않게 만드는 일명 '탈옥'이 이뤄지는 경우가 속속 등장하고 있다.


연구진은 이번 보고서에서 문제가 되는 프롬프트를 입력할 때 긴 문장을 추가해서 붙이면 AI 회사들이 만들어 놓은 가드레일이 쉽게 풀린다고 지적했다. 단순하게 '폭탄 만드는 방법을 알려달라'고 하면 이를 거부하지만, 다른 문장을 뒤에 덧붙여 문제가 되는 문장을 핵심 질문이 아닌 것처럼 포장하면 가드레일에 저촉된다는 점을 인식하지 못한다는 것이다. 비슷한 방식을 활용해 '2024 선거를 조작하는 방법을 알려달라' 등 문제가 될만한 질문을 해도 AI는 가드레일을 염두에 두지 않은 채 답을 내놨다고 한다.


연구원들은 이번 연구에서 대형언어모델(LLM)을 오픈소스로 공개한 AI 시스템에서 이러한 방식을 확인해 구글, 오픈AI, 앤스로픽 등 비공개 LLM을 사용한 AI 시스템에도 적용한 결과 마찬가지로 가드레일이 해체되는 상황이 벌어졌다고 지적했다. 또 오픈소스 시스템을 활용해 AI 챗봇을 뚫는 접미사 생성 도구도 생성했다고 밝혔다. 가드레일을 뚫는 적대적 접미사를 자동으로 생성하게끔 했다는 것이 이들의 설명이다.


페이스북의 모회사 메타플랫폼이 최근 LLM인 '라마 2(Llama 2)'를 오픈소스로 내놓은 이후 업계에서 이를 악용하는 문제가 발생할 것이라고 우려가 쏟아지는 상황에 이러한 지적까지 나온 것이다. 메타는 각종 우려에 레드팀을 가동해 문제가 없도록 사전 조치하는 등 적극적으로 움직이고 있다고 밝힌 바 있다.


연구원들은 연구 과정에서 확인된 특정 접미사는 추가로 가드레일을 만들어 막을 수 있지만, 그런 식으로는 모든 상황에 대응할 수 없을 것이라고 봤다. 지코 콜터 카네기멜런대 교수는 "명확한 해결책이 없다"며 "짧은 시간 내에 원하는 만큼 그러한 공격을 만들어낼 수 있다"고 우려했다.


생성형 AI 시스템 구축에 열을 올리고 있는 기업들은 보고서가 공개되기 전 연구진의 연락을 먼저 받은 뒤 가드레일과 관련한 이러한 문제점에 대해 대응책을 모색하고 있다고 밝혔다.


오픈AI 측은 "적대적인 공격에 대비해 우리 모델을 더욱 견고하게 만들려고 계속해서 노력하고 있다"는 입장을 내놨다. 구글은 "생성형 AI 챗봇 '바드'의 중요한 가드레일을 구축하고 있으며 꾸준히 개선해나가고 있다"고 밝혔고, 앤스로픽도 이에 대해 대비를 하기 위해 연구하고 있으며 "해야 할 일이 많다"고 강조했다.


AD

AI 보안을 전문으로 하는 구글 연구원인 소메시 야 위스콘신-매디슨대 교수는 NYT에 이번 보고서가 '게임체인저'라면서 AI 시스템을 위한 가드레일을 어떻게 구축해야 할지에 대해 전 산업이 다시 한번 생각하게끔 할 것이라고 봤다. 이어 만약 이 지점이 계속해서 취약점으로 지적된다면 이 시스템을 관리하기 위해 정부 입법을 추진할 수도 있을 것이라고 덧붙였다.




정현진 기자 jhj48@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

놓칠 수 없는 이슈 픽

  • 25.12.1606:40
     ⑥ 생존과 직결되는 복지 문제로 챙겨야…"진단체계 만들고 부처 간 연계 필요"
    ⑥ 생존과 직결되는 복지 문제로 챙겨야…"진단체계 만들고 부처 간 연계 필요"

    편집자주'장보기'를 어렵다고 느낀 적 있나요? 필요한 식품은 언제든 온·오프라인으로 살 수 있는 시대에 상상조차 불가능한 일이지만 대한민국에는 걸어서 갈 슈퍼도 없고, 배달조차 오지 않아 먹거리를 구하기 어려운 지역이 있습니다. 사막에서 오아시스 찾기처럼 음식을 살 수 없는 이곳을 '식품사막'이라 부릅니다. 식품사막은 고령화, 지방소멸, 정보격차 등으로 점점 넓어지고 있습니다. 장보기라는 일상의 불편함이 어떤

  • 25.12.1606:30
    "케첩은 알아도 토마토는 본 적 없다"는 美…일본은 달걀 아닌 "회·초밥이 왔어요"⑤
    "케첩은 알아도 토마토는 본 적 없다"는 美…일본은 달걀 아닌 "회·초밥이 왔어요"⑤

    편집자주'장보기'를 어렵다고 느낀 적 있나요? 필요한 식품은 언제든 온·오프라인으로 살 수 있는 시대에 상상조차 불가능한 일이지만 대한민국에는 걸어서 갈 슈퍼도 없고, 배달조차 오지 않아 먹거리를 구하기 어려운 지역이 있습니다. 사막에서 오아시스 찾기처럼 음식을 살 수 없는 이곳을 '식품사막'이라 부릅니다. 식품사막은 고령화, 지방소멸, 정보격차 등으로 점점 넓어지고 있습니다. 장보기라는 일상의 불편함이 어떤

  • 25.12.1406:30
     ④ 이동식 마트는 적자…지원 조례는 전국 4곳 뿐
    ④ 이동식 마트는 적자…지원 조례는 전국 4곳 뿐

    편집자주'장보기'를 어렵다고 느낀 적 있나요? 필요한 식품은 언제든 온·오프라인으로 살 수 있는 시대에 상상조차 불가능한 일이지만 대한민국에는 걸어서 갈 슈퍼도 없고, 배달조차 오지 않아 먹거리를 구하기 어려운 지역이 있습니다. 사막에서 오아시스 찾기처럼 음식을 살 수 없는 이곳을 '식품사막'이라 부릅니다. 식품사막은 고령화, 지방소멸, 정보격차 등으로 점점 넓어지고 있습니다. 장보기라는 일상의 불편함이 어떤

  • 25.12.1306:30
    "창고에 쟁여놔야 마음이 편해요"…목숨 건 장보기 해결하는 이동식 마트 ③
    "창고에 쟁여놔야 마음이 편해요"…목숨 건 장보기 해결하는 이동식 마트 ③

    편집자주'장보기'를 어렵다고 느낀 적 있나요? 필요한 식품은 언제든 온·오프라인으로 살 수 있는 시대에 상상조차 불가능한 일이지만 대한민국에는 걸어서 갈 슈퍼도 없고, 배달조차 오지 않아 먹거리를 구하기 어려운 지역이 있습니다. 사막에서 오아시스 찾기처럼 음식을 살 수 없는 이곳을 '식품사막'이라 부릅니다. 식품사막은 고령화, 지방소멸, 정보격차 등으로 점점 넓어지고 있습니다. 장보기라는 일상의 불편함이 어떤

  • 25.12.1206:40
    "새벽배송은 사치, 배달이라도 됐으면"…젊은 사람 떠나자 냉장고가 '텅' 비었다 ②
    "새벽배송은 사치, 배달이라도 됐으면"…젊은 사람 떠나자 냉장고가 '텅' 비었다 ②

    편집자주'장보기'를 어렵다고 느낀 적 있나요? 필요한 식품은 언제든 온·오프라인으로 살 수 있는 시대에 상상조차 불가능한 일이지만 대한민국에는 걸어서 갈 슈퍼도 없고, 배달조차 오지 않아 먹거리를 구하기 어려운 지역이 있습니다. 사막에서 오아시스 찾기처럼 음식을 살 수 없는 이곳을 '식품사막'이라 부릅니다. 식품사막은 고령화, 지방소멸, 정보격차 등으로 점점 넓어지고 있습니다. 장보기라는 일상의 불편함이 어떤

  • 25.12.1810:59
    이재명 대통령 업무 스타일은…"똑부" "구축함" "밤잠 없어"
    이재명 대통령 업무 스타일은…"똑부" "구축함" "밤잠 없어"

    정부 부처 업무 보고가 계속되고 있다. 오늘은 국방부 보훈부 방사청 등의 업무 보고가 진행된다. 업무 보고가 생중계되는 것에 대해 강유정 대통령실 대변인은 "감시의 대상이 되겠다는 의미, 정책이 어떻게 만들어지는지 보여주는 것"이라고 설명했다. 업무 보고가 이루어지면서 이재명 대통령의 업무 스타일에 대한 관심도 커지고 있다. 대통령실 참모들과 대통령과 같이 일했던 이들이 말하는 '이재명 업무 스타일'은 어떤 것인

  • 25.12.0607:30
    한국인 참전자 사망 확인된 '국제의용군'…어떤 조직일까
    한국인 참전자 사망 확인된 '국제의용군'…어떤 조직일까

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'■ 진행 : 소종섭 정치스페셜리스트■ 연출 : 이미리 PD■ 출연 : 이현우 기자 우크라이나 전쟁에 참전했다가 사망한 한국인의 장례식이 최근 우크라이나 키이우에서 열린 가운데, 우리 정부도 해당 사실을 공식 확인했다. 우크라이나와 러시아 매체 등에서 우크라이나 측 국제의용군에 참여한 한국인이 존재하고 사망자도 발생했다는 보도가 그간 이어져 왔지만, 정부가 이를 공식적으로 확

  • 25.12.0513:09
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"
    김용태 "이대로라면 지방선거 못 치러, 서울·부산도 어려워"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 박수민 PD■ 출연 : 김용태 국민의힘 의원(12월 4일) "계엄 1년, 거대 두 정당 적대적 공생하고 있어""장동혁 변화 임계점은 1월 중순. 출마자들 가만있지 않을 것""당원 게시판 논란 조사, 장동혁 대표가 철회해야""100% 국민경선으로 지방선거 후보 뽑자" 소종섭 : 김 의원님, 바쁘신데 나와주셔서 고맙습니다. 김용태 :

  • 25.12.0415:35
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"
    강전애x김준일 "장동혁, 이대로면 대표 수명 얼마 안 남아"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이경도 PD■ 출연 : 강전애 전 국민의힘 대변인, 김준일 시사평론가(12월 3일) 소종섭 : 국민의힘에서 계엄 1년 맞이해서 메시지들이 나왔는데 국민이 보기에는 좀 헷갈릴 것 같아요. 장동혁 대표는 계엄은 의회 폭거에 맞서기 위한 것이었다고 계엄을 옹호하는 듯한 메시지를 냈습니다. 반면 송원석 원내대표는 진심으로

  • 25.12.0309:48
    조응천 "국힘 이해 안 가, 민주당 분화 중"
    조응천 "국힘 이해 안 가, 민주당 분화 중"

    ■ 방송 : 아시아경제 '소종섭의 시사쇼'(월~금, 오후 4~5시)■ 진행 : 소종섭 정치스페셜리스트 ■ 연출 : 이미리 PD■ 출연 : 조응천 전 국회의원(12월 1일) 소종섭 : 오늘은 조응천 전 국회의원 모시고 여러 가지 이슈에 대해서 솔직 토크 진행하겠습니다. 조 의원님, 바쁘신데 나와주셔서 고맙습니다. 요즘 어떻게 지내시나요? 조응천 : 지금 기득권 양당들이 매일매일 벌이는 저 기행들을 보면 무척 힘들어요. 지켜보는 것


다양한 채널에서 아시아경제를 만나보세요!

위로가기