임주형기자
최근 데이터센터의 전기 사용량에 대한 전 세계적인 우려가 커지고 있습니다. 인공지능(AI) 수요를 감당하려면, 앞으로 글로벌 데이터센터 전력 수요는 지금보다 3배는 더 높아져야 한다고 합니다.
하지만 AI용 컴퓨팅에 앞서, 인터넷을 전기 먹는 하마로 만든 원흉은 따로 있습니다. 바로 우리가 매일같이 컴퓨터·휴대폰을 통해 누리는 이미지와 동영상들입니다. 이 둘은 글자(텍스트)보다 훨씬 많은 용량과 데이터 대역폭을 차지합니다. 그리고 영상과 이미지의 품질이 높아질수록, 우리가 인터넷에서 소비하는 전력도 기하급수적으로 늘어야만 합니다.
지금도 디지털 세계는 사진과 영상으로 가득합니다. 포털 사이트에 들어가기만 하면 고화질 사진과 영상이 금세 화면을 가득 채우지요. 유튜브, 틱톡 등 동영상 스트리밍 사이트에 접속하면 전 세계 어디서든 생생한 영상을 실시간으로 볼 수 있습니다. 우리는 어떻게 이런 문명의 이기를 누리게 됐을까요.
핵심은 '콘텐츠 전송 네트워크(Contents Delivery Network·CDN)'입니다. CDN은 거대한 용량의 데이터(즉, 이미지나 동영상)를 서비스 사용자 쪽으로 빠르게 전송하는 노드를 뜻합니다.
흔히 오늘날의 인터넷은 데이터센터를 위시한 클라우드로 이뤄져 있다고들 합니다. 하지만 데이터센터 만으론 거대한 용량 덩어리를 우리 집 컴퓨터까지 한 번에 배송하기 힘듭니다. 대역폭 부족으로 인한 병목이 생길 테니까요. 대신 서비스 제공자의 데이터센터와 서비스 이용자의 PC 사이에 다양한 CDN을 설치해 데이터 흐름을 원활히 만든 게 작금의 인터넷입니다.
덕분에 우리는 영상과 이미지를 기반으로 한 인터넷을 누리게 됐지만, 문제는 사라지지 않았습니다. CDN은 사회관계망서비스(SNS) 시대가 본격적으로 열린 2008년께부터 급성장했고, 지금은 빅테크들의 연간 사업 투자액 상당 부분을 차지합니다. 일례로 메타(페이스북)는 CDN에만 매년 10조원 이상을 지출하는 것으로 알려졌습니다.
하지만 사진과 영상의 화질은 앞으로도 갈수록 개선될 겁니다. 그럼 CDN에 투입해야 할 비용과 전기 사용량은 더 늘어납니다. 이 악순환을 어떻게 막을까요?
지금까지 해결책은 '압축'이었습니다. 현재 가장 널리 쓰이는 이미지 파일 확장자 표준인 'JPEG'가 대표적입니다. JPEG는 알고리즘을 이용해 이미지의 화질을 거의 해치지 않고 용량을 압축하는 기술입니다.
지금도 인터넷에 주로 공유되는 사진은 대개 JPEG 확장자입니다. 지금은 워낙 흔한 터라 다들 무의식적으로 JPEG를 사용하고 있지만, 이 압축 기술이 없었다면 인터넷의 '이미지화'는 훨씬 오랜 시간이 걸렸을 겁니다.
하지만 기존 알고리즘 압축 기술은 명확한 한계가 있습니다. 특히 비디오 스트리밍 기술의 발달로 인해 CDN에 대한 부하는 전례 없는 수준으로 높아지고 있습니다. 결국, JPEG를 능가하는 더 강력한 압축 기술이 필요해진 셈입니다.
아이러니하게도 또 다른 전기 먹는 하마인 AI가 차세대 압축 기술로 꼽힙니다. 이미지나 영상을 저주파 대역으로 바꾼 뒤, 주파수 형태의 파일을 다시 데이터로 변환하는 과정을 신경망 지능에 맡기는 방식입니다. 사람이 만든 기존 알고리즘과 달리 극한의 수준까지 용량을 압축할 수 있습니다.
이 기술을 처음 완성해 낸 기업은 '알파고'로 유명한 구글의 AI 전문 연구 자회사 딥마인드였습니다. 알파고에서 파생된 또 다른 신경망 지능인 '뮤제로(Muzero)'를 통해 유튜브 영상의 데이터를 극도로 압축했고, 그 결과 2022년 유튜브가 사용하는 데이터센터·CDN의 트래픽 양을 4% 억제하는 데 성공했습니다.
4%는 작은 숫자처럼 보일지 모르지만, 어마어마한 전력 사용량을 자랑하는 네트워크 세계에선 아주 약간의 개선조차 큰 도움이 됩니다. 트래픽을 억눌러 만들어낸 여유 대역폭을 다른 서비스에 투입하거나, 혹은 동일한 비용으로 더 개선된 서비스를 이용자에 제공할 수 있다는 뜻이니까요.
다른 빅테크들도 AI 압축 기술 모색에 가장 열성을 기울이고 있습니다. 일례로 애플은 지난해 '웨이브원'이라는 스타트업을 인수한 바 있습니다. 이 기업은 AI 알고리즘으로 비디오를 압축하는 기술을 개발 중인데, 향후 애플TV+ 등 애플의 스트리밍 서비스에 활용될 가능성이 있습니다.