데이터센터 인프라 병목···새로운 기술 해법 주목구글 가세해 메모리 효율성 높이는 연구 진행 중CPU·GPU·메모리 연결하는 CXL도 관심 집중
글로벌 빅테크 구글의 '터보퀀트(TurboQuant)' 공개를 계기로 인공지능(AI) 인프라 핵심인 메모리의 효율성을 높이는 기술에 대한 관심이 커지고 있다. 메모리 공급이 수요를 따라가지 못하는 '병목 현상'이 나타나면서 새로운 해결책에 대한 필요성이 커지고 있어서다. 삼성전자와 SK하이닉스 등 국내 반도체 기업들은 물론 스타트업도 가세해 관련 시장 공략에 나선 모습이다.
AI 산업이 급속도로 성장하면서 데이터센터 내 메모리 수요는 폭발적으로 증가하고 있다. 대규모 언어모델(LLM)과 생성형 AI 서비스가 확산되면서, 연산을 담당하는 GPU(그래픽처리장치)뿐 아니라 데이터를 저장하고 불러오는 메모리 역시 핵심 인프라로 떠올랐다. 그러나 메모리 공급이 산업 현장의 수요를 따라가지 못하면서 이를 해결할 새로운 기술에 대한 필요성이 커지는 중이다.
구글의 터보퀀트가 주목받은 것도 이런 배경에서다. 터보퀀트는 AI 모델이 답변을 생성할 때 사용하는 'KV 캐시' 메모리를 압축하는 기술로, 메모리 사용량을 6배 이상 줄이면서도 성능 저하를 최소화하는 것이 특징이다. 특히 지난달 말 구글 연구진은 터보퀀트 기술 적용 사례를 소개하면서 상용화 가능성을 시사했다.
터보퀀트 확산으로 메모리 사용 효율이 획기적으로 개선될 경우, 기존처럼 대규모 메모리 증설에 의존하던 데이터센터 전략에도 변화가 생길 수 있다. 터보퀀트 공개 직후 삼성전자와 SK하이닉스 주가가 장중 급락하는 등 투자 심리가 크게 위축된 것은 여기에 기인한다. 메모리 반도체 수요 증가를 기반으로 성장해온 산업 구조가 기술 변화로 인해 흔들릴 수 있다는 우려가 반영된 것으로 풀이된다. 다만 업계에서는 이를 단순한 위기로만 보기는 어렵다는 시각도 존재한다. 메모리 효율이 개선되더라도 AI 서비스 확산 속도를 고려하면 전체 수요는 여전히 증가할 여지가 충분해서다.
다른 한편에선 메모리 효율성을 극대화하는 'CXL(컴퓨터익스프레스링크·Compute Express Link)'도 함께 주목받고 있다. CXL은 CPU, GPU, 메모리 등 데이터센터 내 주요 자원을 고속으로 연결해 공유할 수 있도록 하는 인터페이스 기술이다. 기존에는 하나의 서버마다 개별적으로 메모리를 탑재해야 했다면, CXL을 활용하면 여러 서버가 메모리를 공동으로 활용할 수 있기 때문에 자원 효율성을 크게 높일 수 있다. 터보퀀트가 데이터 용량을 줄여 메모리 사용량을 줄이는 것이라면, CXL은 메모리 효율성을 최대한 끌어올리는 기술인 셈이다.
업계에서는 CXL에 대해 현 메모리 구조의 비효율을 해소할 게임체인저로 평가한다. 기존 고대역폭메모리(HBM)를 대체한다기보다 상호 보완적 역할을 수행한다고 여긴다. HBM이 GPU 인접 영역에서 초고속 연산을 담당한다면, CXL은 시스템 전반의 용량 확장과 자원 활용 효율을 책임지는 식이다.
차세대 메모리 기술에 대한 니즈가 확장되면서 국내에서도 움직임이 활발하다. CXL은 인텔 주도로 2019년 출범한 'CXL 컨소시엄'이 표준을 관리하고 있는데, 삼성전자, SK하이닉스 등 글로벌 반도체 기업이 두루 참여하고 있다. 스타트업도 가세했다. 카이스트 정명수 교수팀이 설립한 스타트업 파네시아가 대표적이다.
업계에서는 향후 AI 모델 고도화 경쟁이 이어질수록 메모리 효율화 기술과 인프라 혁신이 동시에 필요하다고 본다. 단순한 메모리 용량 확대에서 벗어나, 자원을 얼마나 효율적으로 활용하느냐가 핵심 경쟁력으로 부상하고 있다는 얘기다. 한 업계 관계자는 "AI 시대에는 메모리를 많이 확보하는 것만큼이나 효율적으로 쓰는 기술이 중요해지고 있다"며 "데이터센터 인프라 혁신 경쟁이 본격화될 것"이라고 말했다.
관련기사
뉴스웨이 유선희 기자
point@newsway.co.kr
저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지





댓글