인공지능(AI) 반도체 시장에서 글로벌 반도체 제조사의 판도가 바뀔 조짐이 보인다.
미국 유력 경제전문지 포춘은 영국 AI 반도체 기업 그래프코어(Graphcore)가 자사 2세대 ‘콜로서스 마크2 GC200(이하 GC200)’ IPU 탑재 서버 ‘M2000 컴퓨트 블레이드(이하 M2000)’을 성능 시험(이미지 분류)한 결과 엔비디아 GPU 내장 V100 서버보다 16배 뛰어난 성능을 입증했다고 15일 전했다.
컴퓨터 그래픽 작업용으로 설계된 엔비디아 반도체는 현재 AI 반도체 시장을 이끌고 있다. 니겔 툰(Nigel Toon) 그래프코어 대표는 “GC200은 트레이닝, 워크로드 추론을 할 때 엔비디아 A100과 비슷한 수준의 유연성을 띄었으나, IPU는 GPU 같은 대규모 배치 파일에 의존하지 않기 때문에 이러한 작업을 더 빨리 수행할 수 있다”고 말했다.
그래프코어의 M2000은 사전 주문이 가능하며 올 4분기부터 생산에 들어갈 것으로 현재 계획돼 있다. 그래프코어는 미국 마이크로소프트, 로렌스버클리국립연구소, 영국 옥스퍼드대, 프랑스 아토스, 노르웨이 시뮬라연구소 등 기업ᆞ기관을 대상으로 신제품을 납품할 예정이다.
GC200은 7㎚ 공정으로 양산될 전망이며 각 칩당 1472 프로세서 코어, 트랜지스터 594억개가 집적되어 있다. 칩 제조사는 대만 TSMC이다. 그래프코어는 2016년 창립했으며 당시 1세대 IPU를 선보였다.
GC200은 1세대 IPU 칩과 비교했을 때 총 메모리 용량이 3배로 껑충 뛴 900MB에 달하며 성능은 대략 8배 더 뛰어나다. 그래프코어의 신형 GC 200 IPU 칩 4개를 탑재한 M2000 서버는 1페타플롭(1초당 1000조회 연산 처리)에 달하는 연산 능력을 자랑한다.
뿐만 아니라 그래프코어는 M2000 서버 16개를 내장한 IPU-POD64(이하 포드64) 시스템을 선보였다. 포드64는 IPU칩 최대 6만4000개를 연결할 수 있어 데이터센터에 도입되기 좋으며 최고 16엑사플롭스(1초당 100경회 연산 처리)의 연산 성능을 구현한다.
서버간 긴밀한 연결을 위해 저지연 ‘IPU-패브릭’ 기술을 사용하고 있다. 이 기술로 통신 속도를 일정하게 유지하는 동시에 IPU 칩 10개부터 수만 개까지 확장할 수 있다. 사용자는 원하는 구성으로 CPUᆞIPU 조합을 고를 수 있으며, 그래프코어의 가상 IPU 도구를 사용해 IPU 칩 추가가 가능하다.
두 번째 AI 반도체 칩 출시를 통해 그래프코어는 AI 반도체 시장에서 엔비디아의 시장 지배력을 약화하고자 한다. 업계 관계자는 "신제품으로 그래프코어는 AI 서버 부문에서 엔비디아의 아성을 넘을 수도 있다"고 말했다.
