내년 美 최초 엑사(초당 100경 연산)급 슈퍼컴 출현 기대에 찬물
밥 스완 인텔 CEO, 장황한 패키징 기술 설명하며 GPU 외주 암시
시한내 개발 역부족···TSMC 맡겨도 성능 문제 발생 불가피 우려
지난 2018년 제온칩 기반 180페타 오로라 불발이어 또 무산 위기

미 에너지부 산하 아르곤국립연구소는 지난 2015년 인텔칩 기반의 오로라(사진)를 2018년까지 제온파이 칩을 사용해 180페타플롭스까지 성능을 확대해 납품하는 계약을 맺었지만 이에 실패했다. 이후 2021년까지 엑사플롭스급 슈퍼컴을 구축키로 했지만 이또한 실패할 위기에 내몰리고 있다는 지적을 받고 있다. (사진=위키피디아)

인텔이 7나노미터 반도체 생산공정 1년 연기를 공식화하면서 미국 정부가 야심차게 추진해 온 ‘오로라’ 슈퍼컴 구축 계획에도 차질이 빚어지게 됐다.

인텔은 7나노 공정에서 ‘폰테 베키오’라는 그래픽칩(GPU)을 생산해 오로라 슈퍼컴에 탑재할 계획이었다. 그러나 7나노 공정 팹 구축 지연에 따라 이 GPU 생산도 불발될 가능성이 높아졌다.

인텔은 공정 일부를 외주로 돌릴 가능성을 비추고 있지만 외주 생산을 하더라도 성능 차질이 불가피해 보인다. 오로라 슈퍼컴퓨터는 미국 에너지부가 야심차게 밀어붙이고 있는 미국 최초의 엑사플롭스급(1엑사플롭스=초당 100경 회 부동소수점 연산속도) 슈퍼컴으로 전세계의 관심이 모아지고 있는 기종이다. 인텔의 7나노팹 지연이 한 기업의 기술 실패를 넘어 미국 국가슈퍼컴 프로젝트의 한 축을 위협할 지경에 이르렀다.

HPC와이어는 지난달 30일(현지시각) 밥 스완 인텔 최고경영자(CEO)가 2분기 실적발표회에서밝힌 이 회사 7나노공정 구축 지연이 미 에너지부 주도로 아르곤국립연구소에 구축중인 오로라 슈퍼컴 프로젝트 정상 준공에 차질을 빚을 가능성 높다고 지적했다.
 
◆7나노 공정 지연에도 첨단 패키징 기술 등으로 부정적 영향 완화

밥 스완 CEO는 지난달 23일 실적발표회에서 7나노미터 반도체 생산공정 팹 구축을 1년간 늦추며 이에 따라 CPU 신제품 출시 타이밍도 이전 예상일과 비교해 약 6개월 정도 순연될 것이라고 밝혔다.

그는 “일차적 문제는 수율(정상품 생산비율) 저하를 초래한 7나노미터 공정의 결함 모드”라고 털어 놓았다. 그는 “우리가 이 문제의 근원이며 근본적 장애물은 없다고 생각한다”며 “그러나 우리는 추가 일정의 불확실성에 대비하기 위해 비상계획에도 투자했다. 다이 세분화, 첨단 패키징 등 설계 방법 개선을 활용함으로써 공정 지연이 제품 일정에 미치는 영향을 완화했다”며 투자자들을 안심시켰다.

그러나 인텔은 내심 그리 여유로울 수만은 없을 것으로 보인다.

보도에 따르면 인텔은 7나노미터 반도체 생산공정 차질(지연)로 내년 말까지 아르곤 국립 연구소(ANL)에서 오로라 (Aurora)21 슈퍼컴퓨터 가동 계획까지 차질을 빚게 할 가능성이 농후하다.

인텔은 미 에너지부가 발주한 오로라21 슈퍼컴 구축 주 계약업체로서 HPE/크레이와 함께 슈퍼컴을 제작중이다. 인텔은 여기에 자사의 10나노공정 ‘사파이어 래피드’ 제온 CPU, 그리고 데이터센터용 7나노 GPU인 ‘Xe(엑스이)’(코드명 ‘폰테 베키오·Ponte Vecchio’)를  사용하게 된다. 
 
미국 엑사급 슈퍼컴 프로그램의 선두주자인 오로라 슈퍼컴의 핵심칩이 될 폰테 베키오 GPU는 동시에 인텔의 데이터센터 GPU 시장 진출을 선언하게 될 상징적 프로세서다. 이 GPU는 또한 인텔의 첫 7나노 제품을 과시하는 칩이라는 의미도 갖는다. 

그런데 이 칩의 독자 생산 어려움과 함께 부분적 외주 제작 가능성이 예고되고 있다. 문제는 그에 따른 부정적 영향이다.

◆TSMC에 다이 공정 등 부분 외주 맡겨

현재 폰테 베키오의 출시는 “2021년 말 또는 2022년 초”로 예정돼 있으며 인텔은 적어도 GPU의 일부 요소에 대해 외부 팹들과 협력하고 있다.

이와관련, 밥 스완 인텔 CEO는 지난달 말 2분기 실적발표회에서 “우리는 향후 프로세스 기술 로드맵에 지속적으로 투자하겠지만, 우리 프로세스에서든 외부 파운드리를 이용하든, 또는 이 두 프로세스를 조합하든 우리 고객에게 가장 예측 가능성과 성능을 제공하는 프로세스 기술을 구현하는 데 실용적이고 객관적일 것이다. 우리의 세분화된 아키텍처와 결합된 첨단 반도체 패키징 기술은 고객에게 가장 적합한 프로세스 기술을 사용할 수 있는 엄청난 유연성을 제공한다. 일례로 우리의 데이터센터 GPU로 설계된 ‘폰테 베키오’는 이제 2021년 말이나 2022년 초에 출시될 예정이며, 세계를 선도하는 첨단 패키징 기술과 결합된 외부 및 내부 공정 기술을 활용한다”고 말했다.

스완은 “인텔 기반의 첫 번째 7나노 제품은 2022년 말이나 2023년 초 나올 클라이언트 CPU가 될 것”이라고 말했다.

HPC와이어는 “첫 번째 인텔 기반 7나노미터 제품은 자연스럽지 않지만 인텔 기반으로 제품이 아닌 공정을 수정해 만들어질 것이며, 인텔 7나노 노드가 1년 후에나 준비될 것이기 때문에 최소한 GPU 다이 부분은 확실히 인텔의 7나노 노드에서 만들어지지는 않을 것으로 보인다”고 전했다. 또 인텔이 긴급 대응계획의 일환으로 폰테 베키오 GPU를 TSMC에 맡길 것이라는 추측이 나온다고 덧붙였다.

오로라용 GPU 공정 일부 외주 가능성 시사 

보도는 에너지부의 오로라 슈퍼컴에 대해 확정시켜 놓은 성능 및 전력사용 목표, 그리고 2021년 말 또는 2022년 초의 기간을 감안할 때 TSMC의 5나노 노드가 유력한 폰테 베키오 외주 제작 후보군이라고 전하고 있다.

앞서 스완은 실적 발표를 하면서 폰테 베키오에 대해 “외부 및 내부 프로세스 기술 활용”이라고 언급했다. I/O 다이와 GPU 다이(및 메모리 스택)는 서로 다른 노드에서 구현할 수 있다는 얘기다. AMD 경우 이를 에픽 CPU(Epyc CPU)로 수행한다. 예를 들어 로마(Rome)는 7나노 CPU 코어와 14나노 I/O 다이를 사용한다.

스완은 “원래 폰테 베키오의 아키텍처는 I/O 기반 다이, 통신, GPU 및 일부 메모리 타일을 포함하며, 모두 함께 패키징돼 있다. 그것이 폰테 베키오의 설계다. 처음부터 우리는 일부 타일을 내부에, 다른 타일을 외부에 두었다. 그리고 우리가 어떻게 다른 디자인을 하나의 패키지에 혼합하고 일치시키는지에 대한 증거로서 패키징 기술을 활용했다. 처음부터 이런 디자인이었다...디자인 세분화는 우리에게 많은 융통성을 주었다”고 말했다.

이어 “우리는 기술개발을 진행해 나가면서 폰테 베키오를 소개할 것인지에 대해 생각해 볼 수 있다…나는 내가 그 타일들 중 몇 개는 처음부터 내부와 외부에 있다고 말했다고 생각한다. 우리는 이제 개발을 더 진행해 나가면서 타일 중 하나(의 생산)를 타사 파운드리로 교체할지 여부를 평가할 수 있다. 다시 말하지만 그것은 우리에게 훨씬 더 많은 옵션성과 유연성을 제공하는 이 변화와 디자인 방법론의 아름다움과 가치다. 그러니까 (폰테 베키오 GPU공정 로드맵에서)미끄러질 경우 우리는 우리가 직접 다 만들기보다는 뭔가를 살 수 있다”고 덧붙였다.

스완은 GPU의 세분화된 설계에 긍정적으로 장황하게 설명하고 있지만 인텔이 실행할지도 모르는 다른 업체에 GPU 컴퓨팅 다이 제작 외주를 주는 일은 사소한 변화가 아니라는 지적과 우려를 낳고 있다.  

인텔의 라자 코두리가 SC19에서 발표한 오로라 노드 디자인. 사진=인텔
인텔의 라자 코두리가 SC19에서 발표한 오로라 노드 디자인. 사진=인텔

공정 노드는 폰테 베키오 GPU의 성능 및 에너지 목표와 직접 관련이 있으며, 더 나아가 이  GPU가 대부분의 성능을 제공하고 파워 수요의 상당 부분을 구동하는 오로라 슈퍼컴 시스템과 연관되기 때문이라는 분석이 나온다.

이런 가운데 밥  스완 CEO는 “지금 진행하면서, 우리는 폰테 베키오를 소개할 것인지에 대해 생각해 볼 수 있다… 그 타일들 중 몇 개는 처음부터 안과 밖에 있다고 말한 것 같다. 이제 앞으로 타일 중 하나를 타사 파운드리로 교체할지 여부를 평가할 수 있다. 다시 말하지만, 그것은 우리에게 훨씬 더 많은 옵션성과 유연성을 제공하는 이 변화와 디자인 방법론의 아름다움과 가치다. 그러니까 공정표 같은 게 있을 경우에는 우리가 직접 다 만들기보다는 뭔가를 살 수 있는 것이다”라고 말하고 있다.

미국 최초의 엑사급 슈퍼컴 시대 열어줄 오로라는?

오로라는 미국의 엑사플롭스급(1엑사플롭스=1초에 100경 회 부동소수점 연산속도)슈퍼컴 구축 계획의 중심에 있다. 지난 2017년 공급된 180페타플롭스(1테라플롭스=초당 1000조 부동소수점 연산)급 오로라 슈퍼컴을 업그레이드하는 6억달러(7200억원)가 투자되는 엑사플롭스 급 슈퍼컴이다. 인텔이 확약을 하지는 않았지만 오로라21로 알려진 이 슈퍼컴이 구축되면 미국 최초의 엑사급 슈퍼컴이 될 것이란 기대를 한몸에 모으고 있다.

미 아르곤국립연구소의 오로라 슈퍼컴은 오크리지 국립연구소가 HPE 및 AMD와 함께 구축하는 1.5엑사플롭스(최소 피크 성능) ‘프런티어(Frontier)’ 슈퍼컴과 함께 2021년 말 구축을 목표로 개발되고 있다.

그러나 지난달말 인텔 CEO의 발표로 이처럼 인텔의 오로라용 핵심 GPU 생산이 불확실해지면서 오크리지가 미국 최초의 엑사급 슈퍼컴 연구소로 나설 확률이 높아졌다. 로런스 리버모어 국립연구소도 HPE 및 AMD와 함께 2022년 말 2엑사플롭스(피크 성능) 성능을 제공할 ‘엘 캐피탄(El Capitan)’을 배치할 예정이다. 세 시스템 모두 HPE의 크레이 샤스타(Cray Shata) 아키텍처를 사용한다.

오로라는 원래 지난 2015년에 프리-엑사스케일(pre-exascale) 슈퍼컴퓨터로 구상됐다. 미 에너지부는 코랄 계약을 통해 2018년까지 아르곤국립연구소에 인텔 제온파이 나이츠힐 CPU와 옴니패스 조립기술 기반의 180페타플롭스(피크 성능) ‘오로라’ 슈퍼컴을 요구했다. 그러나 인텔이 제온파이칩으로 이 슈퍼컴 성능을 실현하지 못하면서 계획은 백지화됐고, 결국 제온파이와 옴니패스 개발도 취소됐다. 이 계약은 수정돼 결국 엑사급 슈퍼컴 개발로 확장돼 체결됐다. 우리나라 KISTI가 보유하고 있는 슈퍼컴 5호기도 인텔 제온파이칩 기반으로 구축된 슈퍼컴퓨터다.

인텔은 2021년 하반기부터 10나노미터 사파이어 래피드를 출하하기 시작하며, 2023년 상반기 로드맵 상 ‘인텔 기반 7나노 데이터센터 CPU’가 나온다고 보고했다.

인텔의 7나노미터 팹 공정 지연 발표와 인텔의 2분기 재무건전성 강세는 큰 대조를 이뤄 눈길을 끌고 있다.

이 회사의 2분기 매출액은 전년 동기 대비 20% 증가한 197억 달러를 기록했다. 데이터센터 매출이 34% 증가해 전체 매출의 52%를 차지했다. 월스트리트저널(WSJ)에 보도된 대로 이익은 22% 증가한 51억1000만달러를 기록했지만 7나노공정 팹 지연 소식에 주가는 18%나 폭락하며 3분기 가이드라인을 낮췄고 여전히 회복되지 않고 있다.

한편 우리나라의 삼성전자와 세계 1위 파운드리(반도체 위탁생산)업체인 대만 TSMC는 5나노미터 공정 팹 생산 기술을 갖고 있다.

[관련기사] 올해 세계 HPC시장 –3.7%···내년 반등해 5년 평균 7.1% ↑

[관련기사] "인텔 쇼크"...7나노 공정 지연속 사면초가

키워드 관련기사
  • 엔비디아-플로리다大, AI 기반 슈퍼컴 공동개발 착수
  • 美 USC, “슈퍼컴 없이 워크스테이션 한 대로 심층강화학습” 증명
  • 美 ‘국가 AI연구클라우드’ 추진···중국 AI패권 저지 목적