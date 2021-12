20개 넘는 AI 반도체 기업들 각축장

성능 정보 제각각…공정한 '경쟁의 장' 필요성 제기돼

산학 협력 'ML 커먼스' 출범 후 마련된 'ML 퍼프'

AI 모델 훈련 속도, 전력 소비 등 벤치마크 테스트

기술 경쟁은 물론 산업계 다양성에도 긍정적 영향

[아시아경제 임주형 기자] 4차산업혁명이 가속화하면서 인공지능(AI)의 중요성은 더욱 커져만 가고 있습니다. 구글, 아마존 등 거대 IT 기업은 물론 네이버, 카카오 등 국내 대표 기업들도 최고의 AI 신경망 모델을 구축하기 위해 총력을 기울이고 있습니다.

이런 때일 수록 주목받는 게 AI 알고리즘 처리에 특화된 AI 반도체입니다. 현재 전세계에는 최고의 성능을 자랑한다며 주장하는 AI 반도체 개발 기업이 20개 이상 설립돼 있습니다. 문제는 이들 중 누가 정말로 최고의 칩인지 가려낼 수 있는 기준이 없다는 데 있습니다. 이를 위해 만들어진 '공정한 AI 경쟁의 장'이 바로 'ML 커먼스(ML Commons)'가 개최는 'ML 퍼프(ML Perf)'입니다.

◆공정한 AI 경쟁의 장 'ML 퍼프'

ML 커먼스의 역사는 매우 짧습니다. 지난해 12월4일, 알리바바, 페이스북, 구글, 인텔, 엔비디아 등 글로벌 테크 기업부터 미 버클리대, 스탠포드대, 캐나다 토론토대 등 연구기관들이 의기투합해 설립했습니다.

ML 커먼스의 목적은 기계학습(머신러닝·ML)의 혁신을 가속하는 한편 공익을 위해 기술 접근성을 높이는 겁니다. 이를 위해 ML 커먼스는 최신 AI의 데이터세트, 모델, 모범사례, 벤치마크 등을 개발하고 이를 여러 기업들에게 제공하고 있습니다.

ML 커먼스가 담당하는 프로그램 중 가장 주목받는 것은 단연 'ML 퍼프'입니다. ML 퍼프는 AI 시스템의 효율성, 학습 속도 등을 공정하게 겨루는 벤치마크 테스트입니다. 이 ML 퍼프를 통해 수십개의 AI 반도체 중 무엇이 가장 뛰어난 성능을 보유하고 있는지 파악할 수 있습니다.

◆너무 다양해진 AI 반도체…중립적 정보 필요

ML 퍼프같은 투명하고 중립적인 벤치마크 테스트가 필요한 이유는 무엇일까요. 오늘날, AI 반도체를 집중적으로 개발하는 기업들의 숫자는 20개가 넘는 것으로 추정됩니다. 엔비디아, 구글, AMD, 인텔, ARM 등 익히 알려진 테크 기업들도 AI 컴퓨터 칩을 만들지만, 그래프코어, 삼바노바, 셀레브라스 등 최근 도전장을 낸 신규 스타트업들도 있습니다.

이들이 만든 반도체는 제각각 독특한 특징을 가지고 있습니다. 엔비디아의 그래픽처리유닛(GPU), 구글의 텐서처리유닛(TPU), 그래프코어의 지능처리유닛(IPU) 등이 대표적인 사례입니다.

문제는 이 컴퓨터 칩들의 실제 성능을 공정하게 겨룰 수 있는 장이 마련되지 않았다는 겁니다. 반도체 기업들은 공식 홈페이지에 나름대로 '벤치마크 성적'을 등록해 놓긴 하지만, 이런 결과들은 테스트를 주관한 기업에게 매우 유리한 조건으로 설정된 경우가 대부분입니다. AI 반도체를 구매하는 소비자들에게 있어 곧이곧대로 믿기 힘든 정보입니다.

ML 커먼스는 반도체 구매자들에겐 가장 투명한 정보를, 또 반도체 개발업체들에게는 경쟁 의욕을 고취시킬 목적으로 ML 퍼프를 만든 겁니다.

◆경쟁 촉진은 물론 산업계 다양화에도 기여

ML 퍼프가 이뤄지는 방식은 간단합니다. 주최 측은 실제 AI 산업에 쓰이는 대표적인 모델 예제를 준비합니다. 테스트에 참가하는 기업들은 자신들이 쓸 컴퓨터 장비의 구체적인 정보와 함께 모델을 처리하는데 걸린 시간, 소모된 전력 등을 기록해 제출합니다. 이 벤치마크를 통해 각 AI 컴퓨터 시스템의 특징을 보다 명확하게 파악할 수 있습니다.

ML 퍼프는 올해로 2년째를 맞이했습니다. 햇수로는 그리 오래되지 않았지만, 벌써 AI 산업계의 유명 기업들은 대부분 참가하는 치열한 경쟁의 장으로 거듭났습니다.

ML 퍼프 덕분에 반도체 구매자들은 어떤 시스템이 더 우월한 성능을 발휘하는지 명확하게 파악할 수 있게 됐습니다. 하지만 ML 퍼프의 순기능은 이 뿐만이 아닙니다. 반도체마다 각각 특성이 다르기 때문에, 처리하고자 하는 모델의 종류에 따라 적합한 반도체도 달라집니다.

예를 들어 이번 ML 퍼프에서 전반적으로 압도적인 성능을 나타낸 것은 엔비디아의 A100 GPU였습니다. 특히 GPU는 자연어 처리 모델의 일종인 'BERT'에서 세계 1위의 성적을 거뒀는데, BERT는 네이버의 챗봇 AI로 유명한 '클로바'에도 쓰인 바 있습니다.

하지만 A100이 꼭 모든 분야에서 가장 뛰어난 것은 아니었습니다. 센서를 통해 사물을 감지하는 컴퓨터 비전 기술에 쓰이는 'RESNET-50' 모델에선 그래프코어가 엔비디아를 근소한 차로 제친 것으로 나타났습니다.

즉, ML 퍼프는 어떤 시스템이 특정 AI 모델을 돌리기에 가장 적절한지 보다 명확히 보여줌으로써, AI 반도체의 공정한 경쟁은 물론 산업계의 다양성을 늘리는 데도 긍정적인 영향을 발휘하고 있는 셈입니다

임주형 기자 skepped@asiae.co.kr