2022年芯片行情:平头哥和英伟达如何在MLPerf基准测试中并列第一?
自去年初成立以来,MLPerf组织一直致力于建立机器学习处理器的基准测试。为了让这个行业得到普及,就像CPU一样,该组织包括了所有知名企业,如英特尔、NVIDIA、Google和百度。在技术上讲,MLPerf基准测试仍处于初期阶段,但它已经引起了巨大的关注。
早在6月份,该组织就发布了第二个基准测试集MLPerf Inference v0.5。这是机器学习推理的通用方法,将成为衡量从低功耗SoC中的NPU到数据中心高性能加速器的标准。尽管初始版本v0.5还不完整,只涵盖了五个网络/基准,并且没有包含功耗测试指标,但这次发布吸引了主要芯片公司的关注。
随着第一轮申请工作完成,MLPerf组织现在公布其Inference v0.5的官方结果。此时,大多数(如果不是全部)主要芯片公司都在发布与结果相关的公告或新闻稿。这些成果分布在40种不同的测试中,显示即使初始版本足够广泛,也能涵盖很多用例,尤其是在专用加速器的情况下,它们通常针对特定用例进行优化。
作为更新,MLPerf v0.5分为五个基准,其中两个基准实质上是其各自主基准的移动衍生产品。当前这个套件涵盖了图像分类、对象检测和机器翻译任务等多种类型。此外,还提供了四种方案:单路、多路、服务器和离线,每一种方案都有不同的表现。
更进一步的是,MLPerf提供了一些特殊分区,比如封闭分区和开放分区。封闭分区要求芯片必须达到数学上的等效性,而开放分区则允许更广泛地展示解决方案和团队独创性。
深入研究结果,我们可以看到几乎每个芯片公司都可以在某个类别中取得胜利。在离线测试中,看到了Google从1 TPUv3到32的拓展性极佳,以及NVIDIA Tesla加速器在一些测试中的领先位置;而英特尔以CPU位居榜首、高通骁龙855也远超SoC水平表现出色。
虽然这些早期版本的事项还有待完善,但对于芯片公司来说,他们现在知道自己与竞争对手所处的地位。而且,由于机器学习优化具有开放性的特点,有大量空间来优化系统,以备将来的正式测评以及设计新硬件。不久后,我们期待能把这样的测评应用到自己的设备上,并将它们转换为有意义的结果,以便比较消费级硬件,这无疑是一个令人激动的人生时刻!