2022年华为现状真实情况:深入探究MLPerf Inference v0.5基准测试的初次亮相与巨头们的激烈竞争。尽管这个基准测试还未成熟,但其在行业中的影响力已是不容忽视。平头哥和英伟达等公司在成绩公布后纷纷表示,他们都荣获了第一名。
自成立之初,MLPerf组织就致力于构建机器学习领域的标准化基准测试。为了确保这一目标得到实现,它不仅邀请了知名企业如英特尔、NVIDIA、Google和百度,还包括了所有相关企业。在技术层面上,MLPerf的基准测试虽然处于起步阶段,但其成果已经引起了业界巨人的广泛关注。
早在6月份,MLPerf组织就发布了第二个基础集——MLPerf Inference v0.5,这是一个专门用于衡量各种加速器和系统执行训练后的神经网络性能的工具。这套方法旨在成为衡量从低功耗SoC中的NPU到数据中心高性能加速器性能的一种通用标准。在此之后四个月内,MLPerf组织宣布推出首个官方结果。
尽管当前版本v0.5仍然非常不完整,只包含五个网络/基准,并且没有考虑功耗测试指标,这对于评估整体能源效率至关重要。但是,该初始版本已经吸引了一大批主要芯片公司参与,其中许多公司积极地展示他们硬件在基准测试中的表现,并向客户(以及投资者)解释为什么他们的解决方案更优越。此外,有近600份结果提交给该组织,这远远超出了预期数量,更是展现出行业对MLPerf期待,以及推理芯片市场数十亿美元潜力的增长趋势。
随着第一轮申请工作完成,MLPerf现在公布Inference v0.5的官方结果,同时,大多数(如果不是全部)主要芯片公司也开始发布与结果相关的公告或新闻稿。这些提交分布跨越40种不同的测试,每家芯片制造商都有机会找到成功方案,无论是在总吞吐量、延迟还是每个加速器吞吐量方面。这不仅反映出即使是初始版本也能覆盖很多应用场景,而且尤其适用于专用加速器,因为它们通常针对特定任务进行优化。
作为更新,目前这个套件涵盖了图像分类(ResNet50)、对象检测(ResNet34)和机器翻译任务(GNMT)的桌面/服务器版本。此外,该套件提供四种方案:单路、一路、二路、三路服务器离线模式,以及封闭分区和开放分区两种类型,以便各方能够比较不同条件下的表现。
深入分析显示,不同类型处理器,如CPU、GPU、FPGA、DSP及专用ASIC等,都参与了一系列正式意见交换。在一位代表的话中,被称作“除了神经形态和模拟系统以外,没有哪一种类型处理器错过”。当然,也包括一些意料之外的情况,比如Raspberry Pi 4及阿里巴巴含光800加速度器的事例出现。
总体而言,即使缺少功耗测评,我们可以看到几乎每家芯片制造商都能在某些类别中取得胜利,在离线模式下,看到了Google从1 TPUv3拓展到32次近乎完美扩展性的表现;NVIDIA Tesla 加速度机构列前茅;英特尔则以CPU领先;而高通骁龙855则以SoC最终成绩超过其他竞争者。
需要注意的是,这一组关于推理性能第一次发表的心得并不代表最终成绩,而是.mlperforgetests.com正在努力完善并添加更多网络类型,如语音识别等任务。此外,将会加入功耗测评,以便大家了解设计效率,因为电源效率往往决定着大规模部署规划上的关键因素。而这对于那些希望通过快速进展来提升产品并准备下一次正式测验的人来说,是一个值得期待的事情。