平头哥芯片力压谷歌、英伟达再获权威测试世界第一
北京时间11月7日,MLPerf基准联盟公布首轮AI推理基准测试结果,阿里巴巴平头哥的AI芯片含光800在Resnet50基准测试中获得单芯片性能第一。
MLPerf 推理基准测试设有五个基准,每个对应四种场景,站长资源平台重点面向图像分类、对象检测和机器翻译等常见机器学习任务。测试者可以选择提交任何基准及相应场景的结果。
含光800参加了适用于图像分类任务的Resnet50 v1.5基准测试,在离线模式(Offline mode)、服务模式(Server mode)、多路模式(Multi stream mode)和单路模式(Single stream mode)四个场景都取得了单芯片第一的成绩。
离线模式测试的是芯片推理的最大吞吐量,最能考验芯片的计算、存储、通信等基本功。含光800的成绩为69306.60 IPS,单芯片性能是谷歌TPU v3的8.5倍、Nvidia T4的12倍。
MLPerf是业内首套衡量机器学习软硬件性能的通用基准,由图灵奖得主David?Patterson联合谷歌和几所著名高校于2018年发起。MLPerf基准联盟现有50多家成员,包括谷歌、微软、Facebook、阿里巴巴等企业和斯坦福、哈佛、多伦多大学等高校。
继AI训练基准v0.5、v0.6之后,MLPerf在今年6月推出AI推理基准v0.5。参加本轮推理基准测试并提交结果的公司共14家,谷歌(TPUv3)、英伟达(T4、RTX、Xavier)、英特尔(CLX 9282、NNPI-1000)、Habana(Goya)等呈现了当前AI推理系统最高水平的竞逐。
今年9月问世的含光800是阿里巴巴第一款正式流片的AI芯片,基于台积电12nm工艺生产,其性能突破得益于软硬件的协同设计:采用平头哥自研架构,有效降低内存访问延时;集成达摩院的创新算法,深度优化CNN及视觉类算法,大幅提升视觉计算效率。
含光800主要用于云端视觉场景,现已大规模应用于阿里巴巴集团内多个场景,如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。今后,含光800的算力将通过阿里云对外输出。