寒武纪官方详解云端 AI 芯片思元 370( 三 )
* 测试环境:
MLU370-S4:NF5468M6/2x Intel Xeon Gold 6330 CPU @ 2.0GHz/MagicMind v0.6
GPU 数据来自于相关产品官网。
MLU370-S4 加速卡在解码方面具有强劲竞争力,相较于同尺寸 GPU,可提供 3 倍的解码能力和 1.5 倍的编码能力。总体而言,MLU370-S4 加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。
文章插图
▲ 寒武纪 MLU370-X4 加速卡
MLU370-X4 加速卡的优势则表现为高性能,算力可达 256TOPS (INT8),加强了 FP16、FP32 的计算性能,新增 BF16 计算类型。
在 Cambricon Neuware SDK 上实测,常用的 4 个深度学习网络模型中,MLU370-X4 加速卡与市场主流 150W GPU 相比,性能表现 2 项持平 2 项更优,实测能效则为 GPU 的 2 倍。比如 YOLOv3 网络中,MLU370-X4 的性能是 150W GPU 性能的 1.5 倍,能效为 GPU 的 2.5 倍。
文章插图
▲ 相比主流 GPU 产品,MLU370-X4 性能领先
* 测试环境:
MLU370-X4:NF5468M6/2x Intel Xeon Gold 6330 CPU @ 2.0GHz/MagicMind v0.6
GPU 数据:ResNet-50 来自于相关产品官网,Transformer、VGG16、YOLOv3 均取自实测最大吞吐性能。
文章插图
▲ MLU370-S4、MLU370-X4 加速卡规格
推荐阅读
- 政策|浙江省“抢人”:创业失败贷款不用还?官方回应来了
- 天玑|OPPO首款平板外观官方曝光;vivo高管暗示天玑9000旗舰很快登场
- s12|获得KPL官方认证的轻薄影像旗舰?vivo这一步跨得有点大
- 性能|AMD R7 6800U 核显官方测试:性能超英伟达 MX450
- 8g+256g|男子花7900元买了台二手手机,价格还比官方新机贵,店家:现在都是加价拿货
- supervooc|OnePlus Nord CE 2 官方渲染 4K 分辨率泄露
- 新闻稿|美通社再度成为世界移动通信大会(MWC)的官方合作伙伴
- 官方|华为开卖官方二手机,售价2999元起,消费者能否买账?
- 荣耀|官方:荣耀Magic4系列将于MWC大会发布
- iFixit|iFixit拆解Steam Deck,并将正式出售来自Valve官方的替换零件