比特大陆全球首发SOPHON系列张量处理器和解决方案

11月8日,比特大陆(BITMAIN)联合创始人、CEO詹克团先生受邀做了名为“AI驱动的又一个星球级计算”的主题演讲,全面介绍了AI在未来的星球级别计算的宏大数据和应用,正式宣布BITMAIN的AI品牌SOPHON(算丰),宣布全球首款张量加速计算芯片BM1680的震撼面世,以及板卡SC1/SC1+、智能视频分析服务器SS1等重量级产品的量产出货。

同时,BITMAIN在大会现场展示了芯片、板卡、服务器等系列产品,并展示了视频图像分析、人脸人体检测的演示。并同步发布了SOPHON.AI官网,并将系列产品在官网中面向全球发售。

人工智能计算架构的未来


近年来,伴随着数据需求的急剧膨胀、深度学习算法和计算技术的突破,人工智能在全球范围内掀起了一股新的浪潮,人工智能为行业带来了深刻的变革,但同时也为IT产业带来了巨大的挑战,随着人工智能计算的需求剧增,现有计算架构遭遇功耗墙、性能墙、内存墙、摩尔定律趋缓等挑战,迫切需要计算架构的创新。


“人工智能驱动了又一个星球级的计算体量,也驱动新的计算架构创新。在感知智能方面如图像、视频、语音、自然语言的识别和理解方面,人工智能应用越来越深入,并不断推动着行业的智能化变革。”BITMAIN CEO詹克团表示。


“作为一家出身于数字货币芯片和设备的公司,同时也是世界上最大的比特币矿机芯片公司,BITMAIN坚定的看好AI在各行业应用场景落地,驱动行业智能化。”


“入场人工智能领域,是BITMAIN的重要一步。从研发数字货币芯片、矿机到设立矿池,比特大陆自主研发,自主布局完善产业链。而现在,是BITMAIN进军人工智能行业的最佳时机。BITMAIN致力于通过强大的芯片工程、快速迭代和系统设计制造能力,提供最具性价比、最具性能功耗比的AI计算力,同时致力于为行业定制、优化全栈的硬件和系统方案,从而极大降低行业+AI的难度,促进AI普及。


比如我们今天发布的完整的服务器产品SS1,基于自主研发的芯片和板卡,集成了视频智能分析算法,用户可以开箱即用的方式实现人脸人体检测、视频智能分析功能,通过调用算法API的方式,快速的实现系统集成到视频大系统。同时SC1板卡等产品也对外发售,客户可根据官方API进行二次开发”


比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片




全球首发SOPHON TPU芯片BM1680、SOPHON SC1和SC1+板卡


SOPHON TPU芯片BM1680,面向深度学习应用的张量计算加速处理的专用定制芯片,适用于CNN、RNN、DNN等深度神经网络的推理预测(Inference)和训练(Training)。


BM1680单芯片能够提供2TFlops单精度加速计算能力,芯片由64 NPU构成,特殊设计的NPU调度引擎(Scheduling Engine)可以提供强大的数据吞吐能力,将数据输入到神经元核心(NeuronProcessor Cores)。BM1680采用改进型脉动阵列结构。片上32MB SRAM拥有高带宽,在片外有DDR4内存接口,单芯片可支持高达16GB DDR内存。


通过高度定制的BMDNN Chip link芯片链路技术,在高速SerDes上提供稳定,灵活,低延迟的链路,可以使多个BM1680芯片一起工作,作为一个统一的系统,可以提供更高的处理能力。
比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片

BM1680芯片架构图(摘自BM1680 DATASHEET文档)

比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片



基于BM1680芯片,BITMAIN提供Sophon SC1和SC1+的板卡产品。其中SC1 拥有一颗高性能的BM1680芯片,而SC1+ 则是双BM1680级联架构,芯片之间通过高速SerDes Chiplink互联,为深度学习计算带来全新的加速体验。
比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片


SC1 / SC1+ 板卡实物图
SC1和SC1+的架构类似,都通过PCIE的总线连入系统。具备高达2TFlops / 4TFlops的单卡计算能力(单精度),单芯片On ChipSRAM高达32MB,较大的SRAM适合装载整个神经网络模型。同时在板卡上搭载16GB 或32GB DDR4内存,大容量存储适合存储较大的神经网络模型。

比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片

板卡实物图
SC1/SC1+规格参数一览:

比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片



SOPHON芯片和板卡的软件接口和全栈软件支持


SOPHON拥有软硬件全栈开发的能力,和各个层次的工具链能力,从硬件、驱动、指令集、线性代数加速核心数学库,RUNTIME库,BM Deploy的Inference部署工具,FFT加速库,深度学习框架(Caffe,Darknet,Tensorflow,MXNet等)。真正实现了软件、硬件的协同设计和一体化的优化,实现深度学习应用在硬件上的最佳优化性能。
比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片




SOPHON SS1智能视频分析服务器


智能视频分析服务器SOPHON SS1,是一款新的深度学习服务器。基于BITMAIN最新研发的SOPHON SC1/SC1+深度学习加速卡和对于图像识别算法的深度理解而打造的深度学习服务器,专门为视频监控、互联网图像等多种应用场景提供强大的深度学习加速能力。


SOPHON SS1提供了一整套针对视频和图像识别技术的深度学习解决方案。系统核心组件是两张SOPHON SC1(或SC1+)深度学习加速卡,通过PCIE接口实现与应用系统的连接。SS1的应用系统基于X86 CPU打造,以供启动、存储管理及深度学习SDK协调之用。SS1的整个系统被浓缩进一个4机架单位(4U)机箱中,集电源、冷却、网络、多系统互联及文件系统于一体,客户可以在此基础上实现快速的二次开发或系统集成,最大程度上方便了用户对深度学习系统的利用。
实物图如下:

比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片

SS1具备的几大特点:
l为应用场景而定制的Turn Key开箱即用的方案
l高性能的异构计算优化,异构协同
l首个为深度学习预测/推理而优化的软硬件CoDesign方案
l强大的工程和研发团队支持
l数据中心级别的硬件品质
l向用户开放全部的软件源代码
规格参数如下:

比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片



SOPHON 视频分析AI应用展示


SOPHON SS1服务器集成的人脸/人体检测、机非人视频结构化分析等等DEMO,展示行业应用方案能力场景,落地视频分析安防行业方案。展示 人检测,车检测等等。BITMAIN也将快速快速迭代的视频结构化API。
比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片


比特大陆全球首发SOPHON系列张量处理器和解决方案
文章图片




SOPHON板卡和服务器,在官网SOPHON.AI面向全球发售


全球官网SOPHON.AI已经全面发布,客户可以了解最新的产品、方案信息。并发布板卡产品SC1规格和发售价:



SC1
SC1+
搭载芯片
1颗BM1680
2颗BM1680
计算力
2TFlops FP32
4TFlops FP32
板卡接口
PCIE X8
PCIE X8
功耗
85W
150W
发售价(官网)
4620元 (人民币)
$589 (美元)
暂未单独发售

发布服务器SS1规格和发售价:


主处理器
Intel E3 1275V6, 4 Cores, 3.8GHz (Max Turbo 4.2GHz)
深度学习加速卡
2块SC1+
发售价(官网)
30400元(人民币)
$3869 (美元)

比特大陆(BITMAIN)成立于2013年,在超高性能计算领域有强大的研发能力,成功开发并量产了多款ASIC定制芯片和整机系统,拥有先进工艺28nm,16nm,12nm的集成电路全定制设计的量产经验。其中最具代表性的是其运用在加密数字货币矿机中的BM芯片系列。据官方资料显示,比特大陆自主研发的第五代芯片BM1387是全球功耗最低、性能最高的运算加速芯片,单片每秒可完成800亿次的算法计算,量产规模达数十亿颗。


正是在加密数字芯片中的超高造诣,BITMAIN早已布局逐渐火热的人工智能领域。随着人工智能算法和应用技术的日益发展,以及专用芯片ASIC产业环境的逐渐成熟,人工智能ASIC芯片在计算领域的重要性将越发凸显。未来,BITMAIN将持续发力人工智能领域,加大AI团队的资金和人才投入,加速人工智能的发展。


在此次发布的第一代人工智能产品BM1680芯片,以及板卡、服务器等的基础上,面向未来,BITMAIN将保持创新和快速迭代,将于2018年推出基于12nm FinFET制程的性能功耗比更高的第二代、第三代SOPHON BM系列产品,加速人工智能时代的进程。
【比特大陆全球首发SOPHON系列张量处理器和解决方案】

    推荐阅读