在线留言|联系创通宝|收藏创通宝|网站地图欢迎来到广东创通宝科技有限公司官网!
24小时服务专线:13380121669 400-788-1068

安防弱电智能化系统专业服务商☑免费上门勘测现场 ☑提供针对性解决方案

聚焦创通宝,连线行业焦点

安防高清监控安装公司浅论深度学习平台的现状

作者: 创通宝 编辑: 创通宝 来源: http://www.0769chtonb.com/ 发布日期: 2018.09.05
信息摘要:
2015年以来,安防监控公司表示全球数据井喷式的爆发(年均增速都在40%以上)、GPU计算能力的飞速增长和深度神经网络算法的突破,使得并行计…

2015年以来,安防监控公司表示全球数据井喷式的爆发(年均增速都在40%以上)、GPU计算能力的飞速增长和深度神经网络算法的突破,使得并行计算变得更快速和更有效,人工智能开始全面爆发。深度学习使得机器学习拓展了人工智能的领域范围,让几乎大部分机器辅助功能都变为可能,比如无人驾驶汽车、无人机、语音识别、欺诈检测、产品推荐等方面。在图像分类、物体检测、图像语义分析、人脸识别、光学字符识别等计算机视觉领域,深度学习的应用尤为广泛,在一些场景中甚至可以比人做得更好。其中,深度学习对图像解析的突出作用使得视频监控系统得到了跨越式发展,视频监控的核心需求是在图像中准确快速地发现目标,人工智能将传统的录像回放转变为实时预警布控,为大数据分析研判提供了重要技术支撑。

深度学习的应用主要来自三个方面:巨大的标记数据样本(图像和语音)、先进的算法/模型/软件(神经网络算法CNNRNN以及深度学习框架)和高性能计算(数据样本多/模型训练时间长/参数更新快速同步)。

除了数据之外,算法和算力分别从软件和硬件两个维度撑起了人工智能平台的巨大生态。

高清监控安装公司称算法方面,目前CNN的深度学习框架主要包括:加州大学伯克利分校维护的Caffe、谷歌维护的Tensorflow、微软研究院维护的CNTK、分布式机器学习社区维护的MXNet以及百度维护的PaddlePaddle等。CNN分为模型训练和应用推理两个环节:模型训练是获取推理模型,应用推理是根据训练模型和输入数据获取计算结果,如图片分类。不同环节采用不同的计算架构:模型训练使用CPU+GPU计算架构,应用推理可以采用CPU+FPGA、计算架构等。主要因为:GPU算法实现架构成熟,适合较复杂的训练算法,FPGA可灵活实现多任务处理且运行能效更好。

深度学习

Caffe为例,其特点是上手快(模型与相应优化都是以文本形式而非代码形式给出)、模块化(设计上力求模块化,允许对新数据格式、网络层和损失函数进行扩展)、表示和分离(模型定义写进配置文件,根据网络需求调度内存)、测试覆盖(每个模块对应一个测试)、开放性(公开的代码和参考模型)

算力方面,当下实现深度学习的高性能计算硬件平台主要包括GPUASICFPGAGPU因为先发优势占据较大市场份额,FPGA正试图在云端服务器发力,ASIC难度更高但更适用于深度学习算法。算力需要具备并行性、多线程、高内存带宽等特性,而且由于数据的训练时间长,需要低功耗的硬件架构。三类平台和传统CPU平台的性能对比如下:

GPU是目前深度学习训练系统比较成熟和广泛的硬件平台,最初为处理图形而设计具备了大规模的独立神经元,相比CPU的串行逻辑,GPU更擅长高度并行的密集计算,有很多计算核心是为矩阵运算专门优化,并且CJPU为适应复杂多层网络,提供15TFLOPS的单精度浮点计算能力和900GB/s带宽。通常,训练平台采用CPU+P4/P40/P100/V100GPLT卡组建集群和数据中心,应用程序的串行部分在CPU上运行,计算任务繁重的部分由CPU加速,CPUGPU通过PCIE总线通信,此外,边缘端的推理应用可以采用Jetson方案。GPU主要通过专用编程框架CUDA软件开发,CLDA不需要借助图形学API,采用通用计算并行架构和C语言进行开发,降低了难度。

全国服务热线: 400-788-1068