加入收藏 | 设为首页 | 会员中心 | 我要投稿 宿州站长网 (https://www.0557zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

MindSpore一周年升级巨量新特性

发布时间:2021-04-20 16:10:57 所属栏目:业界 来源:互联网
导读:根据江门站长网 Www.0750Zz.Com报道 度学习中,当数据集和参数量的规模越来越大,训练所需的时间和硬件资源会随之增加,最后会变成制约训练的瓶颈。分布式并行训练,可以降低对内存、计算性能等硬件的需求,是进行训练的重要优化手段。当前 MindSpore 动态图
根据江门站长网  Www.0750Zz.Com报道


度学习中,当数据集和参数量的规模越来越大,训练所需的时间和硬件资源会随之增加,最后会变成制约训练的瓶颈。分布式并行训练,可以降低对内存、计算性能等硬件的需求,是进行训练的重要优化手段。当前MindSpore 动态图模式已经支持数据并行,通过对数据按 batch 维度进行切分,将数据分配到各个计算单元中进行模型训练,从而缩短训练时间

基于 ResNet50 v1.5+ImageNet 数据集测试,在昇腾计算硬件平台,MindSpore 动态图模式分布式的表现,可以达到 PyTorch 典型分布式场景的 1.6 倍, 静态图模式分布式的表现也可以达到 TensorFlow 典型分布式场景的 2 倍。

PyNative 快速入门:

数据预处理加速 Dvpp

数据是机器学习的基础。在网络推理场景中,我们需要针对不同的数据进行数据的预处理,从中过滤出核心信息放入我们训练好的模型中进行推理预测。在实际应用场景中,我们往往需要对大量的原始数据进行推理,比如实时的视频流等。因此,我们在昇腾推理平台引入了Dvpp 模块来针对网络推理数据预处理流程进行加速

Dvpp 数据预处理模块提供 C++ 接口,提供图片的解码、缩放,中心抠图、标准化等功能。在 Dvpp 模块的设计中,考虑到整体的易用性,其功能与 MindData 现有 CPU 算子有重叠,我们将其 API 统一,通过推理执行接口设置运行设备来进行区分。用户可以根据自身硬件设备环境来选择最佳的执行算子。Dvpp 数据预处理流程如下图所示:

 coco2017 推理数据集 40504 张图片进行推理,最终得到模型输入尺寸为 [416, 416] 的图片。

我们分别使用 Dvpp 算子和 CPU 算子进行数据预处理,得到如下性能对比:

可以看到 Dvpp 系列算子相较于 CPU 算子在处理大量数据时性能优势明显,在本实验中处理 40504 张图片性能 FPS 提升 129%

查看教程:
 

二、创新性

分子模拟库(SPONGE),来自社区分子动力学工作组

MindSpore 版的 SPONGE 是在社区中的分子动力学工作组 (MM WG) 中,由北大、深圳湾实验室高毅勤课题组与华为 MindSpore 团队联合开发的分子模拟库,具有高性能、模块化等特性。

为何需要开发 SPONGE?

分子动力学模拟是用牛顿定律近似来描述微观原子和分子尺度演化的计算机模拟方法。其既可用于基础科学研究也可用于工业实际应用。在基础科学领域,分子动力学方法有助于科研学者从微观研究体系的物理化学性质。

在工业生产中,其可以利用大规模计算的能力辅助药物分子的设计和蛋白靶点的搜寻 [1,2]。由于模拟的时间和空间尺度限制,传统分子动力学软件的应用范围受到较大限制。科研工作者也在不断的开发新的力场模型[3,4]、抽样方法[5,6] 以及尝试结合新兴的人工智能 [7,8] 来进一步拓展分子动力学模拟的适用领域。

由此,新一代的分子动力学软件就需要被提上日程。其应该具有模块化的特性,能够支持科学家高效的创造和搭建出能够验证其理论模型的结构。同时,它还需要兼顾传统模拟方法的高效性,能够兼容其在传统领域上的使用。此外,为实现

(编辑:宿州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读