服务器、存储、网络产品购买热线:400-860-6708 ERP、管理软件购买热线:400-018-7700云服务产品销售热线:400-607-6657
AIStation 训练平台 AIStation 是浪潮自主研发的人工智能开发平台,面向深度学习开发场景,整合计算资源、数据资源以及AI开发环境,实现计算资源统一分配调度、训练数据集中管理并加速、模型流程化开发训练,为AI 研发构建敏捷高效的一体化平台。支持具有资源池化特性的GPU服务器,可以实现跨节点资源分配,便于云平台GPU池化管理。
  • 产品介绍

产品功能

  

训练数据管理

  - 统一管理个人数据及开发数据集,支持数据共享协同

  - 对接企业数据存储系统,支持NFS、HDFS、BeeGFS等文件系统

  - 支持文件上传、下载、压缩、解压、新建和删除等

  - 支持用户访问及下载权限设置,保证数据安全可靠

  01

  

AI计算资源集中管理调度

  - GPU服务器及GPU卡池化管理,使用状态一览展示

  - GPU资源使用情况实时统计分析

  - 开发用户按需申请资源、动态分配

  - GPU多维细粒度调度

  - 智能化资源调度策略

  02

  

GPU性能监控

  - AI服务器性能及状态监控,CPU利用率、MEM利用率、网络IO、IB流量、磁盘分区、节点负载

  - GPU性能监控,GPU利用率、显存利用率、时钟频率、功耗、温度、

  -  存储系统及磁盘分区使用监控,各用户存储使用量监控

  03

  

AI计算资源运维管理

  - 实时统计用户组/用户资源使用

  - 实时查看计算节点资源占用情况

  - 管理员控制各用户资源使用配额

  - 管理员快速清理回收资源,再分配

  04

  

交互式模型开发训练过程

  - 集成主流AI开发框架

  - 打通数据集、计算资源、框架工具

  - 提供丰富完整的AI开发工具链

  - 对接pycharm、vscode等IDE工具

  05

  

分布式训练任务编排

  - 不同深度学习框架模板,通过模板快速提交训练任务

  - 多机分布式任务跨节点自动分配计算资源,自动编排计算进程

  - 按需申请计算资源的CPU核数和GPU卡数内存和训练集等

  - 提供CLI方式任务提交及管

  06

产品特性

GPU多维细粒度分配解决人多卡少,资源利用率提高30%以上

AIStation将GPU资源池化管理,其中的GPU多维细粒度分配策略可以实现一卡多人使用,并通过任务托管机制,充分利用空闲时间段进行作业,将计算资源的平均利用率提高到93%。

数据协同管理及缓存加速,训练效率提升2-3倍

AIStation提供了个人数据、协同数据和企业数据三种数据访问控制方式,既满足了数据共享、协同开发需求,又避免了多人操作导致的数据冲突、数据安全问题。AIStation通过数据缓存到本地SSD盘的高速I/O解决数据吞吐的网络延时问题。还会根据节点的数据缓存情况自动调度训练任务,从而避免训练数据重复下载,节省数据加载时间,让模型训练效率可以获得2-3倍的提升。

1分钟快速启动分布式,工作效率提高50%以上

AIStation 协助开发人员通过图形化方式1分钟以内就可快速启动分布式,另工作效率得到大幅提升。通过资源优化调度和加速分布式任务的不断优化,开发用户可以更加专注于模型开发,缩短每个任务的训练时间,使得每周完成的训练任务提高1倍以上。

容错机制,确保训练任务不间断高效运行

AIStation 对容错机制和策略进行了优化升级,任务容错的能力大幅提升。当训练任务中断时,平台可判断任务中断原因,并在30秒内自动启动,继续训练任务。

相关产品:

关于浪潮

集团简介 文化理念 荣誉资质 董事长致辞 加入我们 联系我们 关注我们

新闻与活动

新闻公告 市场活动 科技战“疫”

如何购买

需求工单 售前咨询 查找经销商

探索浪潮

通用服务器 存储 人工智能 爱城市网 浪潮云 浪潮云ERP

支持与服务

支持下载 视频中心 服务进度查询 安全通告

快速链接

合作伙伴生态 电子采购平台 投行项目 投资者关系 道德遵从

在社交媒体上关注我们

拨打咨询电话