![]() |
产品功能
训练数据管理
- 统一管理个人数据及开发数据集,支持数据共享协同
- 对接企业数据存储系统,支持NFS、HDFS、BeeGFS等文件系统
- 支持文件上传、下载、压缩、解压、新建和删除等
- 支持用户访问及下载权限设置,保证数据安全可靠
AI计算资源集中管理调度
- GPU服务器及GPU卡池化管理,使用状态一览展示
- GPU资源使用情况实时统计分析
- 开发用户按需申请资源、动态分配
- GPU多维细粒度调度
- 智能化资源调度策略
GPU性能监控
- AI服务器性能及状态监控,CPU利用率、MEM利用率、网络IO、IB流量、磁盘分区、节点负载
- GPU性能监控,GPU利用率、显存利用率、时钟频率、功耗、温度、
- 存储系统及磁盘分区使用监控,各用户存储使用量监控
AI计算资源运维管理
- 实时统计用户组/用户资源使用
- 实时查看计算节点资源占用情况
- 管理员控制各用户资源使用配额
- 管理员快速清理回收资源,再分配
交互式模型开发训练过程
- 集成主流AI开发框架
- 打通数据集、计算资源、框架工具
- 提供丰富完整的AI开发工具链
- 对接pycharm、vscode等IDE工具
分布式训练任务编排
- 不同深度学习框架模板,通过模板快速提交训练任务
- 多机分布式任务跨节点自动分配计算资源,自动编排计算进程
- 按需申请计算资源的CPU核数和GPU卡数内存和训练集等
- 提供CLI方式任务提交及管
服务器、存储、网络产品购买热线:
ERP、管理软件购买热线:
云服务产品销售热线:
浪潮网络售后热线: