深度学习集群平台系统 (XJD2024042900007) 采购公告
深度学习集群平台系统 (****) 采购公告
发布时间:2024-05-01 18:19:18
深度学习集群平台系统 | 项目编号**** | |
2024-05-01 18:19:18 | 公告截止日期2024-05-02 12:00:00 | |
**** | 付款方式货到安装、调试、验收合格后,付全款。 | |
发布竞价结果后7天内签订合同 | 到货时间要求发布竞价结果后2天内送达 | |
币种 | 人民币 | |
**省**市**区**** | ||
无 |
采购清单 1
深度学习集群平台系统 | 1.00 | 无 |
不限 |
不限 |
1.规格参数指标:(1)理论浮点计算能力43968Gflops; 并行环境:MPICH2等并行计算环境; 数值计算环境:包含有1700多个用于工程和科学应用的数学函数。系统采用intel最新架构并发处理器,并发处理器数需要2颗,处理器核心数量48个;基础频率2.7Hz基础频率3.5HZ;(2)数据指标:并行云系统采用高效数据系统,由于需要提供处理器直接数据读取,工作频率至少需要3200MHz,可分配容量每个处理核心至少需要16GB的容量;(3)存储容量:为方便使用,需配置热插拔硬盘背板(12Gbps)读写,2TB的企业级固态系统盘,作为热备份需要部署备份软件支持秒级切换阵列接口需要16口,前段硬盘损坏无差别替换不影响主体业务;可大数据高速存储至少12TB u.2数据中心级服务器高速存储硬盘,Sequential Read5,500 MB/s’6,200 MB/sKCU61;(4)网络双控存储:最大可安装24块3.5寸硬盘支持后期扩容1PB;向下级联,最大支持256块SAS/SATA盘 ;网络双控存储备份:为保证数据安全部署Active-Standby;(5)GPU:8张NVIDIA 4090 涡轮官方显卡 ;(6)网络接口:Intel 82599 双口万兆网口,200GB Intel OPA 高速网卡,含线缆模块;(7)设备外观:机架式准系统,配带原装上架导轨。板载32个内存插槽;可前置24个2.5英寸SATA/SAS/SSD/U.2硬盘,存储部分可安装24块3.5寸硬盘;集成系统管理芯片,支持IPMI2.0、KVM over IP、虚拟媒体等管理功能,支持Redfish;可选TPM国际通用安全模块;(8)供电模块:为了确保平台的稳定可靠运行,需要提供冗余供电模块;支持大于等于10个双宽GPU卡,GPU连接拓扑。 2.产品特性:(1)平台能够处理大规模的机器学习任务。通过将机器学习任务分解成多个子任务,并利用并行处理能力,可以同时处理多个任务,从而提高任务的效率和吞吐量;(2)可通过虚拟化技术,创建虚拟环境,将机器学习场景映射到虚拟机中进行模拟。虚拟化技术能够隔离不同的机器学习实例,提供独立的计算环境,确保机器学习过程的可靠性和安全性;(3)同时支持多用户的协同工作。用户可以通过平台进行实时交流和协作,共享任务**、数据和结果。使用网络协作的方式促进了团队**和知识共享,提高了机器学习任务的效率和质量;(4)具备弹性计算的特性,能够根据用户需求进行**调配。根据机器学习任务的规模和复杂度,平台可以动态分配计算**,确保机器学习任务能够在最短的时间内完成,提高计算效率和灵活性;(5)数据安全由于机器学习过程中会产生大量的数据,平台提供了高效的数据管理系统,能够对机器学习数据进行存储、处理和分析。这样的数据管理能力为用户提供了更方便、可靠的数据支持,帮助用户更好地理解机器学习结果和做出决策。由于计算机机器学习技术可以重复进行无限次模拟实验,因此可以得出不同的结果,各种结果相互比较。 3.软件开发环境:需要完成并行超算云服务线下**和公有云的结合使用。(平台搭建并行云计算),完成网络系统配置。:Parallel cloud集群管理系统 V3.0,含三年期 并行云 授权,安装调试完毕现场核验,集群软件需要与主机厂家为同一品牌。具体功能如下:(1)**虚拟化:采用轻量级容器虚拟化技术,实现对 CPU、内存、磁盘等**的虚拟化和统一管理。针对人工智能领域的特定需求,提供异构计算**管理接口,实现异构计算**的虚拟化统一管理,支持为容器以直通方式挂载异构计算**;(2)容器管理:支持将创建的容器在线进行镜像打包,并支持将打包好的镜像上传镜像仓库,实现镜像版本的持续更新;(3)模型训练:允许用户上传自定义的代码程序和数据文件,通过在线提交计算**需求即可启动训练任务,支持单机多卡和多机多卡的训练任务。支持在 Web 界面通过、VNC 客户端直接访问虚拟环境。支持通过 VScode 等工具进行远程调试;(4) 作业监控:支持输出损失率、准确率等动态可视化监控图表,同时支持输出训练过程日志,并提供日志查看功能;(5)版权:管理软件必须是国产,且为保证集群系统运行的稳定兼容性,必须与计算节点硬件品牌一致。 4.配置大模型 AI 加速模组,支持主流大语言模型 Llama 2、Moss、Stable Diffusion、ChatGLM-6B 的训练和推理,能达到模型的快速收敛效果;预装支持多模态 AI 模型的运行库,可快速启动训练和推理任务;离线预装载完整版主流大语言模型库,保证模型完整的前提下可以进行百亿参数规模的模型训练和推理;预装专业 AI 加速库,在不影响快速收敛的前提下可以对 Transformer 模型中的参数进行精度优化;提供定制的 WEB UI 调参界面,支持浏览器中对模型做参数微调;AI 对话内容支持流式输出,并保存为文本文件提供 MPI 并行计算环境、浮点计算数学库及相关编译工具。提供网络文件系统和并行计算系统设置及维护。提供网络安全、系统配置服务,常规 Linux 使用介绍等。 |
所有产品质保3年免费上门保修服务,3 小时内到客户现场,24 小时内解决硬件故障问题; 必须具备3 小时内提供备用卡;确保兼容性和稳定测试3个月,如果不满足需求随时可退货。 |
相关公告
招标导航更多>>
工程建筑
交通运输
环保绿化
医疗卫生
仪器仪表
水利水电
能源化工
弱电安防
办公文教
通讯电子
机械设备
农林牧渔
市政基建
政府部门
换一批