类脑融合智算开发、调度及管理一体化系统定制软件招标公告
2024 年 12 月 3 日,****发布《类脑融合智算开发、调度及管理一体化系统定制软件》招标公告,预算 2,554,000.00 元。
项目目标:本次项目用于类脑智能计算的**虚拟化、并行计算工具链、分布式高并发存储管理系统、**调度、云端智能应用开发环境建设,可提供类脑智能计算硬件设备的驱动识别、**管理、开发工具和部署环境。
建设内容包括但不限于如下服务内容:
1、开发面向类脑智能算力的编程接口和编程库,提供异步计算模式,支持多个算力实例的并行编程和分布式计算。
2、需完成对类脑智能算力设备的 K8S 和 Slurm 调度的适配支持。
3、提供对类脑智能算力设备的**管理和实时状态监控,并提供完善的命令行和 API 接口。
4、构建基于容器的在线交互式开发环境。
5、支持类脑智能算力节点的动态**伸缩,支持数据跨节点远程调用。
6、提供高性能内存管理及多级持久化分布式存储支持。
详细技术要求:
1.实现多流的类脑计算编程 API,实现多线程使用多张类脑智能算力设备(计算卡),线程可自由切换计算卡;API 分为计算功能和同步功能,计算功能API不阻塞,同步功能可阻塞并确保获取最终结果。
2.基于多流模式的单机多卡编程 API,可支持单机多张卡联合仿真一个类脑模型,编程 API 支持获取多卡之间的拓扑信息,在 API 内部实现多卡通信、同步和仿真,不需要用户处理多卡同步。
3.实现 Kubernetes 的类脑智能算力设备分配器和 docker 容器运行时。要求与需求方当前 Kubernetes 兼容适配,支持当前集群管控类脑智能算力设备,用户可通过 Kubernetes 提交、运行、和监控使用类脑计算卡的容器任务,可通过 Kubernetes 监控类脑设备的健康状态。
4.实现 Slurm 的类脑智能算力设备枚举插件,支持 slurm 调度器的 slurmd 进程自动发现和报告类脑智力设备,用户可通过标准 slurm 命令行提交使用类脑计算卡的任务。
5.提供命令行枚举单服务器上所有 PCIe 接入的类脑智能算力设备,显示设备列表、设备 PCI 信息及其它必要的基本信息。
6.提供客户端类脑芯片统一架构函数库,需支持多版本类脑智能算力设备接口,其中包括:神经元状态信息存取, 神经突触连接信息存取,支持获取类脑智能算力设备温度的接口,支持 OTA 升级的接口和适配不同规模的仿真模型。
7.提供一种类脑智能算力设备的集群**管理和监控 API,可显示集群中的类脑设备总数量、已分配数量和空闲数量,可显示每个节点 BPU 卡的总数量、已分配数量和空闲数量。
8.提供基于 Jupyter 的交互式开发容器的 Docker 镜像,内置类脑智能算力设备管理工具和类脑开发套件,同时类脑智能算力设备映射进入开发容器。
9.实现分布式内存对象存储系统的类脑数据访问 RESTful API 和编程库,提供内存级延迟的数据访问性能。
10.分布式内存对象系统实现位置信息服务,负责管理维护共享内存节点成员关系。支持自动检测节点故障、节点加入、节点离开;位置信息服务同时维护共享内存中对象数据与节点的映射关系,实现 API 接口查找对象所在节点位置。
11.分布式内存对象实现基于类脑智能算力设备位置信息的访问服务,支持任意节点本地写入,从任一节点读取任意对象数据,并缓存在本地,加速后续读取操作。
12.实现内存对象存储的分级持久化:基于本地共享内存的对象系统,实现基于本地 NVMe 后端持久化存储,对 NVMe 线性空间进行分配和释放;将共享内存中的对象数据,基于空间或时间策略异步持久化到本地 NVMe;将仿真数据从内存对象持久化到远端分布式共享集群存储;实现 FLUSH 语义做主动持久化操作,实现命令行查看分层情况。
中标结果
2024 年 12 月 26 日发布中标结果,**** 2,460,000.00 元(中)。
评审结果:
截图202********314.png
招标导航更多>>
工程建筑
交通运输
环保绿化
医疗卫生
仪器仪表
水利水电
能源化工
弱电安防
办公文教
通讯电子
机械设备
农林牧渔
市政基建
政府部门
换一批