统一信息编码:(略)
某院对分布式图数据分析平台项目进行需求意向公示。
一、项目基本情况
图数据反映了实体之间的关联关系,对图数据(略)。分布式图数据分析平台项目针对海量图数据的存储和计算,能够提供基础的图数据存储查询功能,以及复杂的图分析计算功能,同时提供可视(略)。项目预算金额48.5万元,交付期限为合同签订之日起的30个工作日,交付地点为河南省郑州市金水区俭学街7号。
二、采购方式
本项目拟采取公开招标的方式组织招标。
三、采购金额
(略)元
四、投标人资质要求
4.1 具有独立的法人资格,有独立承担民事责任的能力,在中华人民共和国注册并合法运营,且为非外资独资或外资控股的企(事)业单位;法定代表人及实际控制人不得为非中华人民共和国国籍或具有境外永久居留权(含港澳台);
4.2 具有良好的商业信誉和健全的财务会计制度;
4.3 具有履行合同所必需的设备和专业技术能力;
4.4 有依法缴纳税收和社会保障资金的良好记录(军内(略));
4.5 不在军队装备采购部门或政府采购主管部门暂停参加装备采购或政府采购活动的处罚期内;未被军队装备采购部门或政府采购主管部门列入禁止参加采购活动黑名单;
4.6 供应商法人代表(单位负责人)为同一人或者存在直接控股、管理关系的不同供应商,不得同时参(略),生产场地为同一地址的,一律视为有直接控股、管理关系;
4.7 参加本次采购活动前3年内,在经营活动中(略),并且未发生过重(略)
4.8不接受联合体投标。
五、技术指标
1. 总体要求
支持分布式存算分离架构,元数据管理服务、计算服务、存储服务可分别部署至不同节点,并支持存储服务和计算服务独立扩缩服务个数达到扩缩容的能力。
支持基于基础的图查询能力,包括图遍历,子图(略)
支持复杂图分析图计算能力,包括全图计算(略)
支持提供可视化工具,可以拖拉拽的形式进行图探索和分析;
支持shared-nothing分布式存储,集群每个节点都可同时提供读写服务;
支持将图元素按边切割的方式存储在不同的数据分片上;
支持数据的实时持久化存储;
支持对集群以节点为单位进行在线水平扩缩容;
支持(略),实时写入的数据在集群任一节点都可实时读取;
入图数据自动分片,采用多分片和多副本的机制提升可用性和可扩展性,从而应对数据量不断增加场景下的高可用要求。
2. 基础功能
基础功能模块需(略),并提供图数(略)。包含以下功能:
★支持批量在线导入,无需停止或重启节点服务且导入时不影响数据库集群正常使用;
★支持多台机器并行导入,批量导入数据效率不应少于300w点边/s;
★支(略)JSON, ORC, Parquet, Oracle, MySQL, PostgreSQL, HBase, Hive, MaxComputer, ClickHouse, Kafka, Pul(略)
★支持通用JDBC数据导入;
★支持点、边、属性的管理;
★支持外挂ES功能,提供全文索引能力。
★支持存储层使用S3对象存储。
★支持一个(略),支持克隆图空间,删除(略)
★支持一个点拥有多个标签,每个标签有不同的属性。
★支持相同起点和终点之间插入多条相同方向、相同类型的边;
★支持数值型、字符串型、布尔型、日期型、地理位置型属性类型;
★支持点、边的TTL设置;
3. 图查询
★支持除OpenCypher,Gremlin之外的自研图查询语言,支持图遍历查询;
★支(略),从指定(略)
★支持在查询语句中定义变量,并将该变量传递给另一条语句;
★支持通过管道符(|)将多个查询语句组合起来;
★支持查看语(略),详细显示执行步骤和扫描计算信息;
★支持查看(略)。
★支持对属性的精确及模糊搜索;
★支持常见的数值、比较、字符串、布尔等运算符;
★支持数据函数、聚合函数,字符串函数、(略)
★支持geo函数,用于生成地理位置数据类型的值或对其执行操作,如对存在地理位置信息的数据,可按经纬度查询;
4. 图计算
图系统除了需要满足即时图查询之外,还需要支持对于复杂关系分析及图计算算法的能力,比如挖掘全图或子图的潜在路径、社团划分、中心性、相似性等特征。
★支持独(略)
★支持针对图数据库内数据或CSV文件中数据进行图计算,计算结(略)
★支持All Path、Shortest Path(最短路径)、Single Source Shortest Path(单源(略))、All Pairs Sh(略) Path(全图最短路径)等路径算法;
★支持Louvain(鲁汶)、Label Propagation(标签传播)、Connected Components(联通分量)、Strongly Co(略) Components(强联通分量)、Triangle Counting (三角形计数)、Clustering Coefficient(聚集系数)、Hanp(标签传播进阶版)、K-core等社区发现类算法;
★支持Ja(略) Similarity(杰卡德相似度计算)算法;
★支持Node2Vec图神经网络算法;
★支持Page(略)(页面排序)、Betweenness Centrality(中介中心性)、Closeness Centrality(紧密中心性)、Degree Centrality(度中心性)等至少8种以上图计算常用算法,以上算法均需实现分布式计算。
5. 工作流
需支持可通过工作流的方式动态组合图查询、图计算组件来满足复杂图分析任务。
ê支持新增、查看、修改、删除、对比、克隆、生命名工作流;
ê支持查询组件和多种算法组件,可以搜索、新(略)
ê支持查看作业列表、进度、结果、日志、以及重跑作业;
ê支持搜索工作流或作业。
6. 高可用
作为一款底层(略),图数据库的高可用能力是不可获缺的。
★支持分布式架构,图数据集群不存在单点局部故障导致整体不可用;
★支持数据可实时写入硬盘,保证数据不丢失;
★支持内存水位限制,内存水位高于触发阈值时,停止接受查询;
★支持快照管理,用于保存集群当前时间点的数据状态,当出现数据丢失或误操作时,可以通过快照恢复数据;
★支持同城、异地多数据中心容灾部署,支持数据在多数据中心间自动同步;
★支持全量、增量数据备份恢复。
7. 客户端及生态工具
为了不同环境的用户访问和管理图数据库,需要支持丰富的客户端工具,此外如能提供齐全的大数据、机器学习生态工具也是大有裨益的。
★支持C++、Java、Python等客户端。
★支持图数据库(略)
★提供Spark连接器工具,支持跟Spark的对接;
★提供F(略),支持跟Flink的对接;
★提供Kafka连接器工具,支持跟(略)
★提供D(略),支持跟DGL的对接。
8. 可视化
图数据库产品对(略),好的可视化能力能大大降低工具使用门槛,提高工具使用效率、提升工具分析能力。
★提供一个可视化界面,用户可通过拖拽的方式生成图查询语句并进行查询;
★支持使用可视化界面配置方式串联图查询和图计算组件,零代码使用(略),将图查(略),以界面配置的方式加强对业务的支持。
★支持在图形化工具中定义Schema、节点、边、Properties等元数据;
★支持针对画布上的点选择属性进行展示;
★支持对于画布上展现的子图运行常用图算法,并查(略)
★支持点击画布上的节点进行拓展,并设置条件:(略)
★支(略)图等多种算法布局图;
★支持对画布上数据进行孤立点检测、环检测;
★支持图数据2D、3D可视化,支持图空间的3D鸟瞰;
★支持将画布上保存为快照并在下一次使用时导入继续探索;
★支持给定两个点id,可视化选择最短路径、全路径查询,且可以选择遍历的边类型、通过边上的属性筛选过滤、设置遍历步数;
★支持选定多个点,并展示共同邻居。
9. 运维管理
系统运维管理是所有IT系统的必要能力,一款好的企业级运维管理工具能大大降低运维成本,减少(略),提升用户体验。
★提供包括安(略)文档;
★支持在可视化界面进行数据平衡、扩容缩容等操作;
★支持管(略) 14 天內集群的操作记录;
★支持可视化集群搭建和导入,支持多集群管理。
★支持在可视化页面进行服务启动、停止、重启操作;
★支持可视化监控集群中所有机器的状态,包括 CPU、内存、负载、磁盘和流量;
★支持查看当前以及历史的慢查询的语句、消耗时间、执行计划等;
★支持(略),能生成巡检报告,并对常见巡检不合格项提出整改建议;
★支持除Linux物理机部署外,可以(略) Docker上进行部署;
★支持集群监控的可视化大屏展示;
★支持对不同用户分配不同角色,针对不同(略)
★支持不同用户下的安全访问、权限操作、日志管(略)
★支持(略)。当服务出现故障时,可以帮助用户在无直连网络的情况下快速定位问题和分析原因。
10. 性能要求
属性图数据导入性能指标,使用LDBC-SNB SF1000基准测试数据集(相关资料参考https://github.com/ldbc/ldbc_snb_datagen_spark),应满足如下指标:顶点导入性能不低于100万个顶点/秒/节点,边不低于100万条边/秒/节点,数据落盘速度不低于150GB/小时/节点。
查询性能指标,使用LDBC-SNB SF100基准测试数据集(相关资料参考https://github.com/ldbc/ldbc_snb_datagen_spark),三节点图数据库集群,100并发用户下,应满足如下指标:一跳查询QPS 10w+ ,两跳查询QPS 3k+ ,三跳查询QPS 80+。
性能指标读写混合场景,将1000万行数据并行导入三节点图数据库集群,同时进行50,100并发的查询,查询结果、数据导入正常且性能无明显衰减。
六、采购需求建议
所有符合以上条件并愿意参加此项目投标的投标人请于2024年01月05日起到2024年02月01日止,每日上午9:00时至12:00时,下午14:00时至17:00时(北京时间,公休日及节假日除外)与东风国际招标有限公司(略)联系,在(略)东风国际招标有限公司一楼递交采购需求建议书。
七、采购需求对接
2024年02月02日09时(北京时间),在河南省郑州市高新区中原国家广告产业园3号楼11楼11-208室组织采购需求对接,所有递交采购需求建议书的潜在投标人都可以参加。
八、联系方式
联系人:(略)
电话:(略)
地址:(略)
邮编:(略)
Email:(略)