采购需求概况 | 服务内容如下: 1.数据集需求: (1)Anna数据集内容:包含duxiu, ia, libgenrs_covers, magzdb, nexusstc, other_metadata, upload, worldcat, zlib, libgen_li_comics, libgen_li_fic, libgen_li_magazines, libgen_rs_fic, libgen_rs_non_fic, scihub, aa_derived_mirror_metadata, aa_misc_data等数据集的下载。 (2)提供数据清洗服务,包括格式转换、去除重复记录、处理缺失值、异常值检测与处理、数据标准化等。 (3)提供数据存储服务,提供至少960数据集文件的存储服务。 (4)提供稳定可靠的数据传输服务及数据恢复服务 2. 数据集质量要求 (1)必须保证数据的完整性,数据集需包括duxiu, ia, libgenrs_covers, magzdb, nexusstc, other_metadata, upload, worldcat, zlib, libgen_li_comics, libgen_li_fic, libgen_li_magazines, libgen_rs_fic, libgen_rs_non_fic, scihub, aa_derived_mirror_metadata, aa_misc_data所有数据; (2)必须保证数据分类的清晰度,数据集中的各个类别应有明确、标准的定义。 3. 数据集交付时间及付款条款 1)完成合同签署并搭载好网络环境后的15个工作日内支付50%预付款; 2)完成50%数据交付后的15个工作日内支付40%合同款项; 3)全部数据交付后并验收后的15个工作日内支付10%合同款项。 4、数据集验收标准 (1)数据量大于961.6TB。 (2)包含duxiu, ia, libgenrs_covers, magzdb, nexusstc, other_metadata, upload, worldcat, zlib, libgen_li_comics, libgen_li_fic, libgen_li_magazines, libgen_rs_fic, libgen_rs_non_fic, scihub, aa_derived_mirror_metadata, aa_misc_data等数据集。 (3)满足数据集质量要求。 |