湖南省健康医疗行业高质量数据集建设项目【招标计划】
全部类型湖南湘潭2025年11月19日
| 项目名称 | 湖南省健康医疗行业高质量数据集建设项目 | ||
| 招标人名称 | |||
| 投资估算 | 1800.000000 万元 | 资金来源 | 自筹 |
| 项目概况 | 主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台。(1)预训练集涵盖文本、图像、视频3种模态数据,文本数据集源数据规模≥20TB,清洗后≥2TB;图像数据集源数据规模≥25TB,清洗后≥5TB,图像≥500万张;视频数据集清洗后≥500TB, 总时长≥2万小时;清洗后的预训练集重 复率不高于50%;(2)清洗后的指令微调数据集≥45万条,重复率不高于1%;(3)测试数据集≥12万条;(4)项目建成后,数据集每年服务不少于5个大模型研发。 | ||
| 招标范围 | 主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台。(1)预训练集涵盖文本、图像、视频3种模态数据,文本数据集源数据规模≥20TB,清洗后≥2TB;图像数据集源数据规模≥25TB,清洗后≥5TB,图像≥500万张;视频数据集清洗后≥500TB, 总时长≥2万小时;清洗后的预训练集重 复率不高于50%;(2)清洗后的指令微调数据集≥45万条,重复率不高于1%;(3)测试数据集≥12万条;(4)项目建成后,数据集每年服务不少于5个大模型研发。 | ||
| 计划招标时间 | **** 00:00 | ||
| 其他 | |||
| 备注 | 本次公开的招标计划是本项目的初步安排,仅供各方提前知悉,提高招投标活动透明度,后期存在因故取消、变更的可能,具体情况以招标公告和招标文件为准 | ||