某部互联网开源信息挖掘分析系统采购招标公告(2025-JLZLBO-F4001)
全部类型河北保定2025年03月13日
【产品类别:】 【发布时间:****】
| 我部就以下项目进行国内询价,采购资金已全部落实,欢迎符合条件的供应商参加投标。 一、项目名称:某部互联网开源信息挖掘分析系统采购 二、项目编号:**** 三、项目概况: 系统综合利用当前主流技术,对互联网平台开源信息进行采集、处理、存储、分析和可视化展现,按照用户要求生成满足本领域需求的产品。 主要功能参数和性能参数如下: 一、功能参数 1.数据采集功能 网络爬取:使用Scrapy、BeautifulSoup或Selenium等工具进行网页内容的抓取。 API集成:利用各种社交媒体、新闻网站、论坛等提供的API接口进行数据采集。 数据源多样性:支持文本、图片等多种数据类型的采集。 2.数据处理功能 数据清洗:使用Pandas或NumPy等库进行数据预处理,包括去重、格式化、缺失值处理等。 自然语言处理(NLP):采用NLTK、SpaCy或transformers等库进行文本分词、命名实体识别等。 特征提取:使用TF-IDF、Word2Vec或BERT等技术提取文本特征。 3.数据存储功能 数据库:使用主流数据库存储结构化数据。 索引服务:使用Elasticsearch或其它技术实现数据的快速检索。 4.数据挖掘分析功能 统计分析:运用统计学方法对数据进行描述性分析和推断性分析。 机器学习:采用机器学习算 法(如神经网络模型)进行深入分析。 深度学习:引入大模型进行学习、分析。 5.数据可视化 可视化工具:使用Matplotlib或Seaborn等库进行数据可视化。 Web应用:构建基于Flask、Django或React等前端Web应用,展示分析结果。 产品生成:支持自动生成Word、PDF或Excel等格式产品。 二、性能参数 1.业务性能 (1)信息采集范围 包括公开数据(国外公开数据,如DARPA等)、百科数据(如百度等)、社交媒体(如微信公众号等)、大众媒体(如新华网等)等。 (2)数据类型 包括常见的文本、图片数据类型。 (3)响应时间 系统网页数据更新频率为不大于5分钟。 (4)内容相关度 根据关键字判断内容的相关性,爬取的内容要包含关键字或文字中心思想与关键字相关。 (5)数据安全 在处理互联网开源信息时,需要确保自身数据的安全性,包括访问控制、用户管理等安全功能。 (6)产品生成速度 根据输入指 令,按规定模板(图表、文字类)自动生成信息产品,处理10万条数据不大于1分钟,百万级不大于5分钟。 (7)多语种支持 支持中、英、俄、日、韩等常见语种翻译,语种标签监测。 2.软件性能 (1)数据采集性能 ①响应时间:正常访问情况下,系统对单个数据源单条数据采集时间不大于50毫秒。 ②并发处理:正常访问情况下,系统应能够同时处理至少8个并发数据源的采集任务。 (2)数据处理性能 ①数据清洗速度:系统应在3分钟内完成对100万条数据的去重处理(文字重合率达到90%)。 ②数据分类效率:系统应在3分钟内完成对100万条数据的分类操作。 (3)数据挖掘性能 ①算 法执行时间:系统应能够在3分钟内完成对100万条数据的关联规则挖掘(主要考虑时间、人物、地点、事件等参数)。 ②内存使用:系统在执行数据挖掘算 法时,内存使用不应超过8GB。 特别说明:功能参数和性能参数中表述为“A、B、C等”意思为必须至少包含A、B、C三种指标参数;表述为“A、B或C等”意思为可选取A、B、C其中一种或可实现该功能采用的其它技术均可。 四、投标供应商资格条件: (一)、具有企(事)业法人资格(有行业特殊情况的银行、保险、电力、电信等法人分支机构,会计师、律师等非法人组织,行业协会等社会团体法人除外); (二)、国有企业;事业单位;军队单位;成立三年以上的非外资(含港澳台)独资或控股企业; (三)、具有良好的商业信誉和健全的财务会计制度; (四)、具有履行合同所必需的设施设备、专业技术能力、质量保证体系和固定的生产经营、服务场地 (五)、有依法缴纳税收和社会保障资金的良好记录; (六)、参加军队采购活动前3年内,在经营活动中没有受到刑事处罚或者责令停产停业、吊销许可证或者执照、较大数额罚款(200万元以上)等重大违法记录; (七)、未被中国政府采购网(www.ccgp.gov.cn)列入政府采购严重违法失信行为记录名单,未在军队采购网(www.plap.mil.cn)军队采购暂停名单处罚范围内或军队采购失信名单禁入处罚期和处罚范围内,以及未被“信用中国”(www.creditchina.gov.cn)列入严重失信主体名单或国家企业信用信息公示系统(www.gsxt.gov.cn)列入严重违法失信名单(处罚期内) (八)、本项目特定资质: 无。 (九)、投标企业应当具备服务履约的能力。 五、招标文件申领时间、地点、方式 (一)申领时间: **** 至 **** ,每天上午 08:00 至 12:00 ,下午 14:30 至 18:00 (北京时间,工作日) (二)申领地址: 河北省 保定市 (三)申领方式:线下申领 (四)本项目特定资质材料: 无 六、投标受理时间及地点、方式 (一)投标受理开始时间:**** 09:00 (二)投标截止时间:**** 09:30 (三)投标地点: 河北省 保定市 (四)提交方式:现场提交 七、开标时间、地点 (一)开标时间: **** 09:30 (二)开标地点: 河北省 保定市 八、样品 采购包(1 ):不需要提交样品 九、现场踏勘 采购包(1 ):不需要现场踏勘 十、标前答疑会 不需要标前答疑 十一、本采购项目相关信息在《军队采购网》(www.plap.mil.cn)上发布。 无 十二、其他补充事宜 无 十三、采购单位联系方式 |