| 技术参数及配置要求 | 序号/名称 详细技术指标及功能需求 1.双路计算节点 1.机型:4U机架式平台,含安装上架导轨。 2.CPU:Intel Sapphire Rapids架构,≥2插槽,每插槽核心数≥52,主频≥2.1GHz,热设计功耗≤350W 3.内存:≥16条16GB DDR5-4800 ECC RDIMM内存,总容量≥256GB,支持内存保护、内存镜像、内存热备。 4. 硬盘:≥1块960G NVMe协议,可支持≥24个硬盘位。 5.GPU:≥8块NVIDIA GPU,CUDA核心≥5888,基础频率≥2190MHz,显存容量≥12GB,显存类型:GDDR6X,显存位宽≥192bit。 6.准系统: 芯片组:IntelR C741; 支持≥2个LGA-4677插槽,最大支持64核/128线程CPU; 支持≥10个双宽GPU; 支持≥32个DIMM插槽,最大支持8TB内存。 支持≥2块M.2 NVMe固态硬盘。 支持≥4个2700W冗余电源; 2.集群管理调度系统 1.具有服务器、网络设备、存储、供电系统等硬件监控功能,并能实时显示集群各硬件资源信息。 2.具有硬件故障、系统状态、供电状态等各类信息的报警功能,能提供邮件、短信、声光等多种通知方式。 3.支持远程管理系统资源,提供远程开关机功能。 4.支持查询全集群所有节点的进程信息(如所属用户、进程名、父进程、所属节点、CPU利用率等),支持按照用户名、节点名、进程类型、进程号等条件进行组合查询; 5.支持进程合法性的判定,支持基于节点、用户、进程等不同维度的白名单和黑名单设置,支持对残留作业进程、非法作业进程的自动清理操作。 6.提供本地软件仓库,集成HPC集群常用的各种开源和免费软件,包括集群基础软件和硬件诊断工具。 7.具有针对集群整体(或者部分)进行各项指标(如CPU、磁盘、内存等)的性能测评。 8.具有资源管理和作业调度功能,包括:作业提交与记账、队列与系统资源管理、抢占式调度与GPU管理等功能。提供MPI并行计算环境、浮点计算数学库及相关编译工具。 9.提供网络文件系统和并行计算系统设置及维护。提供系统管理、系统使用培训,包括开关机系统、文件系统维护、文件系统结构、常规Linux使用介绍等。为用户安装其他软件提供技术支持及相关服务。为用户提供相关设备升级、扩容服务。为用户提供已有设备的网络和队列配置工作。 3.网络 1.配置≥1块EDR Infiniband卡; 2.配置≥1根InfiniBand DAC线缆,传输速率≥100GB/秒。 4.系统集成及服务支撑 根据产品实际需要,提供与本项目配套的足够数量的所需的配件。 5.设备安装地点 内蒙古自治区呼和浩特市**** |