招標詳情
下文中****為隱藏內容,僅對千里馬會員開放,如需查看完整內容請
「注冊/登錄」或 撥打咨詢熱線:
400-688-2000
項目名稱 集群調度平臺與人工智能實訓平臺 | 項目編號 **** |
公告開始日期 2025-01-14 17:02:35 | 公告截止日期 2025-01-17 18:00:00 |
采購單位 **** | 付款方式 進口設備: 甲方與****公司簽訂代理進口委托協議后,將進口項****公司****銀行賬戶,項目貨款僅用于本進口項目的信用證或TT付匯及進口相關費用等。****公司收到甲方合同貨款后,按外貿合同要求及時履行與乙****公司的付款義務。 國產設備:甲方應在完成驗收并建立固定資產后向乙方一次性支付本合同的總款項,乙方須向甲方出具合法有效完整的完稅發票及憑證資料進行支付結算。 |
聯系人 | 聯系電話 |
簽約時間要求 | 到貨時間要求 合同簽訂后30個日歷日內 |
預算總價 ¥56000.00 |
發票要求 |
含稅要求 |
送貨要求 |
安裝要求 |
收貨地址 ******南區 |
供應商資質要求 符合《政府采購法》第二十二條規定的供應商基本條件 |
公告說明 |
采購商品 采購數量 計量單位 所屬分類
人工智能實訓平臺授權 | 16 | 個 | 應用軟件 |
品牌 曙光 |
型號 人工智能管理平臺SothisAI v2.0授權 |
預算單價 ¥ 3000.00 |
技術參數及配置要求 1.平臺授權:配置一套人工智能AI服務平臺,含16張卡許可授權??赏ㄟ^管理調度軟件統一調度管理,在同一平臺界面可同時運行HPC作業和AI作業,提供國家版權局頒發的計算機軟件著作權登記證書復印件加蓋公章; 2.模型訓練:支持基于docker容器的模型訓練功能。對TensorFlow和Pytorch等框架下的訓練任務提供Horovod訓練模式,支持通過Horovod進行大規模Ring All Reduce訓練。 3.參數調優:支持基于容器的分布式超參數自動調優功能。支持TPE自動搜索算法,多參數同時調優。用戶可自定義調參任務的調優參數類型、調參范圍,使用的框架版本、容器數量、CPU數量、內存、加速器類型等內容,驗收時進行功能驗證; 4.鏡像:支持用戶自定義鏡像,包括鏡像包,從DockerHub拉取,基于Dockerfile在線制作等模式。提供鏡像制作進度和日志查詢功能。支持用戶將自定義鏡像或訂閱鏡像推送至訓練、調優、推理等圖形化流程進行使用。 5.數據集管理支持按照應用場景和格式管理用戶數據集,支持對數據集添加數據標注信息,并可按照版本進行管理。可將個人數據集共享至平臺,可選擇同步共享的標注版本,配置共享范圍和共享模式。 6.容器:支持創建多容器實例任務,可通過頁面對容器組提交批量執行腳本,以****服務部署;配置容器環境變量和啟動腳本,在容器運行時默認執行,避免**閑置;支持自定義容器掛載路徑。 7.兼容性:支持選擇K8S等云原生調度器或者Slurm等先進計算調度器作為調度引擎,適配不同的業務場景。在同一調度器中,同時管理、調度和監控業界主流NVDIA GPU和DCU、MLU等國產加速器; 8.售后服務要求:由原廠工程師上門安裝部署安裝調試,提供售后服務承諾函。 |
參考鏈接 |
售后服務 服務年限:36月;電話支持:7x24小時;商品承諾:原廠全新未拆封正品;質保期:三年; |
采購商品 采購數量 計量單位 所屬分類
集群調度平臺授權 | 2 | 個 | 基礎軟件 |
品牌 曙光 |
型號 Gridview集群綜合管理系統V5.0授權 |
預算單價 ¥ 4000.00 |
技術參數及配置要求 1.總體概述:提供2個原廠軟件授權,兼容調度現有2個計算節點。激活原有一套商業版集群調度管理軟件,包括系統軟件、集群調度、集群監控、作業調度、流量計費、分布式文件系統等管理功能。提供國家版權局頒發的計算機軟件著作權登記證書復印件加蓋公章; 2.兼容性:提供標準二次開發接口RESTful API,滿足進行個性化功能開發。支持linux、Windows、Redhat及國產**、方德、ubuntu等系列操作系統安裝。支持CPU、GPU、國產加速器、寒武紀、海光等異構集群的調度。由原廠工程師上門安裝; 3.提供本地軟件倉庫,集成 HPC 集群常用的各種開源和免費軟件,包括集群基礎軟件(如編譯器、MPI 數學庫、Infiniband 驅動)和硬件診斷工具。 4.穩定性策略:可支持管理節點的雙機熱備,主節點出問題,備用節點自動接管并繼續提供服務,確保業務服務穩定。支持對于宕機(或網絡不通的)節點上作業的自動重新調度;支持對于因為系統臨時錯誤導致的異常作業進行自動重新入隊和調度;支持當作業返回特定退出碼時進行自動重新調度。 5.集群預警:支持自定義通知策略,實現頁面預警、郵件告警等通知方式;符合告警策略條件將會產生相應告警信息并通過郵件、短信方式通知負責人;支持多種告警信息顯示方式:包括告警列表以及與機房物理視圖、熱圖等監控視圖結合展示等。 6.并發性能:調度性能:支持≥30000個計算節點調度支持大批量作業的實時調度,最大瞬時大規模作業(≥3000個)的同時提交;支持大批量作業的動態優先級調動并發瞬時吞吐率峰值(≥2000個)的**調度; 7.監控管理:提供作業熱圖,直觀展現用戶作業在集群的分布情況,以及集群**的整體使用狀況。提供調度系統狀態分析視圖儀表,直觀展示集群、隊列、用戶等不同視角的**使用信息和作業負載信息,為管理員的調整優化提供決策依據。 8.**管理策略:平臺可設定作業優先級、**限額、**共享、**預留、作業回填、作業搶占、節點獨占、負載均衡等調度策略。 9.**創建:支持對平臺數據庫用戶和各類操作系統用戶(如本地用戶、NIS、LDAP等)的統一管理,支持用戶的創建、修改、刪除、凍結和激活操作,可對用戶和用戶組的磁盤作配額管理。 10.支持將作業均衡的分配到所有計算節點上,避免任務堆積在個別節點,因爭搶 CPU、內存等**導致計算變慢。支持隨機選擇作業的計算節點,解決特定場景和固定調度算法下某些計算節點被頻繁使用的問題。 11.允許作業獨占計算節點,支持集群、隊列、作業三級的的節點獨占策略設置。支持靈活可配置的節點可用性判定策略。檢查作業的可用節點時,需要考慮多種**請求(如處理器、內存、磁盤)進行判定,允許針對不同的**使用不同的判定算法(如按照實際使用量、按照調度分配量,或者綜合兩者進行判定)。 12.支持基于隊列、用戶、用戶組等不同維度的**限額(即可用處理器數、內存數、節點 數、作業數、GPU 數等),方便管理員控制**分配; 13.支持基于隊列、用戶、用戶組等多個維度的優先級定義策略,根據作業的靜態(如** 請求、所屬用戶等)和動態指標(如入隊時間、公平共享份額等),通過不同的權重設置,靈活控制作業優先級; 14.提供基于 Web 的文件管理功能,支持文件和文件夾的創建、刪除、重命名、在線編輯、權限設置,支持文件的節點間同步,支持文件批量上傳和打包下載,支持列表視圖**鋪視圖的切換。 15.支持計算數據或計算結果極速上傳下載,支持快傳和斷點續傳,可一次性高速傳輸數百個文件以及 TB 級文件,支持大文件遠程傳輸 16. 支持批處理作業、命令行交互式作業以及 GUI 圖形交互作業,支持通過瀏覽器打開 VNC會話進行操作;支持設置多個專門的 VNC 服務節點,統一 VNC 會話的管理;支持作業 VNC會話在不同 VNC 服務節點上的負載均衡; 17. 提供調度系統狀態分析視圖 Dashboard,直觀展示集群、隊列、用戶等不同視角的**使用信息和作業負載信息,為管理員的調整優化提供決策依據。 18. 支持計費賬號管理,允許多個用戶使用一個計費賬號;支持通過“先充值后扣費”方式使用集群**,只有賬號余額充足時才能運行作業。 19. 支持從用戶、隊列、節點、應用、賬號、作業規模等不同角度進行統計計費;支持基于CPU、GPU、存儲空間計費 20. 支持導出作業粒度的計費詳表,供用戶核對;支持 GPU、存儲計費等功能; 21.售后服務要求:由原廠工程師上門安裝部署安裝調試,提供售后服務承諾函。 |
參考鏈接 |
售后服務 服務年限:36月;電話支持:7x24小時;商品承諾:原廠全新未拆封正品;質保期:三年; |