
NVIDIA 為解決企業大規模部署 AI 時的管理與成本挑戰,推出 DGX Spark Enterprise Manageability 框架,提供從部署到退役的全面管理能力,同時結合業界對 AI 成本可預測性的需求,例如鵲系統改採固定費率計價,共同推動企業 AI 方案更具效益與穩定性。
為因應人工智慧(AI)基礎設施快速規模化的企業需求,NVIDIA 於日前推出 DGX Spark Enterprise Manageability 框架,旨在提供全面的操作管理能力,從部署到退役全程監控,以實現高效、安全且可預測的 AI 工作負載管理。這項新框架特別針對企業資訊科技(IT)團隊,確保 AI 系統能達到與其他關鍵基礎設施同等的營運成熟度。
NVIDIA DGX Spark Enterprise Manageability 框架的推出,反映了企業在 AI 部署上面臨的挑戰。隨著 AI 專案從開發階段邁入企業級應用,對於系統的可佈建性、可觀察性、安全性及可管理性要求日益提高。該框架提供模組化架構,能與企業現有的 IT 工具(如 Chef、Puppet、Ansible、Tanium 及 Canonical Landscape)無縫整合,而非取代。其運作模式採用代理程式less SSH 執行,並輸出標準化的 JSON 格式結果,便於整合至配置管理資料庫(CMDB)或安全資訊與事件管理(SIEM)系統。
這套框架涵蓋 AI 基礎設施的六大營運生命週期階段,包括採購、初始佈建、持續監控、維護、事件響應,以及終端設備退役與再部署。針對部分限制直接網際網路存取的使用環境,DGX Spark Custom Installation 功能允許 IT 團隊在不需即時網路連線的情況下預先配置裝置及客製化軟體,確保系統能正常運作。
此外,該框架也提供強大的診斷工具,例如 spark_diagctl.py 用於快速檢查系統健康狀況或產生詳細診斷報告,以及 reset_reason_reporter.py 協助釐清系統重啟原因。在安全性方面,NVIDIA DGX Spark 具備驗證啟動完整性、儲存加密狀態報告、套件簽名驗證、具備監管鏈的還原出廠設定,以及 UEFI 支援的資產中繼資料標籤等功能,確保企業 AI 系統的合規性與資料安全。
業界對 AI 部署成本可預測性的需求也日益高漲。根據 Futurum 的一項調查,78% 的企業預期未來一年將增加 AI 預算,但仍有 63% 的企業將其科技預算中不到 10% 投入 AI。許多企業憂心大型語言模型(LLM)基於 Token 使用量的計費方式難以預測,因此影響 AI 專案的廣泛導入。例如,鵲系統(Pegasystems)近日推出的 Pega Infinity 26,便改採基於業務成果的固定費率計價模式,以解決 Token 計費的不確定性,並宣稱可比傳統模式節省超過 20 倍的成本。這類創新定價模式與 NVIDIA DGX Spark 的強化管理能力,共同推動企業 AI 方案更具成本效益與穩定性。
這些基礎設施與定價模式的進展,對全球 AI 產業生態系影響深遠。尤其對像台灣這樣在半導體及 AI 領域具備優勢的地區而言,隨著全球企業對規模化 AI 部署的需求增加,不僅為台灣的半導體供應鏈帶來商機,也鼓勵本地企業與雲端服務供應商更自信地採納先進 AI 解決方案,加速台灣 AI 產業的整體發展。
