最近,NVIDIA 在 Hopper 架構(gòu)中引入了一項(xiàng)開(kāi)創(chuàng)性的安全功能,以保護(hù)敏感數(shù)據(jù)、AI 模型和應(yīng)用程序。這項(xiàng)名為NVIDIA 機(jī)密計(jì)算 的新功能提供了一種基于硬件的解決方案,可以安全地處理正在使用的數(shù)據(jù)和代碼,防止未經(jīng)授權(quán)的訪問(wèn)和修改。
無(wú)論是部署在本地、邊緣還是云端,敏感數(shù)據(jù)都容易受到外部攻擊和內(nèi)部威脅。NVIDIA 機(jī)密計(jì)算可確保您最關(guān)鍵的數(shù)據(jù)和代碼安全無(wú)虞,同時(shí)享受 NVIDIA H200 和 H100 Tensor Core GPU 的先進(jìn)加速。
了解 NVIDIA 機(jī)密計(jì)算
簡(jiǎn)單來(lái)說(shuō),“機(jī)密計(jì)算”(CC)通過(guò)在基于硬件且經(jīng)過(guò)證明的可信執(zhí)行環(huán)境(TEE)中執(zhí)行計(jì)算來(lái)保護(hù)正在使用的數(shù)據(jù)。
NVIDIA H200 和 H100 GPU 在 CPU 上配備 CVM(機(jī)密虛擬機(jī))TEE,錨定在片上信任根 (RoT) 中。在 CC-On 模式下啟動(dòng)時(shí),將啟用硬件保護(hù)以確保代碼和數(shù)據(jù)的機(jī)密性和完整性。這里的“機(jī)密性”是指防止攻擊者訪問(wèn)數(shù)據(jù)或代碼,“完整性”是指防止在執(zhí)行過(guò)程中進(jìn)行修改。
工作原理
1、信任鏈:安全且經(jīng)過(guò)測(cè)量的啟動(dòng)序列建立了信任鏈。
2、安全連接:SPDM(安全協(xié)議和數(shù)據(jù)模型)會(huì)話促進(jìn)與 CPU TEE 中的驅(qū)動(dòng)程序的安全連接。
3、證明報(bào)告:經(jīng)過(guò)加密簽名的證明報(bào)告可驗(yàn)證系統(tǒng)完整性。
4、GPU 認(rèn)證:必須認(rèn)證 GPU 為支持機(jī)密計(jì)算的合法 NVIDIA GPU,涉及設(shè)備唯一私鑰和經(jīng)過(guò)認(rèn)證的公鑰。GPU 不得因 CC 被吊銷,并且必須驗(yàn)證認(rèn)證報(bào)告。
5、安全通道建立:驗(yàn)證成功后,CVM 中的 NVIDIA 驅(qū)動(dòng)程序使用會(huì)話密鑰與 GPU 硬件 TEE 建立安全通道,以傳輸數(shù)據(jù)、執(zhí)行計(jì)算并檢索結(jié)果。CVM 和 GPU 之間的通信通過(guò) CVM 外部的共享內(nèi)存區(qū)域進(jìn)行,并采用 AES-GCM 加密以防止主機(jī)系統(tǒng)讀取此通信。
6、內(nèi)存管理:GPU 將所有輸入復(fù)制并解密到其內(nèi)部?jī)?nèi)存,以純文本形式運(yùn)行所有內(nèi)容,同時(shí)阻止直接訪問(wèn)。性能計(jì)數(shù)器被禁用以防止旁道攻擊。
此過(guò)程將機(jī)密計(jì)算環(huán)境從 CVM(或安全區(qū)域)擴(kuò)展到 GPU,并具有證明、加密通信和內(nèi)存隔離。
好處和積極影響
NVIDIA 機(jī)密計(jì)算具有多項(xiàng)顯著優(yōu)勢(shì):
基于硬件的安全性和隔離:在任何環(huán)境中實(shí)現(xiàn)虛擬機(jī) (VM) 的完全隔離 - 本地、邊緣或云中。整個(gè)工作負(fù)載都通過(guò)內(nèi)置硬件防火墻進(jìn)行保護(hù),可提供前所未有的保護(hù)。
通過(guò)設(shè)備認(rèn)證實(shí)現(xiàn)可驗(yàn)證性:確保只有經(jīng)過(guò)授權(quán)的最終用戶才能部署數(shù)據(jù)和代碼,以便在 H200 或 H100 的 TEE 中執(zhí)行。設(shè)備認(rèn)證可驗(yàn)證 NVIDIA GPU 的真實(shí)性,確保固件完整性和正確更新。
防止未經(jīng)授權(quán)的訪問(wèn):敏感數(shù)據(jù)、AI 工作負(fù)載和知識(shí)產(chǎn)權(quán)受到保護(hù),始終保持機(jī)密性和完整性。未經(jīng)授權(quán)的實(shí)體(包括虛擬機(jī)管理程序、云提供商、主機(jī)操作系統(tǒng)以及任何具有物理訪問(wèn)權(quán)限的人)在執(zhí)行期間被阻止查看或修改 AI 應(yīng)用程序和數(shù)據(jù)。
無(wú)需更改應(yīng)用程序代碼:機(jī)密計(jì)算功能可無(wú)縫運(yùn)行,無(wú)需更改 GPU 加速工作負(fù)載的代碼。
支持機(jī)密計(jì)算的 GPU 可實(shí)現(xiàn)多種用例,其中安全性、隱私性和法規(guī)遵從性至關(guān)重要。例如,即使在共享或遠(yuǎn)程基礎(chǔ)設(shè)施上大規(guī)模分布和部署,也可以保護(hù)專有 AI 模型的知識(shí)產(chǎn)權(quán)。
隱私和機(jī)密性在 AI 訓(xùn)練和推理過(guò)程中得到保護(hù),尤其是在醫(yī)療、金融和公共部門等數(shù)據(jù)敏感且受監(jiān)管的行業(yè)。促進(jìn)多方之間的安全協(xié)作,以在參與站點(diǎn)之間構(gòu)建和改進(jìn) AI 模型,適用于醫(yī)學(xué)成像、藥物開(kāi)發(fā)和欺詐檢測(cè)等用例。組織、政府和個(gè)人可以將 AI 工作負(fù)載外包給云提供商,同時(shí)確保免受底層基礎(chǔ)設(shè)施的保護(hù)。
隨著對(duì) GPU 資源的需求不斷激增,尤其是對(duì)于人工智能和機(jī)器學(xué)習(xí)應(yīng)用的需求,確保這些資源的安全性和易于訪問(wèn)變得至關(guān)重要。
捷智算平臺(tái)的去中心化架構(gòu)旨在使全球尚未開(kāi)發(fā)的 GPU 資源的訪問(wèn)變得民主化,并高度強(qiáng)調(diào)安全性和用戶便利性。讓我們來(lái)揭秘捷智算平臺(tái)如何保護(hù)您的 GPU 資源和數(shù)據(jù),并確保去中心化計(jì)算的未來(lái)既高效又安全。