內(nèi)容簡介
全新 GeForce RTX SUPER GPU、各大OEM的AI筆記本電腦為領(lǐng)先的AI平臺帶來 RTX 加速
美國拉斯維加斯—CES—2024年1月8日—NVIDIA發(fā)布具有高性能生成式AI功能的GeForce RTXTM SUPER桌面端GPU,來自O(shè)EM合作伙伴的全新AI筆記本電腦,及面向開發(fā)者和消費者的全新NVIDIA RTXTM加速的AI應(yīng)用和工具。
數(shù)十年來,NVIDIA在PC領(lǐng)域一直處于領(lǐng)軍地位,現(xiàn)已有超1億RTX GPU在推動著AI PC時代的發(fā)展,NVIDIA正通過提供工具以提升PC上的生成式 AI體驗:NVIDIA TensorRTTM加速用于文本生成圖像工作流的熱門Stable Diffusion XL模型、NVIDIA RTX Remix與生成式AI紋理工具、NVIDIA ACE微服務(wù)以及更多使用DLSS 3幀生成技術(shù)(Frame Generation)的游戲。
此外,NVIDIA TensorRT-LLM (TRT-LLM) 是一個開源庫,可加速和優(yōu)化最新大語言模型 (LLMs) 的推理性能,現(xiàn)已支持更多面向PC的預(yù)優(yōu)化模型。本月,NVIDIA發(fā)布由TRT-LLM加速的Chat with RTX技術(shù)Demo,讓AI愛好者能與他們的筆記、文檔和其他內(nèi)容進(jìn)行交互。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:"生成式AI是計算史上最重要的平臺轉(zhuǎn)變,它將改變包括游戲在內(nèi)的所有行業(yè)。NVIDIA擁有超過1億臺RTX AI PC和工作站的用戶基礎(chǔ),為開發(fā)者和玩家提供保證,讓他們盡享生成式AI的魔力?!?/p>
在 PC 上本地運行生成式AI對于隱私、延遲和成本敏感型應(yīng)用至關(guān)重要。但這需要大量AI系統(tǒng)安裝基礎(chǔ),以及合適的開發(fā)者工具來調(diào)優(yōu)PC平臺的AI模型。
為滿足這些需求,NVIDIA正通過其整個技術(shù)棧提供創(chuàng)新,推動新體驗,并在現(xiàn)已支持超過 500 款NVIDIA RTX游戲和應(yīng)用的AI PC基礎(chǔ)上更進(jìn)一步。
RTX AI PC 和工作站
NVIDIA RTX GPU能以最高性能運行各種應(yīng)用,充分釋放 PC上生成式AI的潛力。RTX GPU 中的Tensor Core可顯著加速工作和娛樂應(yīng)用中要求最嚴(yán)苛的AI功能。
今天在 CES 發(fā)布的全新 GeForce RTX 40 SUPER 系列GPU包括 GeForce RTX 4080 SUPER、4070 Ti SUPER 和 4070 SUPER,提供出色的 AI 性能。在AI工作負(fù)載方面,GeForce RTX 4080 SUPER 生成視頻的速度比 RTX 3080 Ti 快 1.5 倍,生成圖像的速度比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的Tensor Core可提供最高可達(dá) 836 AI TOPS,在游戲、創(chuàng)作和日常工作等方面提供革命性的AI性能。
包括宏碁、華碩、戴爾、惠普、聯(lián)想、微星等合作伙伴發(fā)布全新 RTX AI 筆記本電腦,為用戶帶來開箱即用的生成式 AI體驗。與使用NPU相比,RTX AI筆記本電腦的性能可提升 20-60 倍。
配備RTX GPU的移動工作站可運行NVIDIA AI Enterprise軟件,包括TensorRT和NVIDIA RAPIDSTM,用于簡化、安全的生成式AI和數(shù)據(jù)科學(xué)開發(fā)。每臺NVIDIA A800 40GB Active GPU都包含為期三年的NVIDIA AI Enterprise許可證,為AI和數(shù)據(jù)科學(xué)提供理想的工作站開發(fā)平臺。
用于構(gòu)建AI模型的全新 PC 開發(fā)者工具
為幫助開發(fā)者使用 PC 級的性能和顯存快速創(chuàng)建、測試和定制預(yù)訓(xùn)練生成式 AI 模型和 LLM,NVIDIA于近期發(fā)布統(tǒng)一、易用的工具包NVIDIA AI Workbench。
AI Workbench 將于本月底推出測試版,提供對Hugging Face、GitHub 和 NVIDIA NGCTM 等熱門資源庫的流暢訪問、簡化用戶界面,使開發(fā)者能輕松復(fù)制、協(xié)作和遷移項目。
項目可擴展到數(shù)據(jù)中心、公有云或 NVIDIA DGXTM Cloud等任何地方,然后再回到PC 或工作站上的本地 RTX 系統(tǒng)進(jìn)行推理和輕量定制。
NVIDIA通過與惠普的合作,將 NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和軟件開發(fā)工具包)集成到惠普AI Studio中,這是一個集成化的數(shù)據(jù)科學(xué)平臺,從而簡化AI模型的開發(fā)。這將使用戶能跨 PC 和云輕松搜索、導(dǎo)入和部署優(yōu)化后的模型。
為PC使用場景構(gòu)建AI模型之后,開發(fā)者可使用NVIDIA TensorRT 對其進(jìn)行優(yōu)化,以充分利用 RTX GPU 的Tensor Core。
最近,NVIDIA通過TensorRT-LLM for Windows將TensorRT擴展到基于文本的應(yīng)用,TensorRT-LLM for Windows是一個用于加速LLM的開源庫。TensorRT-LLM 最新更新現(xiàn)已發(fā)布,將Phi-2加入不斷增長的 PC 預(yù)優(yōu)化模型列表,與其他backend相比,推理速度提升5倍。
RTX 加速生成式AI為全新 PC 體驗提供動力
在CES 2024上,NVIDIA及其開發(fā)者合作伙伴發(fā)布全新生成式AI驅(qū)動的 PC 應(yīng)用和服務(wù),包括:
● NVIDIA RTX Remix,用于創(chuàng)建令人驚嘆的經(jīng)典游戲 RTX 重制版的平臺。測試版將于本月底發(fā)布,提供生成式AI工具,可將經(jīng)典游戲中的基本紋理轉(zhuǎn)化物理精準(zhǔn)的4K高精度材質(zhì)。
● NVIDIA ACE 微服務(wù),包括生成式AI驅(qū)動的語音和動畫模型,使開發(fā)者能為游戲添加智能、動態(tài)的虛擬數(shù)字人物。
● TensorRT 加速Stable Diffusion XL (SDXL) Turbo 和LCM,這是兩種最熱門的Stable Diffusion加速方法。與之前最快的實現(xiàn)相比,TensorRT 將這兩種方法的性能提升 60%。Stable Diffusion WebUI TensorRT 擴展的更新版現(xiàn)在也已發(fā)布,包括 SDXL、SDXL Turbo、LCM-LoRA加速以及優(yōu)化的 LoRA支持。
● NVIDIA DLSS 3 支持幀生成技術(shù)(Frame Generation),可利用AI將幀率提高到原生渲染的 4 倍,將用于已發(fā)布的 14 款全新 RTX 游戲中的十幾款游戲中,包括《地平線:西之絕境》(Horizon Forbidden West)、Pax Dei和《龍之信條 2》(Dragon’s Dogma 2)。
● NVIDIA技術(shù)Demo "Chat with RTX"將于本月晚些時候發(fā)布,讓AI愛好者使用名為 " 檢索增強生成retrieval-augmented generation(RAG)"的熱門技術(shù),輕松地將PC LLM連接到自己的數(shù)據(jù)。該Demo由 TensorRT-LLM 加速,使用戶快速與自己的筆記、文檔和其他內(nèi)容進(jìn)行交互。作為開源參考項目,開發(fā)者可輕松地在自己的應(yīng)用中實現(xiàn)相同的功能。
歡迎參加 NVIDIA在美國拉斯維加斯舉行的CES 2024,進(jìn)一步了解生成式AI的最新突破。
關(guān)于NVIDIA
自1993年成立以來,NVIDIA (NASDAQ: NVDA) 一直是加速計算領(lǐng)域的先驅(qū)。NVIDIA 1999年發(fā)明的GPU驅(qū)動了PC游戲市場的增長,并重新定義了現(xiàn)代計算機圖形,開啟了現(xiàn)代AI時代,正在推動跨市場的工業(yè)數(shù)字化。NVIDIA現(xiàn)在是一家全棧計算公司,其數(shù)據(jù)中心規(guī)模的解決方案正在重塑整個行業(yè)。更多信息,請訪問https://nvidianews.nvidia.com/ 。
# # #
媒體咨詢:
Jade Li
NVIDIA GeForce, Studio PR
郵箱:jadli@nvidia.com
0人已收藏
全部評論 0
更多評論