NVIDIA Project DIGITS 是一款革命性的人工智能超级计算机,专为桌面设计。搭载尖端的NVIDIA GB10 Grace Blackwell 超级芯片,Project DIGITS 以紧凑且节能的外形提供了令人惊叹的每秒千万亿次浮点运算(petaflop)的 AI 性能。凭借128GB 内存和预装的NVIDIA AI 软件栈,开发者可以在本地原型设计、微调和运行高达2000 亿参数的大型 AI 模型,同时无缝部署到数据中心或云端。
专为 AI 研究人员、数据科学家和学生设计,Project DIGITS 集成了 NVIDIA 的GB10 Grace Blackwell 超级芯片,提供高达1 petaflop的计算性能。这使其成为原型设计、微调和运行大规模 AI 模型的理想选择。
NVIDIA Project Digits 有什么特点
AI 模型性能:NVIDIA Project DIGITS 的突出特点之一是能够运行高达2000 亿参数的 AI 模型。这一能力使其成为从事大规模机器学习项目的开发者和 AI 研究人员的理想选择。能够在本地处理如此大规模的模型,意味着开发者不再需要依赖昂贵的云计算或大型数据中心。无论是自然语言处理、计算机视觉还是其他 AI 驱动的应用,Project DIGITS 都能以紧凑的外形提供顶级性能。
可扩展性:对于需要更高处理能力的用户,Project DIGITS 提供了卓越的可扩展性。通过连接两个单元,用户可以处理高达4050 亿参数的 AI 模型,从而在项目需求增长时灵活扩展处理能力。这一功能对于需要大量计算能力和内存的复杂深度学习模型团队尤其重要。无论是研究、测试还是实际部署,可扩展性是 Project DIGITS 的关键优势,使用户能够逐步应对更高要求的工作负载。
能效:尽管拥有强大的计算能力,NVIDIA Project DIGITS 在设计时充分考虑了能效。与消耗大量电力的传统超级计算机或高性能机器不同,Project DIGITS 使用标准的墙电运行,使其对小型团队、个人研究人员和学生更具可及性和成本效益。这种能效与紧凑尺寸的结合,使其成为希望在获得尖端 AI 性能的同时避免高额能源账单的用户的不二之选。它是性能与可持续性的完美结合。
操作系统:Project DIGITS 运行在基于Linux 的 NVIDIA DGX OS 上,这是一个专为 AI 和高性能计算量身定制的强大且安全的操作系统。该操作系统针对机器学习任务进行了优化,并预装了各种工具和框架,以简化开发流程。由于 Linux 在 AI 研究人员和开发者中广受欢迎,该系统提供了与各种 AI 工具、库和框架的广泛兼容性。此外,DGX OS 提供了硬件资源的简化管理,确保在运行高要求的 AI 模型时获得最佳性能。
软件栈:NVIDIA Project DIGITS 最引人注目的功能之一是预装了完整的NVIDIA AI 软件栈。这包括机器学习、深度学习和 AI 模型开发所需的所有基本软件工具和框架,例如 TensorFlow、PyTorch 和 CUDA。预配置的软件栈显著减少了设置时间,使开发者能够直接投入工作,而无需担心兼容性问题或手动安装依赖项。借助这一软件栈,用户可以轻松微调模型、尝试新的 AI 架构,并快速扩展其应用。
NVIDIA Project Digits 的硬件配置
芯片组:NVIDIA Project DIGITS 的核心是全新的GB10 Grace Blackwell 超级芯片,这是一款专为提供卓越性能同时保持能效的先进 AI 处理单元。这款定制芯片结合了两者的优势:为 AI 工作负载提供尖端处理能力,同时保持能效,使系统紧凑且无需大规模冷却解决方案即可使用。Grace Blackwell 芯片专为 AI 应用设计,为开发者提供了一种工具,能够处理最复杂的机器学习任务,同时不会影响功耗。
AI 性能:Project DIGITS 提供了令人印象深刻的1 petaflop AI 性能,并支持FP4 精度。这一性能水平对于从事大型 AI 模型和机器学习算法的开发者至关重要。借助 FP4 精度,设备可以更快、更准确地处理 AI 模型,从而实现实时数据处理和快速实验。在如此紧凑的外形中实现 petaflop 级别的 AI 任务处理能力,使其成为需要高性能计算进行 AI 工作负载的用户的强大工具,同时保持出色的能效。
CPU:Project DIGITS 计算能力的核心是Grace CPU,配备20 个 ARM 核心。该 CPU 是与联发科(MediaTek)合作开发的,专为高效能和性能设计。ARM 架构以其节能能力著称,非常适合对能效要求极高的系统。20 个核心提供了充足的多线程性能,使系统能够高效处理并行进程和复杂计算。无论是运行机器学习模型还是多任务处理,Grace CPU 都能确保流畅可靠的性能。
GPU:NVIDIA Project DIGITS 包含最新一代的CUDA 核心和第五代 Tensor 核心,这些是专为加速 AI 工作负载设计的硬件。CUDA 核心支持并行计算,这对于深度学习和其他计算密集型任务至关重要,而第五代 Tensor 核心则为 AI 模型训练和推理提供了更强大的性能。这些核心针对高吞吐量和高效处理进行了优化,使 Project DIGITS 能够以极快的速度处理大型 AI 模型,例如具有数十亿参数的神经网络。
内存:Project DIGITS 配备了128GB 统一 LPDDR5 内存,确保数据能够快速高效地访问。LPDDR5 内存是最新一代低功耗、高性能内存,对于需要快速访问大型数据集的 AI 和机器学习任务至关重要。内存的统一架构意味着 CPU 和 GPU 可以访问同一内存池,减少了瓶颈并提升了整体性能。这在处理大规模 AI 模型或复杂数据处理任务时尤为重要。
存储:Project DIGITS 提供高达 4TB 的 NVMe 存储,为存储大型数据集、模型文件和软件提供了充足的空间。NVMe(非易失性内存 express)存储比传统硬盘快得多,确保数据能够快速读取和写入,这对于训练大型 AI 模型或运行实时应用等任务至关重要。高存储容量意味着用户可以处理海量数据集而无需担心空间不足,同时快速的读写速度确保了整体性能的高效性。
网络:NVIDIA ConnectX 网络技术确保了设备之间的高速、低延迟通信。这对于需要将多个系统连接以进行分布式计算或需要高速互联网访问以处理云工作负载的用户尤其有益。凭借先进的网络功能,Project DIGITS 确保大型数据集能够快速可靠地传输,从而在研究团队或云计算资源之间实现无缝协作。强大的网络支持还确保系统能够集成到更大的 AI 基础设施中,并根据需要高效扩展。