Tachyum推出2nm Prodigy,其AI机架性能比Nvidia Rubin Ultra 高 21 倍

内容摘要Tachyum® 今天公布了其 2nmProdigy® 通用处理器的详细信息和规格,该处理器将使 AI 模型的参数比任何现有解决方案的参数大许多数量级,而成本仅为其一小部分。Prodigy Ultimate 提供的 AI机架性能比 Nvid

Tachyum® 今天公布了其 2nmProdigy® 通用处理器的详细信息和规格,该处理器将使 AI 模型的参数比任何现有解决方案的参数大许多数量级,而成本仅为其一小部分。

Prodigy Ultimate 提供的 AI机架性能比 NvidiaRubin Ultra NVL576 高出 21.3 倍。Prodigy Premium 提供的 AI机架性能比 Vera Rubin 25.8 高出 144 倍。2nm Prodigy 是有史以来第一个推理超过 1,000 PFLOP 的芯片,其技术细节将在一周内发布。Nvidia Rubin 提供 50 个 PFLOP。

全球人工智能竞争持续加速,中美领跑。当前的人工智能模型展示了巨大的计算规模——例如,ChatGPT 4 具有大约 1.8 万亿个参数,而人脑则包含估计 150 万亿个突触。BaGauLu 等新兴系统达到 174 万亿个参数,但最终的突破有望来自基于人类集体知识训练的模型,超过 10 亿万亿 (1020) 个参数。传统的大规模人工智能解决方案可能耗资超过 8 万亿美元,需要超过 276 吉瓦的电力。相比之下,Tachyum 解决方案预计将以 780 亿美元的估计成本和仅 1 吉瓦的电力需求实现可比的功能,使其可供多家公司和国家使用。

除了开源所有软件外,Tachyum 还使用标准组件提供其内存技术,允许内存或处理器公司许可的基于 DIMM 的内存带宽增加 10 倍,包括采用 JEDEC 以实现高采用率和低成本。2023 年,Tachyum 宣布推出可许可的 Tachyum AI (TAI) 数据类型,其 Tachyum 处理单元 (TPU) 核心可供许可。Tachyum 正在开放指令集架构 (ISA)。

Tachyum 不断升级其 Prodigy 设计,以满足服务器、AI 和 HPC 市场不断变化的需求,整数性能高达 5 倍,AI 性能提高 16 倍,DRAM 带宽提高 8 倍,芯片到芯片和 I/O 带宽提高 4 倍,支持 16 个插槽,可扩展性提高 4 倍,能效提高 2 倍,每核成本更低。

Prodigy芯片升级为2nm,大幅降低功耗。尽管 2nm 晶圆价格昂贵,但减小小芯片尺寸可以提高成本。Prodigy 封装中的每个小芯片都集成了 256 个高性能定制 64 位内核。功耗降低至关重要,因为多个小芯片占据一个封装。在最近 2.2 亿美元投资的支持下,2nm Prodigy 正在准备流片。

多个 Prodigy SKU 涵盖广泛的性能和应用,包括大 AI、百亿亿次级超计算、HPC、数字货币、云/超大规模、大数据分析和数据库。Prodigy Ultimate集成了1,024个高性能内核、24个DDR5 17.6GT/s内存控制器和128个PCIE 7.0通道。Prodigy Premium 配备 16 个 DRAM 通道和 512 至 128 个内核,可扩展到 16 个插槽系统。入门级 Prodigy 配备 8 或 4 个 DRAM 控制器和 128 至 32 个内核。

刺IGY 功能、可扩展性和价格细分确保快速市场渗透。Tachyum 提供开箱即用的原生系统软件、作系统、编译器、库、许多应用程序和 AI 基础设施框架。它还允许运行未经修改的 Intel/AMD x86 二进制文件,并将它们与本机应用程序混合使用。这确保了 Tachyum 系统从第一天起就可以由客户运行。

Tachyum创始人兼首席执行官Radoslav Danilak博士表示

:“经过漫长的等待,现在已经获得了流片资金,世界上第一台通用处理器可以投入生产,旨在克服当今数据中心的固有局限性。“Prodigy 针对的独特市场是人工智能、服务器和高性能计算市场,需要快速高效的芯片。Tachyum 的 Prodigy Premium 和 Ultimate 将以比市场上任何其他解决方案更低的成本以卓越的性能增强工作负载。

Prodigy 通用处理器提供高出几个数量级的 AI 性能,性能是最佳 x86 处理器的 3 倍,HPC 性能是最快 GPGPU 的 6 倍。Prodigy 消除了对昂贵的专用 AI 硬件的需求并显着提高了服务器利用率,显着降低了数据中心的资本支出和运营支出,同时提供了前所未有的性能、功耗和经济性。

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1