IBM 推出全新 z17主机，AI性能比前代高7.5倍

10200点击 2025-04-13 10:52

IBM推出了其最新一代大型机IBM z17，延续了IBM Z系列在关键任务负载上的安全性和可靠性传统，还通过全新设计的Telum II处理器和Spyre AI加速器卡，将人工智能（AI）能力深度融入系统架构。

IBM z17目的是应对企业对生成式AI（GenAI）、大型语言模型（LLM）以及预测性AI日益增长的需求，提供比前代z16高出7.5倍的AI性能，并在交易处理、欺诈检测和业务洞察等领域展现出卓越的潜力。

我们从技术架构、功能实现和应用场景创新三个维度，深入剖析IBM z17如何通过硬件与软件的协同创新，为企业提供高效、安全且节能的AI计算解决方案，并在“AI定义企业”的新时代中重塑大型机价值。

IBM z17的推出不仅是技术上的突破，更是对客户需求深度响应的体现，其市场表现值得期待。

IBM 推出全新 z17主机，AI性能比前代高7.5倍

IBM z17技术架构

● Telum II处理器：AI与高性能计算的核心

IBM 推出全新 z17主机，AI性能比前代高7.5倍

IBM z17的核心是Telum II处理器，这款芯片在2024年Hot Chips大会上首次亮相，由三星采用5纳米工艺制造，相较于前代Telum处理器（为z16设计）实现了显著的性能提升。

IBM 推出全新 z17主机，AI性能比前代高7.5倍

● 硬件规格升级方面

◎ Telum II保持了八核设计但主频从上一代的5GHz提升至5.5GHz增强了单线程性能，缓存容量扩展为每个核心配备36MB的二级缓存（L2），加上一个额外的DPU专用缓存，总计十个36MB L2缓存。

虚拟三级缓存（L3）和四级缓存（L4）分别增至360MB和2.88GB，整体缓存容量较前代增加40%，显著提升了数据访问效率。

并且内置第二代片上AI加速器支持每秒24万亿次运算（TOPS），新增对INT8数据类型的支持优化了AI推理性能使其能够与高负载企业任务并行运行；

IBM 推出全新 z17主机，AI性能比前代高7.5倍

◎ 片上DPU的创新包括Telum II首次集成的数据处理单元（DPU）含有四个处理集群，每个集群配备八个可编程微控制器以及一个管理IO加速器，旨在减轻主处理器在数据密集型AI任务中的负担。

DPU通过独立的L1缓存和请求管理器优化数据流直接连接主处理器与PCIe架构减少数据传输开销提升吞吐量和能效为Spyre AI加速器的高效运行提供支持，在最高配置下z17可支持32个Telum II处理器和12个IO扩展抽屉总计192个PCIe插槽大幅扩展了系统IO容量；

IBM 推出全新 z17主机，AI性能比前代高7.5倍

◎ 液体冷却技术采用液体冷却方案从传统的蒸馏水升级为新型冷却液以简化维护并提升散热效率，这种设计支持双芯片模块（DCM）的高密度部署确保系统在高负载下的稳定性。

● Spyre AI加速器卡：扩展AI能力的利器

IBM 推出全新 z17主机，AI性能比前代高7.5倍

◎ Spyre AI加速器卡作为z17的一大亮点，通过PCIe插槽集成到系统中，为生成式AI和LLM提供专用计算资源，每张Spyre卡配备最多32个核心。

其架构与Telum II的AI加速器类似且功耗为75W、内存容量达128GB，系统支持最多48张Spyre卡以8卡为一组集群运行，8卡组合可提供1TB内存和256个加速器核心显著增强AI处理能力；

◎ 设计目标上，Spyre卡专为处理复杂AI模型如LLM而设计，支持模型微调甚至训练任务使企业能够将数据保留在本地满足高安全性需求，并与Telum II协同工作实现了“集成AI”理念即通过多模型组合提升预测准确性减少误报率；

◎ 应用场景方面，在金融领域Spyre卡可支持实时欺诈检测，在企业管理中可用于文档总结、代码生成等GenAI任务；

◎ 此外，z17的主板采用超过50层的复杂PCB结构提升信号完整性和可靠性同时支持高密度内存模块部署。

Telum II通过对称多处理（SMP）电缆连接器实现多芯片互联最高支持32个处理器协同工作形成强大的计算集群，而且z17通过对现代数据访问方法和NoSQL数据库的集成优化了混合云环境下的数据处理能力为AI应用提供更广泛的数据来源。

AI推理的功能实现

IBM 推出全新 z17主机，AI性能比前代高7.5倍

● IBM z17通过将AI推理能力嵌入交易处理流程显著提升了实时响应能力

◎ Telum II的AI加速器每天可执行超过4500亿次推理操作，延迟低至1毫秒，比z16提升50%的AI推理吞吐量，并在欺诈检测场景中能够对100%的实时交易进行评估大幅降低漏检率；

◎ z17结合预测性AI与GenAI优势，例如在保险行业中从DB2数据库提取结构化索赔数据并通过LLM分析非结构化文本如索赔原因输入预测模型以优化结果，Spyre卡进一步扩展了生成式AI能力支持复杂任务如聊天机器人管理、医学图像分析等；

● 在软件生态赋能方面

◎ z/OS 3.2操作系统计划于2025年第三季度发布，全面支持硬件加速AI提供运营AI洞察优化系统管理，新增对NoSQL数据库和混合云数据处理的原生支持使AI能够挖掘更多企业数据生成预测性业务洞察。

watsonx Code Assistant for Z为开发者提供代码自动补全和优化建议提升开发效率，watsonx Assistant for Z集成到Z Operations Unite利用实时系统数据提供AI驱动的事件检测和解决方案，

◎ IBM Z Operations Unite将于2025年5月发布以OpenTelemetry格式整合运行日志利用AI加速异常检测缩短问题解决时间并可与IBM Concert协同实现智能运营；

● 在安全与弹性全面升级方面，

◎ 集成HashiCorp的Vault技术支持混合云环境下的凭证和密钥管理确保关键负载安全，IBM Threat Detection for z/OS利用Telum II和自然语言处理技术实时发现和分类敏感数据检测潜在威胁。

内置第10代IBM Storage DS8000提供模块化架构和优化的数据性能保障任务关键型负载的敏捷性和安全性；

◎ 此外，在开发与支持体系上，IBM Technology Lifecycle Services提供定制化支持优化系统性能并减少中断风险。

IBM与客户、研究院及软件团队紧密合作，z17的开发历时五年提交了300多项专利充分体现了以客户需求为导向的研发策略。

小结

IBM z17的推出标志着大型机从传统交易处理平台向AI驱动计算平台的转型，通过Telum II处理器和Spyre AI加速器卡的协同创新，z17不仅在技术架构上实现了高性能与高可靠性的完美结合，还通过功能实现的深度优化，满足了企业在AI推理、生成式AI和数据安全方面的多样化需求。

从实时欺诈检测到文档总结，再到混合云数据处理，z17为金融、保险、零售等行业提供了超过250个AI用例。

文章来自微信公众号 “ 芝能汽车 “，作者芝能芯芯

IBM 推出全新 z17主机，AI性能比前代高7.5倍

z17 IBM IBM z17 人工智能 AI硬件 AI处理器

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner