企业数字化来势汹汹,建设数字化所需的计算力、数据等智能技术的基础设施常被忽略。
然而,当降本增效成为企业发展的指导方针之一,数字化项目落地所涉及的方方面面也已经不容小觑。驱动算法与模型的数据与算力,也成为实现“降本增效”的重要手段。
例如,假设一个供应给终端硬件的视觉算法的交付时长是六个月,算法训练与调优原为2个月,企业调配2个算法工程师,一个算法工程师的年薪为100万,如果算法的训练速度可以提升10倍,那么对企业所产生的直接影响就是四个字:真金白银!
当然,这是计算服务商一直在努力的目标。但,在PyTorch上将 AI 算法的实时推理速度提升10倍,有可能吗?
英特尔做到了。
在 1 月 11 日举办的第四代英特尔® 至强® 可扩展处理器新品发布会上,英特尔正式推出第四代英特尔® 至强® 可扩展处理器、英特尔® 至强® CPU Max 系列以及英特尔® 数据中心 GPU Max 系列。
第四代至强不仅实现了 AI 推理的加速,还推动了数据中心的性能、能效和安全性的大幅跃升,为为 AI、云、网络、边缘和全球领先的超级计算机带来全新功能。
在与英伟达博弈多年后,英特尔另辟蹊径,投向帮助企业迈向数字化的罗马大道上,致力于完善计算、数据等基础设施,成为给数字化大道打地基、铺水泥路的人。
随着企业数字化转型进入深水区,企业内部多云、边缘计算、人工智能技术的应用逐渐成为常态,在降本增效与追求低碳的双重目标下,企业越来越注重投入产出比,需要性价比更高的算力解决方案。
然而我们都知道,CPU 是提供算力的核心硬件之一,仅堆叠 CPU 核心数量,只能加强基础算力,而内置加速则能更高效的针对具体应用进行性能提升。当面对当下全新的企业算力需求时,第四代英特尔® 至强® 可扩展处理器应运而生,为人工智能、数据分析、存储和科学计算中增长最快的工作负载提供性能加速。
第四代英特尔® 至强® 可扩展处理器采用 Intel 7 制程工艺制造,具有全新的芯片架构。通过集成高性能核、更多内核数量、业内高需求的数据中心工作负载的相关加速器,以及业界领先的 DDR5、CXL1.1、PCIe 5.0,让加速无所不在。
此外,第四代英特尔® 至强® 可扩展处理器支持的技术还可以随着工作负载要求的变化进行扩展和调整:
-
进一步提升网络、存储和计算性能,同时通过将繁重的任务卸载到英特尔® Infrastructure Processing Unit(英特尔® IPU)来提高 CPU 利用率;
-
通过英特尔® UPI 2.0 提高多插槽带宽(高达每秒 16 千兆次传输 [GT/s]);
-
使用英特尔® Speed Select Technology(英特尔® SST)配置 CPU 以满足特定工作负载需求;
-
增加三级缓存共享 (LLC)(所有核心共享多达 100 MB LLC);
-
通过硬件增强的安全性;
-
借助英特尔® Virtual RAID on CPU(英特尔® VROC)消除对单独 RAID 卡的需求。
值得一提的是,第四代英特尔® 至强® 可扩展处理器内置众多加速器,能够高效应对人工智能、数据分析、网络、存储和其他高需求的工作负载,可以在不断变化且要求日益增高的数据中心使用中提供可观的计算性能,并对工作负载进行优化。与前一代相比,其可将目标工作负载的平均每瓦性能提升 2.9 倍,在对工作负载性能影响最小化的情况下,通过优化电源模式可为每个 CPU 节能高达 70 瓦,并降低 52% 到 66% 的总体拥有成本(TCO),这无疑代表了业界在数据中心平台上的又一大进步。
无处不在的加速体验来自第四代英特尔® 至强® 可扩展处理器提供的七大算力神器:
-
英特尔® 高级矩阵扩展(英特尔® AMX):可大幅提高深度学习训练和推理性能,性能可提升至 10 倍,非常适合自然语言处理、推荐系统和图像识别等工作负载。
-
英特尔® 动态负载均衡器(英特尔® DLB):实现了在多个 CPU 内核 / 线程上高效地分配网络处理,根据系统负载的变化而动态地在多个 CPU 内核上分配网络数据以进行处理,并能够还原在多个 CPU 内核上同时处理网络数据包的顺序,显著提升网络工作负载的系统级处理性能,时延降低 96%。
-
英特尔® 数据流加速器(英特尔® DSA):专为卸载常见的、会导致数据中心规模部署开销的数据移动任务所设计,能够帮助加速 CPU、内存和缓存,以及所有附加的内存、存储和网络设备之间的数据移动,可将存储、网络和数据密集型工作负载的性能提升至 1.7 倍。
-
英特尔® 存内分析加速器(英特尔® IAA):可在提高查询吞吐量的同时减少内存占用,非常适合内存数据库、开源数据库以及 RocksDB 和 ClickHouse 等数据存储工作,性能可提升至 3 倍。
-
英特尔® 数据保护与压缩加速技术(英特尔® QAT):作为内置加速器,其可通过卸载加密、解密和压缩释放处理器内核,从而让系统能够支持更多客户端运行或实现降低能耗的目的。得益于英特尔® QAT 加速器,第四代英特尔® 至强® 可扩展处理器已成为为单一数据流压缩并加密数据性能最高的 CPU。
-
英特尔® 安全技术:通过英特尔® 软件防护扩展(英特尔® SGX)和英特尔® 全内存机密技术(英特尔® TME)对工作负载进行保护;借助英特尔® 密码操作硬件加速(英特尔® Crypto Acceleration)加速加密运算;利用英特尔® 内存故障管理技术(英特尔® MRT)实现预测性安全保护;并通过英特尔® 平台固件弹性技术(英特尔® PFR)完成平台安全启动。
-
英特尔® 至强® CPU Max 系列:集成高带宽内存,能够在无需变更代码的情况下为科学计算工作负载加速。
加速器“加持”
除了速度要快,处理器还需要适配更多的业务场景。无论对于企业还是开发者,处理器在业务场景下的实用性和普适性至关重要。
在第四代英特尔® 至强® 可扩展处理器新品发布会上,英特尔对人工智能、数据分析、网络与存储等工作负载展开分享,给了我们许多思考,也让我们看到了其在算力处理和应用场景中的探索与突破。
在 AI 方面,与前一代相比,通过内置英特尔® AMX,第四代英特尔® 至强® 可扩展处理器将 PyTorch 实时推理和训练性能提升了 10 倍,并将广泛的 AI 工作负载的推理和训练性能提升到新的高度。而英特尔® 至强® CPU Max 系列在这些功能的基础上,针对自然语言处理进行了扩展,将大型语言模型的处理速度提升多达 20 倍。
同时,借助英特尔的 AI 软件套件,开发者可以使用自己选择的 AI 工具,提高生产力并加快 AI 开发速度。该套件可以从工作站进行移植,使其可以在云中扩展,并一直扩展到边缘。同时,该套件已经针对 400 多个机器学习和深度学习 AI 模型进行了验证,涵盖所有商业细分领域最常见的 AI 应用场景。
而在网络应用方面,第四代英特尔® 至强® 包含一系列针对高性能、低时延网络和边缘工作负载进行了特别优化的处理器产品。对于如今电信、零售、制造和智能城市等行业正在推动更加软件定义的未来,这些处理器将发挥关键性基石作用。
对于 5G 核心工作负载,内置加速器有助于提高吞吐量和降低时延,而电源管理的升级则提高了平台的响应能力和能效。此外,与前几代相比,第四代英特尔® 至强® 在不增加功耗的情况下提供多达两倍的虚拟无线接入网(vRAN)容量。这使通信服务提供商能够将每瓦性能提高一倍,满足其关键的性能、扩展和能效需求。
在数据中心领域,除了对性能的极致追求,安全和算法隐私保护也亟需强化。随着数据向云端迁移,人工智能,机器学习,多方参与,协同工作等场景的出现,对去中心化数据,算法保护的需求趋势更加显著,必须提供切实、有效且可以落地的平台安全能力,才能契合各行各业客户对安全解决方案的需求。第四代英特尔® 至强® 可扩展处理器能够帮助实现零信任安全策略,通过先进的硬件安全技术为业务部署和风险洞察提供新的解决方案,相应的技术包括英特尔® SGX、英特尔® TME、算法硬件加速等为客户提供全方位的安全防护。
面向未来数据中心的处理器
目前,在云计算市场快速发展的同时,云服务正走向细分和深化,整个产业在技术、应用、管理等方面呈现出新的发展特点。比如随着传统行业、政企行业对云需求的高增长,以及更多的企业选择深度用云而不是简单迁移上云,其不仅带来了更多云基础资源和云平台产品的消耗,对安全、性能以及时延等提出了更高要求,也让云原生、分布式存储、专有云、混合云、云安全、算力服务等成为目前备受关注的领域,驱动着云服务厂商加大对云产品性价比、安全、技术优化等的投资,促进云服务进入提质增效新阶段。
随着云迁移在整个企业推进,云服务环境的情况变得愈加复杂。由行业最佳实践驱动的同步化业务与技术策略,可以提升由云优先运营带来的灵活性、成本效益和其他优势。企业需要提升效率,提高服务水平的可预测性,同时加速创新,更好地支持业务决策。英特尔® 至强® 可扩展处理器持续针对云计算应用领域进行软硬件优化,一直具有高效、灵活、可靠的优势。第四代英特尔® 至强® 可扩展处理器通过众多内置加速器和软件优化,在云上工作负载性能的表现上显得更加强悍。
在云原生方向,目前微服务依旧是大多企业内部转型的主要推动因素,尤其是在超大规模的平台或者是边缘云中,当下企业的需求是在跨云环境中无缝运营,确保应用在大规模环境下运行得更好、更快。像服务质量、基础设施开销和可观测性等都是目前企业在微服务方面一直持续迭代的问题,想要解决这个问题,一定要分别从云硬件和软件两个方面进行优化。
英特尔同样关注到了这些挑战,第四代英特尔® 至强® 可扩展处理器内置的加速器可以加速云平台间和云平台内的数据移动,有效保证服务质量、基础设施开销和数据、流程可观察性的运营目标。开发人员能够通过英特尔® DLB 获得硬件辅助队列,帮助实现每秒数百万个传入请求的负载均衡;通过英特尔® QAT 的加密加速实现快速分布式网络通信;以及通过英特尔® DSA)加速数据传输。
同时,在与英特尔其他数据中心技术配合使用时,在微服务方面会有更好的表现。如配置英特尔® 基础设施处理单元(英特尔® IPU),释放出更多 CPU 内核资源,提高应用性能,优化数据中心的整体利用率。还可配置英特尔® 以太网 800 系列网络适配器,为优先级高的应用、数据包处理和时延敏感型工作负载加速。
从云计算、新媒体、音视频、云游戏到移动 App,目前发展迅猛的多元云上应用都离不开数据库。从传统关系型数据库到云数据库,数据库一直在不断演进。与此同时,它也发挥着越来越重要的作用。一方面,数据库作为 IT 基础设施的关键一环,对企业业务的发展起着支撑作用;另一方面,数字化在经济社会中不断深入,数据成为核心要素,围绕数据的生产、存储和消费均依赖数据库。如何提升数据库性能,也成为了云上应用的重要探索。
为了达到更高的速度和容量水平,优化数据库性能,平衡 TCO,同时满足适合 CRM 系统和其他关键业务型数据库,第四代英特尔® 至强® 可扩展处理器通过配备英特尔® IAA, 能够在提升性能、降低时延的同时,减少所需的 CPU 内核资源,与上一代产品相比,可将 RocksDB 性能提升高达 3 倍;将 ClickHouse DB 的性能提升高达 59%。同时,还可以通过配置英特尔® 傲腾™ 持久内存,提高每节点的数据库实例密度,以类似的系统构建成本获得更多可用内存。
安全也是云计算的重中之重。静态数据或传输中的数据需要保护,而使用中的数据同样需要保护。通过第四代英特尔® 至强® 可扩展处理器,英特尔提供数据中心芯片行业广泛的机密计算产品组合,同时保护敏感数据和受到法律法规严格保护的数据。作为为数据中心计算提供应用隔离的芯片厂商,英特尔凭借英特尔® SGX,在私有云、公有云和从云到端的环境中,为使用中的数据提供硬件加密,以实现更小的攻击面,并利用云计算的成本节约优势和可扩展性,轻松完成扩展,从而在分布式网络中运行大型应用或数据库,同时更好地确保云环境的安全及数据合规。
此外,作为英特尔全新的虚拟机隔离技术,英特尔® Trust Domain Extensions(英特尔® TDX)非常适合把现有应用移植到机密环境,该特性将在微软 Azure、阿里云、谷歌云和 IBM 云中首发。
从处理器看未来数据中心的
2021 年,工信部发布《新型数据中心发展三年行动计划 (2021-2023 年)》,该计划首次提出算力指标,旨在引导数据中心从粗放的机架规模增长向提升算力的高质量发展演进,更好推动数据中心的质量变革与效率变革。
未来一年将是新型数据中心落地成果验收的关键一年,算力提升效果及其在各产业的落地,对企业深度上云用云以及重点领域的数字化转型的推动效果都将成为重要指标。在此背景下,数据中心将继续朝着灵活敏捷、高性能、高安全、高稳定性、出色的用户体验等方面转型,并帮助企业适配更多场景的负载要求,并通过绿色算力帮助企业达成可持续发展的目标。
另外,相关机构预测,到 2035 年,5G、互联网、人工智能将为全球经济带来 40 万亿美元增长,算力是其背后重要的资源依托和基础设施。在全球碳达峰、碳中和的战略背景下,“如何提高效率、降低能耗”是一个宏大的命题,这也为通过科技创新支持绿色低碳发展的厂商提出了高要求。
作为迄今为止英特尔发布的最具可持续性的数据中心处理器,第四代英特尔® 至强® 可扩展处理器在帮助企业实现可持续发展和减排目标方面迈出了重大一步。除了有助于为特定工作负载提高每瓦性能的内置加速器,它还拥有一系列管理电源和性能的功能,并在制造过程中使用了 90% 以上的可再生电力。
相比于增加 CPU 内核,内置加速器对于提高工作负载的性能来说是一种更为高效的方式。通过内置众多加速器,能够提供平台级的功率节省,并缓解对额外独立加速方面的需求,帮助客户实现可持续发展目标。此外,第四代英特尔® 至强® 可扩展处理器新的优化电源模式可以为某些工作负载带来高达 20% 的插槽节能,而对性能的影响仅有不到 5%。风冷和液冷的创新进一步降低了数据中心的总能耗。
此外,英特尔通过英特尔® On Demand 激活模式,支持用户在现场和生产中激活 CPU 中额外的内置加速器和功能,在原始 SKU 的基本配置之上就可以完成升级,企业可以灵活地改造或者升级 CPU 来支持新的工作负载,挖掘更大价值,这大大提高了企业投入产出比。
不难看出,英特尔将持续与客户及产业伙伴密切合作,基于全新的第四代英特尔® 至强® 可扩展平台,大规模提供差异化解决方案和系统,助力客户解决算力挑战,共同实现可持续发展。
面向未来的芯片厂商,应该以结果为导向,秉持工作负载至上的策略,针对特定工作负载高度优化软件,为不同工作负载和需求匹配对应的功耗和性能,并实现理想的总体拥有成本。而英特尔,无疑已经通过全新的第四代英特尔至强可扩展处理器,给出了完美的答案。
本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:3164780!