2023年之光:第四代和第五代至强
距离今年年初发布第四代至强处理器的338天,英特尔再一次重磅出击——代号“Emerald Rapids”的第五代英特尔至强可扩展处理器(以下简称为第五代至强)跃然于世。该处理器具备在性能、能效、缓存等方面的多维提升,成为2023年英特尔在数据中心领域执行进程的完美收官之作。
一年内以出色的迭代性能迅速推进两款处理器,这一了不起的举措离不开英特尔内部精准的产品规划、井然有序的工作流程,以及超强的团队协作。而高达两位数的性能和能效攀升,不仅需要有领先的技术,也需要对处理器的深刻理解。对此,数据中心处理器架构高级首席工程师Irma Esmer Papazian十分有发言权。
在Irma大学时代,计算机工程是学校的热门专业之一,抱着对未知事物的好奇心,Irma在这个人生重大转折点做出了自己的选择,也开启了她长达数十年的计算机工程从业生涯,其中在英特尔数据中心事业部就有30年之久。
1992 年,Irma硕士毕业后由校招进入英特尔,她说:“我在英特尔迅速成长,这是一份令人梦寐以求的工作。”作为团队里最年轻,也是唯一的女性,她不断向更资深的同事学习多种经验。她在安腾处理器开发团队工作了近10年,于2005年转至至强团队。可以说,在此后的18年里,她亲历了至强发展的整个过程。这对第五代至强的诞生至关重要,因为它正是需要一个兼具新、老面孔和思维的团队来打造的产品。
早在推进四代至强之际,第五代至强的研发工作便已井然有序地展开。Irma在第四代至强开发结束时参与了第五代至强的流片工作。彼时,大部分的团队成员在第四代至强推出后便转入了将于2024年推出的Granite Rapids的开发团队,而Irma则在一年内两次加入产品研发团队,为新团队带来她在第四代至强开发方面的宝贵经验。
“满足客户的需求是我们的目标”
第五代至强的产品规划很简单:客户渴求更高的性能,但同时也不希望因为大功耗而导致成本上升。
芯片拓扑结构的改变让一切都成为可能——第四代至强最多拥有四个芯粒,而第五代至强则有两个密度更高、可以容纳更多核的更大Die。Irma表示,这些更大的集群具有更高的L3缓存容量、4个内存通道和32个功能内核,更适合大型虚拟机。而且,它们还能够带来更低的延迟和能耗。
芯片结构确定后,Irma和团队开始研究如何进一步提高产品的性能和能效。“在不改变芯片本身的的情况下,我们来看看还能如何进行优化。”
为此,团队内部列出了一个表格,约有十几项功能优化以满足客户的需求。其中包括对现有能效功能的改进,譬如,在上一代产品的基础上优化对CPU核心的检测,并对其退出Idle Mode的阈值进行调整(在该模式下,CPU处于低功耗状态),从而使处理器更为合理地进行模式切换来满足工作需求;此外,第五代至强新增“五级睿频”的新功能,让AVX512使用率高的工作负载拥有更高的频率。
在推出新功能和优化产品性能的同时,他们还分析了第四代至强的不足之处。此外,为帮助新成员尽快上手,团队还开发了产品调试模板和分析指南,而为了保持工作的一致性,也会定期召开团队会议以同步工作进展。
Irma提到:“我们通过一个有序的工作流程和方法,去培训整个团队,推动整体不断发展和进步。”他们建立了工作表单,以帮助在团队内部实时更新数据和工作流程。与此同时,整个团队又注重最大程度地简化该流程,Irma说这反而是整个过程中最难的部分。
“作为技术专家,我们希望集中精力研究技术问题和解决方案,并希望在项目管理和流程上尽量少花时间。但是,为了能够在完美的时间点成功完成产品迭代,甚至超前完成目标,所以我们必须加倍努力去完善整个工作流程。”
“我们遇到任何问题都会总结一份重点报告。包括:问题是什么?根本原因是什么?应该如何解决?如何才能避免下一代产品遇到同样的问题?亲身经历过这一切之后,我发自内心为整个第五代至强研发团队感到无比自豪。验证、架构、设计和制造团队齐心协力,在预定时间内实现了‘最佳’的产品性能。”
团队协作的力量
当投入日常工作时,人们总是忙忙碌碌,容易纠结细节,也容易过于专注手头的工作。
Irma说:“某些时候,你太努力工作了,以至于失去了大局观。我总是试图强调全局,也就是一个人正在做的事情与最终目标之间的关系,所以设定长远目标很有用。而且,我也一直提醒大家,每个人都不孤单,我们是一个团队,应该善于运用集体的智慧。遇到问题,不要埋头苦干,先看看问题是否已经被同事解决了,这样的话,只需改进即可。”她补充道,团队每个人的贡献很重要,而他们觉得自己在团队中是有价值这也很重要。
“如果一个人做了工作并付出努力,他们应该得到正面的反馈,并知道自己的努力被看到、被认可。当我们作为一个团队开展工作时,我们非常强调这一点。” Irma认为,鼓励成员寻求帮助,认可他们的辛勤工作,并培养尊重个人的企业文化,才是去面对未来可能出现的问题的解决方案。
工程师是不断发明创造、推动技术发展的肱骨力量,在技术开发过程中,工程师所遇到的难题,也永远绝非是“最后一个”,所以,学会站在巨人的肩膀上极为重要,在前沿技术的研发环境中尤其如此。
随着第五代至强处理器的成功上市,Irma将注意力转向了备受瞩目的人工智能。“目前,我正在研究AI以及大语言模型在CPU上的性能扩展。”
“瞧,总有新的挑战和问题需要我们去解决。”
 0赞
0赞好文章,需要你的鼓励
 推荐文章
                    推荐文章
                  英伟达和诺基亚宣布战略合作,将英伟达AI驱动的无线接入网产品集成到诺基亚RAN产品组合中,助力运营商在英伟达平台上部署AI原生5G Advanced和6G网络。双方将推出AI-RAN系统,提升网络性能和效率,为生成式AI和智能体AI应用提供无缝体验。英伟达将投资10亿美元并推出6G就绪的ARC-Pro计算平台,试验预计2026年开始。
这项由哥伦比亚大学研究团队完成的突破性研究首次揭示了AI系统自我改进中的"效用-学习张力"问题:系统追求更好性能时会增加复杂度,但过高复杂度会破坏学习能力。研究建立了学习边界定理,提出双门控制机制,为AI安全自我改进提供了理论基础和实用方案,对确保AI技术长期安全发展具有重要意义。
虽然ChatGPT等AI工具正在快速改变世界,但它们并非无所不知的神谕。ChatGPT擅长"令人信服的错误",经常提供有偏见、过时或完全错误的答案。在健康诊断、心理健康、紧急安全决策、个人财务规划、机密数据处理、违法行为、学术作弊、实时信息监控、赌博预测、法律文件起草和艺术创作等11个关键领域,用户应避免完全依赖ChatGPT,而应寻求专业人士帮助。
这项由Reactive AI公司Adam Filipek主导的研究提出了反应式变换器(RxT),通过事件驱动架构和固定大小记忆系统,将传统聊天机器人的对话成本从平方级降为线性级,使长期对话成本降低99%以上,同时实现恒定响应速度。实验证明即使12M参数的RxT也显著优于22M传统模型,为高效对话AI开辟新路径。
 
             
                 
                     
                     
                    