2023年之光:第四代和第五代至强
距离今年年初发布第四代至强处理器的338天,英特尔再一次重磅出击——代号“Emerald Rapids”的第五代英特尔至强可扩展处理器(以下简称为第五代至强)跃然于世。该处理器具备在性能、能效、缓存等方面的多维提升,成为2023年英特尔在数据中心领域执行进程的完美收官之作。
一年内以出色的迭代性能迅速推进两款处理器,这一了不起的举措离不开英特尔内部精准的产品规划、井然有序的工作流程,以及超强的团队协作。而高达两位数的性能和能效攀升,不仅需要有领先的技术,也需要对处理器的深刻理解。对此,数据中心处理器架构高级首席工程师Irma Esmer Papazian十分有发言权。
在Irma大学时代,计算机工程是学校的热门专业之一,抱着对未知事物的好奇心,Irma在这个人生重大转折点做出了自己的选择,也开启了她长达数十年的计算机工程从业生涯,其中在英特尔数据中心事业部就有30年之久。
1992 年,Irma硕士毕业后由校招进入英特尔,她说:“我在英特尔迅速成长,这是一份令人梦寐以求的工作。”作为团队里最年轻,也是唯一的女性,她不断向更资深的同事学习多种经验。她在安腾处理器开发团队工作了近10年,于2005年转至至强团队。可以说,在此后的18年里,她亲历了至强发展的整个过程。这对第五代至强的诞生至关重要,因为它正是需要一个兼具新、老面孔和思维的团队来打造的产品。
早在推进四代至强之际,第五代至强的研发工作便已井然有序地展开。Irma在第四代至强开发结束时参与了第五代至强的流片工作。彼时,大部分的团队成员在第四代至强推出后便转入了将于2024年推出的Granite Rapids的开发团队,而Irma则在一年内两次加入产品研发团队,为新团队带来她在第四代至强开发方面的宝贵经验。
“满足客户的需求是我们的目标”
第五代至强的产品规划很简单:客户渴求更高的性能,但同时也不希望因为大功耗而导致成本上升。
芯片拓扑结构的改变让一切都成为可能——第四代至强最多拥有四个芯粒,而第五代至强则有两个密度更高、可以容纳更多核的更大Die。Irma表示,这些更大的集群具有更高的L3缓存容量、4个内存通道和32个功能内核,更适合大型虚拟机。而且,它们还能够带来更低的延迟和能耗。
芯片结构确定后,Irma和团队开始研究如何进一步提高产品的性能和能效。“在不改变芯片本身的的情况下,我们来看看还能如何进行优化。”
为此,团队内部列出了一个表格,约有十几项功能优化以满足客户的需求。其中包括对现有能效功能的改进,譬如,在上一代产品的基础上优化对CPU核心的检测,并对其退出Idle Mode的阈值进行调整(在该模式下,CPU处于低功耗状态),从而使处理器更为合理地进行模式切换来满足工作需求;此外,第五代至强新增“五级睿频”的新功能,让AVX512使用率高的工作负载拥有更高的频率。
在推出新功能和优化产品性能的同时,他们还分析了第四代至强的不足之处。此外,为帮助新成员尽快上手,团队还开发了产品调试模板和分析指南,而为了保持工作的一致性,也会定期召开团队会议以同步工作进展。
Irma提到:“我们通过一个有序的工作流程和方法,去培训整个团队,推动整体不断发展和进步。”他们建立了工作表单,以帮助在团队内部实时更新数据和工作流程。与此同时,整个团队又注重最大程度地简化该流程,Irma说这反而是整个过程中最难的部分。
“作为技术专家,我们希望集中精力研究技术问题和解决方案,并希望在项目管理和流程上尽量少花时间。但是,为了能够在完美的时间点成功完成产品迭代,甚至超前完成目标,所以我们必须加倍努力去完善整个工作流程。”
“我们遇到任何问题都会总结一份重点报告。包括:问题是什么?根本原因是什么?应该如何解决?如何才能避免下一代产品遇到同样的问题?亲身经历过这一切之后,我发自内心为整个第五代至强研发团队感到无比自豪。验证、架构、设计和制造团队齐心协力,在预定时间内实现了‘最佳’的产品性能。”
团队协作的力量
当投入日常工作时,人们总是忙忙碌碌,容易纠结细节,也容易过于专注手头的工作。
Irma说:“某些时候,你太努力工作了,以至于失去了大局观。我总是试图强调全局,也就是一个人正在做的事情与最终目标之间的关系,所以设定长远目标很有用。而且,我也一直提醒大家,每个人都不孤单,我们是一个团队,应该善于运用集体的智慧。遇到问题,不要埋头苦干,先看看问题是否已经被同事解决了,这样的话,只需改进即可。”她补充道,团队每个人的贡献很重要,而他们觉得自己在团队中是有价值这也很重要。
“如果一个人做了工作并付出努力,他们应该得到正面的反馈,并知道自己的努力被看到、被认可。当我们作为一个团队开展工作时,我们非常强调这一点。” Irma认为,鼓励成员寻求帮助,认可他们的辛勤工作,并培养尊重个人的企业文化,才是去面对未来可能出现的问题的解决方案。
工程师是不断发明创造、推动技术发展的肱骨力量,在技术开发过程中,工程师所遇到的难题,也永远绝非是“最后一个”,所以,学会站在巨人的肩膀上极为重要,在前沿技术的研发环境中尤其如此。
随着第五代至强处理器的成功上市,Irma将注意力转向了备受瞩目的人工智能。“目前,我正在研究AI以及大语言模型在CPU上的性能扩展。”
“瞧,总有新的挑战和问题需要我们去解决。”
好文章,需要你的鼓励
英国宠物慈善机构PDSA数据显示,超过半数宠物主担心无法承担兽医费用。科技公司正通过AI和物联网技术解决这一市场需求。在伦敦兽医展上,多家初创公司展示了创新技术:AI for Pet利用视觉AI分析宠物眼部、皮肤等图像提供健康洞察;Sylvester.ai开发AI模型识别猫咪疼痛表情;VEA整合患者数据自动化诊断。此外,智能项圈等物联网设备可追踪宠物健康症状。这些技术有助于宠物主采取预防措施,降低兽医费用。
卡内基梅隆大学联合Adobe开发出革命性的NP-Edit技术,首次实现无需训练数据对的AI图像编辑。该技术通过视觉语言模型的语言反馈指导和分布匹配蒸馏的质量保障,让AI仅用4步就能完成传统50步的编辑任务,在保持高质量的同时大幅提升处理速度,为图像编辑技术的普及应用开辟了全新道路。
北欧国家启动统一人工智能产业计划,旨在通过合作在全球舞台上竞争,获得微软和谷歌支持。10月成立的新北欧AI中心获得350万英镑初始预算,但谷歌和微软是唯一提供资金支持的科技公司,具体金额保密。该中心将开发生成式AI系统并建设应用AI服务的系统。北欧教育部长承诺追加资金开发大型北欧语言生成AI模型。尽管资金有限,但北欧国家希望通过联合力量在AI竞赛中提升地位。
复旦大学团队突破AI人脸生成"复制粘贴"痛点,开发WithAnyone模型解决传统AI要么完全复制参考图像、要么身份差异过大的问题。通过MultiID-2M大规模数据集和创新训练策略,实现保持身份一致性的同时允许自然变化,为AI图像生成技术树立新标杆。