本文作者:英特尔公司CEO帕特·基辛格
当我18岁加入英特尔时,一想到在这样一家技术能为全世界无数人创造积极影响的公司工作,我深受鼓舞,也心怀敬畏。如今40年过去,我所感如初。我相信,这种技术带来的积极影响力,及其深远意义,能够传递给所有技术人士 ,包括每一位开发者和每一家公司。
创新在开放、众创的环境中茁壮成长,在这样的环境下,人们可以互相联系、沟通,共同对新生事物作出响应。早在1997年,我就发起了英特尔信息技术峰会(IDF),将开发者、合作伙伴和客户等不同受众聚集在一起,共同塑造跨平台技术的未来。这种自由的交流提升了我们相互学习的能力。
如今的技术专家是站在前人的肩膀上。当时迎着信息时代的曙光,企业界、学术界和政府机构协同合作,共享研发成果,借鉴各自的发明创造,奠定了对当今世界至关重要的基石:个人计算、互联网,以及连结我们成为全球化社会的网络。当时的竞争是良性有序的,而生态系统是开放的。
当今世界所面临的挑战,比以往任何时候都亟需创新,解决这些挑战需要透明度,需要开放性。比如在新冠疫情爆发初期,德克萨斯高级计算中心(TACC)的Frontera超级计算机,从分子和原子层面描绘了新型冠状病毒图谱,发挥了重要作用。研究人员需要这些细节,以了解哪些药物和疫苗方法,最有可能成功地对抗和缓解病情。但研究所需的数千台服务器、数十万个节点、软件基础设施和建模软件,是不可能一夜之间就搭建出来的。早在疫情蔓延全球之前,大学、政府机构和企业就早已开始合作,寻求解决像癌症、气候变化等关键挑战。
类似这样的例子表明,当我们彼此之间拥有开放、选择和信任时,我们共同的未来和共同的潜力将如何被释放。
这就是为什么我从根本上对开源情有独钟,它为由软件定义的基础设施提供了动力,促进了现代数据中心转型,并开启了以数据为中心的时代。英特尔在推动开放平台和塑造行业标准方面有深厚底蕴,如USB、Wi-Fi、蓝牙等,以及所有支持这些标准的API。我相信开源会使所有最终用户、开发者、合作伙伴和企业获得成功,因为它能够激发全新的研发热情。我相信一个强大、开放的生态系统将无往不胜。科技本身没有善恶之分,只有并肩合作,我们才能确保科技最终成为一种向善的力量。
无论你创建的是移动端或台式机设备,还是部署在本地或云端的企业级系统和基础设施,抑或是网络、无线或平台;无论你开发的是硬件或软件,物联网分析或大数据;无论你领导的是一家成熟的企业或是一家仍在孵化的初创公司,我们都必须为开放生态系统创造具有吸引力、便捷、安全、更好的体验。
这就是为什么今天英特尔要强调开放性,我们将:
. 基于我们在开放平台上的深厚积淀而加倍努力,旨在赋能创新、加速我们共同的未来。
. 在类似英特尔oneAPI这样的开放式软件栈方面加大投入,推动促进行业发展的标准建设。
. 通过与广泛的生态系统合作,为开发者提供更多选择。
. 携手行业伙伴,合力解决安全与分发方面的系统性挑战。
. 携手学术界和开发者,直面如神经拟态计算和量子计算等未来挑战,一切基于开放性。
另外,作为英特尔价值观的核心,我们将以包容的态度支持开发者社区的努力,拥抱多元,尊重差异,因为它们让我们变得更好。
这就是为什么我们要在美国时间10月27日和28日召开的首届英特尔On技术创新峰会(Intel Innovation)中,重拾英特尔信息技术峰会(IDF)的举办精神。我将更多地分享有关开放、选择和信任带来的影响及其重要性。
我诚邀各位技术专家和领导者加入我们,再次致力于扩大开放生态系统的力量,明天由此精彩。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。