身处日新月异的数字化时代,面对新概念、新技术、新应用的不断涌现,应如何穿越技术周期,让前沿研究能够快速转化为真正有利于产业和大众的应用?
近日,在“英特尔中国研究院、南京英麒智能科技2023探索创新日”上,英特尔研究院副总裁、英特尔中国研究院院长宋继强发表了题为“智·变 拓·界”的主题演讲,分享了英特尔中国研究院对数字化时代半导体行业技术创新的思考,及在诸多前沿技术领域的最新进展。
智:数智赋能 大势所趋
中国数字经济正在“量质齐升”,势头正好,据中国信通院预计,到2032年其规模将超过100万亿元,因此,对由半导体所提供的算力的需求也在不断增长。
宋继强认为,半导体行业已加速迈入“万亿时代”,一方面,英特尔坚信摩尔定律仍将延续,到2030年可在单个封装内集成一万亿个晶体管;另一方面,同样到2030年,预计全球半导体市场的规模将达到一万亿美元(数据为近似值,数据来源:麦肯锡);同时,伴随着人工智能技术的“腾飞”,万亿级的训练参数也带来了前所未有的市场需求。
变:唯变所适 唯义所在
在数字化大潮中,半导体行业只有“唯变所适”,才能“生机盎然”。英特尔便正在加速推进名为“IDM 2.0”的战略转型,在晶圆制造、封装、芯粒、软件等领域多维投入,英特尔中国研究院在创新方面也有一套独特的逻辑。
宋继强介绍,英特尔中国研究院一直坚持着“双轮驱动,融合创新”的底层逻辑,即在“创新领域探索”和“规模化商业化导向”的“双轮”驱动下,融合国内外先进技术促进可持续创新。更进一步,宋继强将英特尔中国研究院的探索逻辑总结为循序渐进的“3S”,即“发现(Seek)”、“解决(Solve)”和“推广(Scale)”。英特尔中国研究院会和产业界、学术界的合作伙伴一起发现问题、找到机会,然后进行技术研发和测试以产出相应的解决方案,并在其被验证可用之后,利用英特尔在产品、技术平台上的优势和广泛的生态系统合作伙伴进行市场推广,最终实现立足中国的大规模商业化。
落脚到具体实践中,英特尔中国研究院在不断探索前沿研究领域的同时,也致力于推进国内外先进技术的本土化应用。
拓:上下求索 奋力开拓
宋继强分享了英特尔中国研究院去年奋力开拓的两个新领域:
界:无界融合 未来可期
在国内外先进技术的本土化应用方面,英特尔中国研究院也在与国内产业界、学术界携手全面发力:
在“万亿时代”立于创新前沿
从小想法到大发现,科技创新的车轮不会停歇,正如宋继强所言,“数字化转型正在推动我们探索新的技术高度和广度,我们一定要能够适应这个变化,在技术方面继续上下求索,找到新的创新点,坚持把好的技术用在好的方面,同时突破现有的限制,在更多领域试验新的应用和商业模式”。
在未来,英特尔中国研究院会继续致力于开拓从底层技术到现实应用的全栈、前沿研究领域,并帮助强化中国产业界、学术界之间协同创新的网络,承担起推动本土创新的责任,不断探索计算的新可能,推动算力发展。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。