4月9日,由工业和信息化部与深圳市政府共同主办的第七届中国电子信息博览会(CITE 2019)在深圳召开,中科曙光总裁历军出席了中国电子信息行业企业家峰会并作了题为《先进计算技术,服务数字经济》的主题演讲,向与会来宾剖析和解读了先进计算对于数字经济的重要意义和强大推动。历军表示,数字经济时代IT环境复杂多变,政府及企业应充分建设先进计算力,并发挥好先进计算技术的效能,做好数字经济的“基础课”。
2018年,中国数字经济总量已达到31万亿元,占当年GDP的30%。物联网、云计算、大数据、人工智能、5G、边缘计算、超级计算等ICT技术的融合发展成为了数字经济发展的新引擎,而先进计算是新一代信息技术的核心。历军认为,对新兴技术充分融合地使用,是政府及企业面临的必修课。先进计算既是各国竞争的主要焦点和重要“赛道”,同时又给了中国在同一起跑线上并道发展、弯道超车的机会。
面对多维、综合的技术发展要求,历军指出了先进计算产业发展的若干挑战与突破点,包括国产芯片、应用软件研发及其生态的打造,技术与应用的深度融合等。
芯片作为计算产品的核心元器件,不仅直接影响计算系统产业长远发展,还关系到国家和社会经济的安全,是我国先进计算技术发展亟待提升的短板。作为长期耕耘计算系统研发的厂商,曙光公司大力集成和推介基于国产芯片的计算系统,努力建造国产芯片的产业生态。
其次,国产系统和应用软件的不足也是行业面临的最大的短板之一。现阶段,高性能计算机的商业应用软件,大部分依靠进口。历军认为,应用软件短板的问题需要全行业长期共同努力攻克。曙光也在高端模拟仿真软件等领域展开了筹划部署,由曙光和国家超级计算深圳中心、BenchCouncil联合承办的“世界智能计算机大会”,也正是为了支持国产芯片和应用软件的稳步发展,把握机遇输出“中国生态和中国标准”。
第三,在高质量发展时代,为增强研发成果的高效转化,发展先进计算技术应注重更加紧密地与具体的行业应用场景紧密结合,以市场需求驱动技术研发,切实做到产学研用一体化发展。
在峰会上,历军表达了对曙光参与深圳市信息化建设的重视。深圳在创新驱动发展的道路上为企业搭建了良好平台,曙光有机会与政府和产业通力合作,积极推动中科院科研成果在区域产业化,让先进计算技术与数字经济发展互相促进,相得益彰,更好地为深圳市及大湾区的科技创新和数字经济发展贡献力量。
好文章,需要你的鼓励
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传统查询相关的压缩方法,KVzip创建可在多种查询场景下重用的通用压缩缓存,特别适合个性化AI助手和企业信息检索系统。研究在LLaMA3.1-8B、Qwen2.5-14B和Gemma3-12B等多种模型上进行了验证,处理长度高达17万词元的文本,并能与KV缓存量化等其他优化技术无缝集成。
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析了12种偏好机制,发现人类评判者重视权威性和清晰度,而AI评判更关注事实准确性。他们提出的层次多领域回归模型不仅能准确预测偏好,还能清晰解释判断过程,为构建更透明、更符合人类价值观的AI系统提供了新途径。