ZDNet至顶网服务器频道 10月28日 评论分析(文/赵效民): 自IT技术进入中国以来,中国对于自主IT的完整追求,就从没有停止过,回顾历史,我们可以看到很多熟悉的中国自主IT产品与相应的解决方案,包括了CPU、服务器、存储、网络、操作系统、数据库等多个层面。不管怎样,它们都代表了中国各方对自主IT的向往与努力,而今天(2014年10月28日)成立的“中国POWER技术产业生态联盟(下文简称为“中国POWER技术联盟”)”,则就是其中的最新的一次实践。
现在一谈到中国自主IT的发展,很多人第一时间会想到中国政府。这是显而易见的,从某种角度上讲,中国政府对于自主IT的发展已经是一项国家战略,这背后的IT需求已经与民间企业有很大的不同,不得不说它与中国政府总体的国家信息安全战略有着密切关系,也许某些人理解不了,但在我看来,对于中国这样的大国,的确无可厚非。
也正是因为这样的需求,相应的核心技术发展战略与总体的生态环境构建,也自然要由政府部门自己来操心,并号召相关的中国本土IT提供与服务商积极响应。这次的“中国POWER技术联盟”也不例外,在大会上,江苏省政府副省长史和平、苏州市市长周乃翔、国家工业和信息化部副部长杨学山亲临会场做开场致辞,无疑体现出了国家主管部门与相关地方政府对此事的重视。
来自中国工业和信息化部、江苏省、苏州市以及其他地区部门的政府领导,见证了“中国POWER技术联盟”参与厂商与机构的签约仪式
这样的背景,也让我们从“国家高度”上对中国POWER技术联盟有了一个率先认识。
中国POWER技术联盟到底要干啥?
从相关政府部门的官方表态中,我们能清晰的明白“中国POWER技术联盟”的用意与发展目标——围绕OpenPOWER生态建设,打造“芯片—软件—整机—系统—信息服务”全产业链;以硬件性能的提升带动软件发展,以软件的优化升级促进硬件技术进步,推动信息技术产业发展水平整体提升。
我认为,打造“芯片—软件—整机—系统—信息服务”全产业链是“中国POWER技术联盟”的核心使命,而这个全产业链也就是我们常说的“生态环境”。不过这个词在所有主推国产化系统的部门的嘴中都说烂了,那么“中国POWER技术联盟”又有何特殊之处呢?在我看来,它最特别的地方是提供了一座“桥”,让中国自主的软件方案与国际主流CPU平台更好衔接的同时,又满足了硬件系统国产化的需求。而这座桥并不是一直存在,让中国人现在才发现它,事实上它源于IBM对于POWER技术的开放,为中国自主IT的发展提供了一个崭新的契机,进而为“中国POWER技术联盟”的诞生提供了基础保证。
由于在一个垂直的IT生态环境中,底层的CPU平台最为重要,它决定了软件平台开发与优化的方向,而综观中国自主CPU的发展,可以说能试的我们都试了一遍——MIPS、ARM、Alpha、SPARC等,这些CPU架构在核心授权方面并非难事,但在整体的企业级生态配套方面却均不尽如人意。ARM虽然在移动端风生水起,但在企业级领域还有很长的路要走,其他三个无论在哪个市场都已被边缘化。利用这些底层架构开发CPU易,可建立完整的应用生态环境则难比登天——并不是说中国没有相关的产品,但在一个具体的垂直组合中则往往搭配不上,而这种垂直化方案组合上的“捉襟见肘”就是中国自主IT生态环境建设的真实写照。
事实上,中国本土并不缺乏中间件、数据库以及企业关键应用(ERP、CRM)产品,可大都是基于全球主流CPU平台的(尤其是英特尔x86与IBM POWER,两者目前是企业级应用的主流平台,前者统治了Linux与Windows市场,后者统治了UNIX市场),基本与国产CPU无缘。也因此,时至今日,中国自主CPU平台都局限于某些特定的市场(比如定制的HPC系统以及专属的政府环境)。
而“中国POWER技术联盟”将借助OpenPOWER打造自己的POWER处理器,并由此成功嫁接POWER既有的生态环境,以期做到中国自主IT环境建设的“一举两得”。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。