下午两点,百度北京总部迎来了一场发布会,几个星期前朋友圈就在传一张由文心一格生成的文心一言发布会海报。
经过多方打听,都没有了解到确切的信息,给文心一言吊足了胃口。
就在一天前,GPT-4也进行了开放,所以业界对于中国厂商的大模型自然也非常期待。
李彦宏在发布会现场表示,在国内,乃至全球大厂中,百度是第一个发布大语言模型的公司,也是全球范围内在IT技术栈的芯片层、框架层、模型层和应用层,4个层级中都有领先产品的公司。
面对大家的期待,李彦宏也回应,在内测时体验感并不完美,但他表示文心一言的进步空间很大,平台发布后百度将把用户的反馈、开发者的模型迭代、调用形成正向闭环,未来会带给大家新的惊喜。
生成式AI代表了新的技术范式。李彦宏表示,百度内部各个产品线都在等待这个的技术,客户也在等,所以需要尽早推出文心一言。
五大能力 文心一言带来更多场景
发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,此外也准确回答事实性问题,例如“电视剧《三体》中张鲁一和于和伟谁更高?”体现出文心一言的推理、总结分析、内容创作生成的综合能力。
在商业文案创作场景中,文心一言为企业起名字,生成新闻稿和公司口号,体现出文心一言的理解、表达能力,以及创意创作能力。
在数理逻辑推算场景中,面对经典的“鸡兔同笼”的问题,文心一言能够很快地给出准确答案,并正确识别出应用题是否存在错误。
作为根植于中国市场的大语言模型,文心一言在中文的理解和中国文化的了解上应该超出世界上任何一个与训练的模型。在现场展示中,文心一言正确地理解了古诗词的含义以及其背后的经济学原理。同时文心一言也能够处理英文,未来也会逐步训练处其他语种的能力以及跨语种的翻译能力。
多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力,语音能够生成四川话、东北话等方言语音。由于文心一言的视频生成成本较高,现阶段还未对所有用户开放,但已经接入了百家号的文章生成视频。
能够完成这些是文心一言用了几十亿次搜索请求、读过千亿万亿页内容,在不断的训练的过程当中,逐步具备了这些通用能力。李彦宏表示,这些能力还在不断完善的过程当中,使用文心一言时能够感受到惊喜,也会发现明显错误。但可以肯定的是,它的进步的速度非常快。
三大场景 创新驱动千行百业
自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。李彦宏表示,文心一言会对每一个人都带来很大影响,文心一言的大语言模型将带来三大产业机会。
李彦宏指出,第一类是新型云计算公司,目前云计算主要的商业模式是IaaS,公有云提供的基础云服务是算力。未来云计算公司的主要商业模式将变成MaaS(Model as a Service)。所以文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架、模型,以及IT技术栈的协同。此外李彦宏预告称,百度智能云将于近期举办新闻发布会,主题围绕文心一言的云服务和应用产品。
第二类是进行行业模型精调公司,李彦宏认为通用大模型和企业之间应该存在中间层,AI可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。目前,百度文心大模型已经在工业、金融、交通等10多个领域发布了行业大模型。
第三类是应用开发公司,利用大模型生成的文字、图像、音频,和数字人结合,再加上超强的理解能力和表达能力,就会创造出很多新的可能。李彦宏认为,未来最大机会不在基础服务,也不是行业服务,而是像微信、抖音、淘宝这样的应用产品。在人工智能时代,一定会出现杀手级应用、现象级产品不断带领大家走向新的里程。
“文心一言不是科技产品对抗的工具,而是一代代百度技术人员在追寻我们让科技改变世界的梦想当中的一个结果。”李彦宏最后说道。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。