下午两点,百度北京总部迎来了一场发布会,几个星期前朋友圈就在传一张由文心一格生成的文心一言发布会海报。
经过多方打听,都没有了解到确切的信息,给文心一言吊足了胃口。
就在一天前,GPT-4也进行了开放,所以业界对于中国厂商的大模型自然也非常期待。
李彦宏在发布会现场表示,在国内,乃至全球大厂中,百度是第一个发布大语言模型的公司,也是全球范围内在IT技术栈的芯片层、框架层、模型层和应用层,4个层级中都有领先产品的公司。
面对大家的期待,李彦宏也回应,在内测时体验感并不完美,但他表示文心一言的进步空间很大,平台发布后百度将把用户的反馈、开发者的模型迭代、调用形成正向闭环,未来会带给大家新的惊喜。
生成式AI代表了新的技术范式。李彦宏表示,百度内部各个产品线都在等待这个的技术,客户也在等,所以需要尽早推出文心一言。
五大能力 文心一言带来更多场景
发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,此外也准确回答事实性问题,例如“电视剧《三体》中张鲁一和于和伟谁更高?”体现出文心一言的推理、总结分析、内容创作生成的综合能力。
在商业文案创作场景中,文心一言为企业起名字,生成新闻稿和公司口号,体现出文心一言的理解、表达能力,以及创意创作能力。
在数理逻辑推算场景中,面对经典的“鸡兔同笼”的问题,文心一言能够很快地给出准确答案,并正确识别出应用题是否存在错误。
作为根植于中国市场的大语言模型,文心一言在中文的理解和中国文化的了解上应该超出世界上任何一个与训练的模型。在现场展示中,文心一言正确地理解了古诗词的含义以及其背后的经济学原理。同时文心一言也能够处理英文,未来也会逐步训练处其他语种的能力以及跨语种的翻译能力。
多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力,语音能够生成四川话、东北话等方言语音。由于文心一言的视频生成成本较高,现阶段还未对所有用户开放,但已经接入了百家号的文章生成视频。
能够完成这些是文心一言用了几十亿次搜索请求、读过千亿万亿页内容,在不断的训练的过程当中,逐步具备了这些通用能力。李彦宏表示,这些能力还在不断完善的过程当中,使用文心一言时能够感受到惊喜,也会发现明显错误。但可以肯定的是,它的进步的速度非常快。
三大场景 创新驱动千行百业
自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。李彦宏表示,文心一言会对每一个人都带来很大影响,文心一言的大语言模型将带来三大产业机会。
李彦宏指出,第一类是新型云计算公司,目前云计算主要的商业模式是IaaS,公有云提供的基础云服务是算力。未来云计算公司的主要商业模式将变成MaaS(Model as a Service)。所以文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架、模型,以及IT技术栈的协同。此外李彦宏预告称,百度智能云将于近期举办新闻发布会,主题围绕文心一言的云服务和应用产品。
第二类是进行行业模型精调公司,李彦宏认为通用大模型和企业之间应该存在中间层,AI可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。目前,百度文心大模型已经在工业、金融、交通等10多个领域发布了行业大模型。
第三类是应用开发公司,利用大模型生成的文字、图像、音频,和数字人结合,再加上超强的理解能力和表达能力,就会创造出很多新的可能。李彦宏认为,未来最大机会不在基础服务,也不是行业服务,而是像微信、抖音、淘宝这样的应用产品。在人工智能时代,一定会出现杀手级应用、现象级产品不断带领大家走向新的里程。
“文心一言不是科技产品对抗的工具,而是一代代百度技术人员在追寻我们让科技改变世界的梦想当中的一个结果。”李彦宏最后说道。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。