最近,谷歌正在向新闻机构推广其新的人工智能工具——Genesis,声称这将“帮助”记者创作文章。目前,谷歌已向《纽约时报》、《华盛顿邮报》和《新闻集团》推销其软件,声称可以有效地生成新闻报道。
知情人士透露,Genesis可以生成包括当前事件细节在内的新闻内容。它被宣传为与记者一起工作的应用程序,而不是取代他们。消息人士透露,谷歌相信Genesis将帮助记者能够专注其他任务。
谷歌的一位发言人在给Gizmodo的一封电子邮件声明中表示:“我们的目标是让记者利用那些提升工作效率的新兴技术。简而言之,使用这些工具的目的不是取代记者在报道、创作和事实核查文章中所扮演的重要角色。”
当被问及谷歌的人工智能工具是否能策划新闻报道,以及该工具与Grammarly等其他写作助手有何不同时,没有收到回应。 有关新闻机构高管却表示“它似乎理所当然地认为创作准确而有艺术性的新闻报道是一种轻松的工作。”
关于新闻编辑部人工智能的《媒体状况报告》显示,记者们对于人工智能生成的偏见、抄袭、信誉丧失和错误信息等报道,所带来的问题表示担忧。该报告调查了全球17个新闻机构的3100名记者,超过一半(58%)的受访者表示他们的主要关注点是信息的准确性,而27%的受访者表示他们面临着确保自己作为“可信赖的新闻来源”保持信誉的重大挑战。该调查还询问了他们对未来一代记者的担忧,并报道称许多人表示他们担心减少“偏见”和别“事实与观”。
现阶段,一些新闻构已经开始在新闻编辑部使用人工智能,包括CNET和AP News,而其他一些机构已经告知员工他们将开始究如何负责任地使用和应用人智能到新闻中。在CNET的案中,其最初的一半AI文章被发存在重大错误。Gizmodo的母公司G/O Media,也拥有A.V. Club、Kotaku、The Takeout、Jezebel等媒体,最近几周已经进行了错误频出的AI生成文章的测试。周二,G/O管理层公开宣布将有更多由AI生成的文章发布。
好文章,需要你的鼓励
VisTA是一种新型强化学习框架,使视觉AI能够自主探索、选择和组合多种视觉工具。与传统方法不同,VisTA无需人工监督,通过反复尝试学习哪些工具最有效。研究团队在ChartQA、Geometry3K等测试中证明,VisTA显著优于训练免费基线,特别是在分布外样本上表现更佳。其核心创新在于使用群体相对策略优化算法,让AI代理能够根据实际性能而非预设规则来选择工具,为未来发展更灵活的视觉推理系统铺平了道路。
这项研究引入了DFIR-Metric,首个专门评估大语言模型在数字取证与事件响应领域能力的基准测试集。由阿布扎比技术创新研究院领导的国际团队开发的测试包含三个部分:700道理论多选题、150个CTF风格的实际挑战,以及500个基于NIST标准的磁盘与内存取证案例。研究测试了14种顶尖大语言模型,发现虽然它们在理论知识方面表现良好(最高达92.75%准确率),但在需要多步推理的实际取证任务中仍存显著差距(最佳模型仅能解决28%的任务)。
Meta研究团队发现大语言模型在复杂推理任务中,更短的"思考链"反而能带来更高的准确率。研究人员通过三个顶级语言模型的实验证明,选择最短思考链可以比随机选择提高18.8%准确率,比最长思考链提高34.5%准确率,同时显著减少计算资源消耗。基于此,他们提出了"short-m@k"方法,只从最先完成的m个思考中选择答案,既能提高模型表现又能节省高达40%的计算资源。这一发现颠覆了"思考越多越好"的传统观念,为更高效的AI推理开辟了新路径。