中国人工智能实验室深度思考发布了其所谓的推理模型DeepSeek-R1的开放版本,声称在某些人工智能基准测试中表现与OpenAI的o1相当。R1在AI开发平台Hugging Face上以MIT许可证提供,意味着可以在商业上无限制使用。深度思考表示,R1在AIME、MATH-500和SWE-bench Verified基准测试中超越了o1。AIME使用其他模型来评估模型的性能,而MATH-500是一个包含文字问题的集合。SWE-bench Verified则专注于编程任务。
一家来自英国的初创公司 Epoch Biodesign,源于创始人 Jacob Nathan 在高中时的科学项目,利用酶分解塑料废物,已成功获得超额认购的 1830 万美元 A 轮融资。
OpenAI 已开始向其 ChatGPT Plus 用户推出最新的 AI 模型 GPT-4.5。OpenAI 在 X 平台上发布的一系列帖子中表示,此次推出将持续“1-3 天”,并预计速率限制会有所变化。
PEAK:AIO推出了一款新的2RU 1.5 PB AI 数据服务器产品,使用戴尔硬件,数据传输速率达到120 GBps。PEAK:AIO是一家专注于人工智能的英国存储初创公司,提供基于第三方硬件的软件定义存储,密切管理和控制以降低延迟并提高吞吐量。其2RU服务器已为中型GPU集群提供40 GBps的传输速率,现可实现三倍的速度。
在巴塞罗那的移动世界大会上,OpenAI董事会主席布雷特·泰勒在与CNN主持人安娜·斯图尔特的对话中并没有给出“AI代理”的明确定义。他回避了关于“代理AI”与“生成AI聊天机器人”之间区别的问题,指出人们对前者的反感与对AI代理“富有同情心”回应的喜爱。泰勒表示,他对大型语言模型和当前技术浪潮的兴奋程度超过了他记忆中的任何技术,甚至自他青少年时期发现互联网以来。
一段令人惊叹又让人不安的AI语音演示在网上引发热议。2013年,斯派克·琼斯的电影《她》描绘了一个人们与AI语音助手建立情感联系的未来。近12年后,AI初创公司Sesame发布的新对话语音模型使这一虚构的设想更接近现实,许多用户对此感到既着迷又不安。
Cohere的非营利研究实验室本周发布了一款多模态“开放”AI模型Aya Vision,该实验室声称其为同类最佳。Aya Vision能够执行图像描述、回答照片相关问题、翻译文本以及生成23种主要语言的摘要等任务。Cohere还通过WhatsApp免费提供Aya Vision,称这是“使技术突破对全球研究人员可及的重要一步”。
对于企业来说,从启动到可持续增长的道路可能充满不确定性,但关键在于:解决真实问题,让客户为你的解决方案付费,并确保收入超过获取成本。对于独立创业者而言,在没有雇佣资源的情况下实现规模化的挑战更为艰巨。幸运的是,今天的企业家有一个强大的替代方案:人工智能代理。这些自主的人工智能工具可以帮助你的企业在不立即扩展团队的情况下实现增长,这在每一美元收入都要重新投入到业务中的阶段尤为重要。
AI助手正如火如荼,但专注于分析、整理和得出结论的大量数据的助手又如何呢?Google的数据科学助手正是为此而生:这款新的、免费的Gemini 2.0驱动的AI助手,旨在自动化数据分析,现已在特定国家和语言中向18岁及以上用户免费提供。
OpenAI 最近推出了 GPT-4.5,这款新模型在准确性测试中表现优于之前的版本,能够更好地理解细微差别。尽管面临 GPU 短缺的挑战,OpenAI 仍然致力于将这一模型推向市场,并计划在未来推出更先进的推理能力模型。
Contextual AI今天发布了其基础语言模型(GLM),声称在行业中提供了最高的事实准确性,超越了Google、Anthropic和OpenAI的领先AI系统,在一个关键的真实性基准测试中表现出色。该公司由检索增强生成(RAG)技术的先驱创立,GLM在FACTS基准测试中获得了88%的事实得分,而Google的Gemini 2.0 Flash为84.6%,Anthropic的Claude 3.5 Sonnet为79.4%,OpenAI的GPT-4o为78.8%。
VDURA是一家高性能计算和人工智能并行文件系统存储供应商,最近在其V5000硬件架构平台上增加了一个高容量全闪存存储节点。V5000于三个月前推出,配备了中央瘦型(1RU)控制节点,控制混合闪存+磁盘存储节点。新推出的全闪存F节点是一个1RU服务器机箱,最多可容纳12个128 TB NVMe QLC SSD,提供1.536 PB的原始容量。VDURA的首席执行官Ken Claffey表示,AI工作负载需要持续的高性能和可靠性,因此V5000不仅能达到最高速度,还能在硬件故障的情况下保持这些速度。
Google Cloud 推出两项新的 AI 功能:一是面向数据科学家的 Data Science Agent,可在 Google Colab 中快速进行数据分析;二是面向医疗专业人士的 Vertex AI Search 多模态搜索功能,可更全面地分析患者健康信息。这些 AI 创新旨在提高数据分析效率和医疗诊断准确性,推动 AI 在科技和医疗领域的应用。
领先的 AI 公司正在采用"蒸馏"技术,以创造更便宜、更易采用的 AI 模型。这种技术在 DeepSeek 成功应用后引起广泛关注,引发了硅谷 AI 领导地位的动摇。蒸馏技术通过将大型语言模型的知识转移到小型模型中,实现了高效且经济的 AI 应用。这一突破为初创公司和开发者提供了更多机会,同时也对现有 AI 公司的商业模式构成了挑战。
人工智能公司 Anthropic PBC 今日宣布已完成一轮 35 亿美元的融资,估值达到 615 亿美元。这轮 E 轮融资在公司从 Google LLC 筹集 10 亿美元不到两个月后进行。两个月前,亚马逊公司将对 Anthropic 的投资翻倍至 80 亿美元。亚马逊网络服务自去年九月起成为该人工智能提供商的主要云服务商。
云计算基础设施提供商 CoreWeave Inc. 正在瞄准公开市场,希望借此满足投资者对人工智能的强烈需求。该公司今天表示,已向美国证券交易委员会提交了首次公开募股所需的文件,文件显示其将在纳斯达克交易所以“CRWV”股票代码交易。摩根士丹利主导此次发行,摩根大通和高盛提供协助。
自2022年末ChatGPT推出以来,专家们一直在讨论人工智能语言模型将如何影响世界。几年后,情况逐渐明朗。根据斯坦福大学领导的新研究,分析了跨多个行业的超过3亿条文本样本,发现人工智能语言模型现在在各行业的专业沟通中提供了高达四分之一的写作支持,尤其是在美国教育水平较低的地区影响显著。
Zoom Communications的研究团队开发了一种突破性技术,能够显著降低人工智能系统在处理复杂推理问题时所需的成本和计算资源,可能会改变企业大规模部署AI的方式。该方法称为草稿链(Chain of Draft,CoD),使大型语言模型能够用最少的文字解决问题——所需文本仅为当前方法的7.6%,同时保持或甚至提高准确性。研究结果上周在arXiv研究库中发表。
Podcastle是一款播客录制和编辑平台,现已推出名为Asyncflow v1.0的AI文本转语音模型,并为开发者提供API接口,方便其在应用中直接集成该模型。新模型支持超过450种AI语音,能够为文本进行朗读。该公司表示,其技术和模型的训练及推理成本较低,使其在竞争中具备优势。Podcastle的创始人Arto Yeritsyan表示,尽管开发成本高昂,但得益于最近的大型语言模型进展,Podcastle终于能够在不需要大量数据的情况下构建高质量的语音模型。
C++ 的创始人比雅恩·斯特劳斯特鲁普呼吁 C++ 社区捍卫这门编程语言,近年来由于其内存安全缺陷而被网络安全机构和技术专家所忽视。