6月20日,人工智能企业第四范式“标新立异”产品发布会在北京召开,第四范式宣布将聚焦产业变革新范式,成为帮助企业实现智能化转型的重要伙伴,并发布了企业AI转型的“1+N”战略方法和企业级AI软硬一体集成系统——SageOne,为企业AI转型提供“软硬”一体的全栈能力支撑。
发布会上,第四范式CEO戴文渊、首席架构师胡时伟、首席研究科学家陈雨强分别分享了对企业AI转型的战略思考、产品体系构建和技术研发方向等内容,向现场来自英特尔、百胜中国、工商银行、瑞金医院等产业和行业合作伙伴的重要领导,全面展现了第四范式未来发展目标和产业蓝图。
据Gartner 2019 CIO调查显示,过去四年中企业部署人工智能(AI)的企业数量增长了270%,并在2018年增长了两倍。Gartner预测,到2021年,70%的企业将通过AI来帮助员工提高工作效率。管理者正在考虑如何加速部署AI在企业整体运营和每一核心业务流程中。
基于如此趋势,戴文渊表示越来越多的企业开始进行全面的AI转型,进入到基于数据来制定决策、推出新产品和创造新商业模式的时期,称之为产业变革的新范式。在过去4年,第四范式助力7617个客户的12648个场景,帮助他们进入到新的范式。
在帮助企业转型及应用AI的过程中,第四范式总结出企业AI转型的“1+N”战略方法。“1”是指利用AI达到极致效果,在自己的核心业务上建立绝对优势;“N”是借力科技创新带来的基础设施成本的降低,规模化的落地于更多业务场景,提升整体经营效率。
企业的核心业务通常有1或数个,在实际经营中,核心业务创造的营收占比可达80%甚至更多,因而1%的提升就足以改变企业竞争格局。以互联网应用为例,“千人千面”的个性化服务就是AI化的结果,最终,用户活跃度有多少提升,有多少转化均取决于“千人千面”的程度与效果。而对于以“供应链”为核心的零售及制造业,其竞争力取决于AI能在多大程度上提升供应链效率,降低成本。面对核心业务,AI须做到极致效果,“毕其功于一役。”
N则是指企业在全面AI改造过程中,面对成百上千个分散场景时,如果每个都做到极致,投入产出比低,因而需要规模化、高效的AI落地能力。假设一个企业有一千个场景,其中一个场景提升10倍,对整个企业来说,只有百分之一的提升。而如果能高效地完成一千个场景的全面覆盖,即使每个场景只提升1倍,那也百分之百的提升。面对场景众多的企业,AI的“规模化落地”能力是企业全面智能化转型的关键。
帮助企业实现核心业务AI应用的极致效果和大规模AI应用场景的快速落地,传统算力暴露了先天缺陷,解决算力问题成为企业AI转型的关键。第四范式联合创始人、首席架构师胡时伟表示:传统算力和AI应用负载之间存在天然的鸿沟,传统算力只是解决在计算、访存、I/O带宽的局部密集问题,而AI应用负载则需要解决全部密集的问题。发展企业级AI专用算力已经成为行业的普遍共识和大势所趋。
第四范式本次发布的企业级AI软硬一体集成系统——SageOne,是一个全新的企业级产品物种,摒弃了传统算力堆砌硬件的方式,而采用由软件定义的专用AI系统架构,更好的理解AI 算法的运算架构与逻辑,更深层次软硬件一体化的优化和加速,全面满足企业AI应用的算力需求。
SageOne内置第四范式领先的自研AI训练引擎、AI推理引擎和AI特征存储引擎三大核心引擎, 通过业界领先的“软件定义计算”软硬一体技术构建了闭环企业AI系统,贯通硬件基础设施、AI核心引擎、AI平台和AI业务应用的全价值链条,全面支撑企业AI"1+N "业务场景应用需求。
以第四范式高维算法为基础,SageOne搭载第四范自主研发的硬件加速卡——4Paradigm ATX800,内置模型训练和特征工程等多种加速能力,支持自动优化训练超参数、高位特征计算过程I/O加速和高维GBDT训练加速等应用,在企业应用场景中表现出高达10倍的训练性能。
SageOne内置第四范式自主研发的高维、分布式网络通讯协议Swift,集成pPRC自研网络通信框架、零拷贝数据交换协议等AI领先通讯技术,结合基于CLX-AP架构的参数服务器集群,展现出业界顶级机器学习性能表现。SageOne在高维特征计算过程I/O最大10X加速,高维稀疏场景模型训练比GPU提速5X以上,自研pRPC通信框架比百度bRPC和谷歌gRPC提速3-10X。
内置行业领先的自研实时特征计算引擎和模型预估引擎,SageOne为企业AI应用提供特征处理过程免开发上线、线下线上一致性保证、一键生成预估服务、异构模型统一服务等AI核心应用服务,结合非易失性存储的无限缓存和超低延迟内存存储等硬件技术,确保企业AI应用时具备海量量时序特征计算和万亿维模型实时推理能力的同时,提供百万级并发实时请求支持和99.9%请求毫秒级响应的高并发业务极速响应服务。
此外,第四范式和英特尔联合实验室一直探索最佳优化技术,并针对最新Cascade Lake-AP处理器的全新AVX512指令集、多核心及主频利用率和CLX AP微架构IO总线的利用率进行全面优化。
胡时伟认为,解决企业AI应用算力负载问题,单靠增加硬件是无法完成的。只有通过AI算法对整个AI算力平台系统的重新定义,才能帮助企业支撑AI“1+N”应用场景的需求。
今天,产业变革才刚刚拉开帷幕,还需要更多创新技术加速发展。第四范式每年投入超50%资源在未来科技研发上,不断探索、验证和投产真正的企业级AI应用技术,持续加速产业变革进程。第四范式联合创始人、首席科学家陈雨强为现场嘉宾和媒体记者详细展示了第四范式在GEN0(投产技术)、GEN1(验证技术)、GEN2(探索技术)的技术布局,勾勒出未来企业级AI技术的发展方向和蓝图。
AI应用规模化的前提是低门槛、自动化的AI技术,其中,关键性技术是AutoML。第四范式在AutoML技术研发和产品落地领域走在世界前列,现场陈雨强首次提出了全新特性的AutoML 2.0技术。AutoML 2.0不仅是世界首个交互式AutoML技术,同时具备自动跨表特征增强能力。在世界知名的Kaggle机器学习竞赛中,第四范式AutoML 2.0与数据科学家共同挑战多项竞赛,竞赛结果数据显示全世界平均每7-10位数据科学竞赛选手,只有1位能击败第四范式AutoML 2.0;而在结构化机器学习问题上第四范式AutoML 2.0比Google Cloud AutoML排名靠前61.2%,在图像分类问题上比它排名靠前64.2%。
基于目前企业AI应用的痛点问题,第四范式未来还将引入隐私保护迁移学习(AutoPTL)、自动半监督机器学习(AutoSSL)、自动正样本和无标签样本学习(AutoPU)、自动知识图谱嵌入(AutoKGE) 等众多Auto“黑科技”到产品体系中,提高企业AI应用率和价值。
以AI For Everyone为企业愿景,第四范式致力于携手客户与行业伙伴,把AI带到每一个行业,普惠人们的生活。发布会上,第四范式宣布开启“启航”合作伙伴计划,着力打造基于“先知”平台的生态体系建设。
“推动各领域的企业AI转型,进入到新范式,仅靠第四范式一家公司的力量是不够的。”第四范式商务副总裁梁军在“启航”计划启动仪式上表示,第四范式面向合作伙伴和开发者的开放,将越来越全面和深入,让越来越多的行业和企业能够低门槛地获取AI能力。基于先知平台,第四范式建立起产品赋能、咨询赋能、交付赋能、营销赋能、技术赋能五大赋能中心,正与广大解决方案商、咨询服务商、实施服务商、渠道分销商及开发者开展生态合作,形成一个强强联合、互补共赢的AI合作伙伴生态,共同启航AI蓝海。
人工智能被认为是引领新一轮科技革命和产业变革的战略性技术,AI转型不仅是企业战略上的需要,更成为企业未来竞争力和创新力的关键。第四范式将继续发挥自身在算法研究、技术研发等方面的优势,融合领先硬件技术,为客户和合作伙伴带来更多的创新技术和产品,为AI在更多企业的落地贡献力量。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。