ChatGPT“出圈”,百模争相涌现。今年以来,以大模型为载体的AIGC技术的快速发展,AI正迎来“iPhone 时刻”,几乎所有的企业都在探索AIGC 技术在自身领域的应用。
随着全新的技术范式正在重新定义企业 AI应用的落地方式,加速企业全面智能化升级,不少企业正通过深度整合大模型中积累的广泛智能和精确的行业知识,并将其精炼为适用于特定场景的服务。这其中,面向智能应用利用精准、安全的企业数据,融入人工智能模型超越训练数据的泛化能力成为关键所在。
智能变革:数据基础设施解码AIGC新范式
事实上,人工智能的核心是数据,而数据基础设施则是支撑人工智能应用和发展的重要基础。正如Fabarta创始人兼 CEO高雪峰在“数联世界、智见未来”Fabarta 产品与用户大会的主题演讲中指出的那样——构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在。
Fabarta 创始人兼 CEO 高雪峰
然而,构建、升级适用于AI的数据基础设施,说起来容易,做起来却并不简单。在实施过程中,企业将会遇到各种挑战和问题。
一方面,大模型“一本正经胡说八道”(幻觉)问题的存在,严重影响大模型应用的可靠性,可能会产生信息错误或侵犯隐私等严重后果。诸如在医疗等特殊场景中,若为病患提供了错误的诊断信息,甚至会影响他们的生命安全。
另一方面,企业要构建统一的私有多模态数据层,并将私有数据很好的与大模型结合起来,同时进一步提高大模型的推理能力,成为关键挑战。
针对大模型的痛点与隐患,Fabarta构筑了以数据为中心的AIGC落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。
同时,Fabarta也可以为其本地数据的 fine-tune 及预训练提供结构化的数据集,此外,作为本地知识库可以不断地进行知识的沉淀,提供可解释的智能,并为AI Agents 打造核心的数据引擎。
高雪峰表示,Fabarta不止将数据和数据之间显性、确定的关系记录在数据引擎中,通过向量的距离计算,还可以找到数据之间的丰富的隐含关系,成为了真正 AI时代可以自生长的有机数据记忆体。
基于ArcNeural智能引擎的Fabarta多模态数据编织平台,是面向AI的数据管理平台,更加智能的连接、理解、治理数据,将企业数据转化为企业知识,为AI的应用落地提供数据驱动力,同时也兼容传统的数据治理场景。
Fabarta 联合创始人兼 CTO 杨成虎
Fabarta联合创始人兼CTO杨成虎介绍道:“ArcNeural架构面向云原生,并同时支持图与向量的同表管理。此外,在数据计算分析能力基础之上,利用大模型的智能化生成多模态查询计划,以此支持严谨的企业级多模态数据洞察。”
在Fabarta 产品与用户大会现场,杨成虎展示了多模态引擎 ArcNeural结合ArcFabric、ArcPilot,利用“一体两翼范式”在 Fabarta 企业内实施的一个Copilot系统--Arc42,Arc42 集成了代码、文档、组织关系等多模态数据,协同大模型显著提升企业效能。
他总结说:“计算&存储是过去,推理&记忆才是未来”。
场景创新:为千行百业插上AI“双翼”
“抓住机遇,以数据为核心,构建支持智能化的架构,将是产业变革和发展的关键路径。”高雪峰强调,Fabarta图、向量和大模型融合的多模态智能引擎致力于打造AI时代的数据基础设施,将产品应用于各行业的具体业务场景,解决客户痛点和问题,为客户数智化转型提供技术支撑。
金融行业是Fabarta未来赋能计划的重要领域。在阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞看来,融合了图数据和向量数据处理技术的 Fabarta ArcNeural是非常有价值的产品;龙盈智达科技有限公司副总裁宫小奕对Fabarta 在金融科技场景创新和应用领域开展更深入的合作表示期待;IBM咨询中国区金融行业总经理范斌也认为,大模型时代的金融科技重塑刚刚开始,图技术和数据基础设施领域大有可为。
为了满足企业客户的需求,解决其的业务痛点,Fabarta根据当前服务的多家大型头部企业客户的现状,打磨出了“一体两翼”产品矩阵。回应杨成虎的展示,Fabarta 联合创始人兼 CPO仲光庆透露,“一体两翼”产品矩阵,以多模态引擎为基础,数据与AI平台为双翼,为企业提供全链路支持,助力金融、服务、保险、医疗等多个行业客户解决业务中的问题,并且成功实施落地。
Fabarta 联合创始人兼 CPO 仲光庆
在保险行业,作为保险行业头部企业,泰康养老利用Fabarta产品,实现了数据资产项目。通过Fabarta ArcFabric 产品以及图和AI的能力,泰康养老已经构建从数据到资产、从资产到服务的全链路。泰康养老数据基建部总经理吴坚表示,泰康养老已实现数据资产管理、数据治理与数据研发的协同以及治研一体的管理落地,未来会与 Fabarta 进行数据编织领域更深入的探索和落地。
在企业服务方面,作为专注于智能企服及供应链数字技术的高新技术企业,大树科技利用 ArcGraph和 ArcPilot产品,结合海量企业数据和交易数据,构建企业图谱和交易图谱,开展企业图谱业务分析、交易流水分析以及团伙欺诈分析,及时发现关联风险从而有效避免损失。“大树科技期待与 Fabarta 进行更多合作和共创,从图智能扩展到大模型与图融合等更多领域。”大树科技风控和大数据负责人申宇峰这样说。
“我有一个愿景,就是打造属于这个时代创新的数据基础设施,希望 Fabarta 的产品,可以帮助万千企业打造核心的面向智能应用的数据基础设施。”高雪峰如是说。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。