在过去的一年里,企业的生成式人工智能(GenAI)的可用性席卷了市场,大大提高了生产力。然而,为了成功抓住这个机会,企业需要确保他们投资于正确的解决方案。
面对商业 AI 服务和可定制的开源大型语言模型 (LLM) 等选项,企业领导者必须驾驭复杂的风险和收益环境。这种选择受到上市速度和数据安全等因素的影响,对于希望战略性投资GenAI的公司来说至关重要。
商业 GenAI 服务以其易于集成而闻名,为企业提供了一种采用 AI 的直接方式。这些平台专为立即使用而设计,无需大量设置或资源分配。它们具有强大的安全功能,是“企业就绪”的,并且通常符合数据法规。然而,人们担心这些服务如何处理敏感数据,存在在其训练集中使用专有信息的风险。此外,内容过滤的局限性以及 AI 响应不太准确的可能性也带来了挑战。例如,一项关于 ChatGPT 的研究表明,它可以正确回答 21 个问题中的 16 个,但它的回答往往比人类更谨慎。
相比之下,像 Mistral、BLOOM 和 GPT-J 这样的开源 LLM 提供了一个独特的优势——定制。它们允许企业根据其特定要求定制 AI 模型,从而获得更精确和相关的结果。这些模型使企业能够为各种任务开发他们的 AI 工具,通过可自定义的控件提供增强的安全性。正因为如此,公司在数据输入时必须谨慎,以避免人工智能中的训练偏差。总体而言,LLM 在运营投资和有效管理的专业技能方面需要更多的要求,因此公司在考虑实施 LLM 时必须考虑他们的预算和资源。
这两个选项之间的选择取决于几个因素,包括数据隐私、成本以及企业希望对其人工智能系统施加的控制水平。鉴于麦肯锡最近的一项调查,这一决策变得更加紧迫,该调查显示,40%的高管预计到2024年将增加对GenAI的投资。这一趋势凸显了企业迫切需要战略性地评估其人工智能投资,确保它们符合其数据隐私、成本和控制偏好。
商业人工智能服务,如GenAI系统,提供了一个强大的安全框架,但它们并不能自动确保对敏感对话数据的保护。除了保护知识产权外,企业还必须警惕利用人工智能技术的复杂网络威胁。企业必须为恶意行为者利用GenAI系统进行网络攻击和欺诈的可能性做好准备。一个特别令人担忧的策略是“提示注入”,黑客操纵人工智能(如 ChatGPT)来泄露敏感信息。对于公司来说,咨询其网络保险提供商以验证其当前保单中涵盖的与人工智能相关的违规行为的程度至关重要。实施全面的安全措施和了解保险范围是防范人工智能漏洞的关键步骤。
相反,缺乏内置全面安全性的开源 AI 模型要求公司创建自己的强大防御措施,包括针对提示注入攻击的措施,以及量身定制的访问和身份验证策略。
在选择人工智能解决方案时,法律和法规合规性至关重要。商业 AI 服务必须遵守国际数据法律,例如 Microsoft 遵守欧盟数据驻留法律,要求欧盟公民数据存储在欧盟境内。这对于与欧洲有联系的企业至关重要。此外,使用这些服务涉及了解有关数据泄露责任和处理人工智能生成内容的合同细节。隐私问题和数据泄露风险是值得注意的,例如针对 OpenAI 涉嫌在训练其模型时未经授权使用内容的法律诉讼等例子就凸显了这一点。
另一方面,开源 AI 将监管合规责任转移给用户。这包括遵守版权法并随时了解各种全球人工智能法规的最新信息。采用这些解决方案的企业必须保持警惕,并定期咨询法律专家,以应对人工智能不断变化的法律环境,尤其是在国际运营时,以确保持续合规并将法律风险降至最低。
驾驭这些选项的复杂性需要与企业的运营要求、安全框架和合规义务相一致的战略决策。开源 LLM 提供广泛的控制和定制,但需要对内部基础设施和熟练人员进行大量投资,以实现安全和管理。相反,如果企业希望专注于安全性和合规性,则建议使用 Microsoft Azure OpenAI 服务等商业 AI 解决方案。但是,这些应辅以额外的内部控制,包括量身定制的内容过滤和准确性管理策略。
至关重要的是,实施任何一种解决方案都需要集成符合企业策略和法律要求的内容过滤系统,以确保合规性并管理潜在风险。基于数据分类和基于角色的访问,分层安全协议对于为所选 AI 解决方案定制安全措施至关重要。
计划将 AI 集成到其工作流程中的组织必须跟上法律和监管环境。与法律专业人士持续合作以实现最新的合规性和风险缓解至关重要,尤其是在技术快速进步和法规不断变化的情况下。
随着组织越来越多地采用生成式 AI,在商业和开源模型之间进行选择是一大挑战。在选择人工智能解决方案时,组织必须仔细评估其优先事项。除了安全性和法律合规性的必要考虑因素外,评估这些技术的准确性、可定制性和成本效益也至关重要。使 AI 选择与运营目标保持一致需要平衡考虑这些关键因素,确保所选系统不仅符合监管标准,而且符合业务的特定需求和预算限制。驾驭这一领域需要一种最适合每个企业需求的战略方法。
John Prichard博士是Radiant Logic的首席产品官。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。