云设施?打的就是云设施!
戴尔已经宣布与Facebook母公司Meta开展合作,帮助客户轻松在本地基础设施之上部署Llama 2大语言模型(LLM),借此摆脱对云设施的严重依赖。
戴尔表示,希望使用自有IT基础设施部署并运行Meta AI模型的企业客户已经形成了一定规模的市场,而戴尔正努力成为这部分业务的首选供应商。
此项目以戴尔的生成式AI组合验证设计为核心,这套设计方案今年刚刚公布了与GPU大厂英伟达联合开发的预测试硬件版本。除此之外,戴尔还负责提供部署和配置指导,帮助客户在短时间内顺利完成设施的启动和运行。
例如,戴尔已经将Llama 2模型整合至其系统级调整工具当中,借此指导客户正确完成配置、实现其希望通过AI模型达成的目标。
戴尔公司首席AI官Jeff Boudreau在一份声明中表示,包括Llama 2在内的各类生成式AI模型,有望“改变行业的运营与创新方式”。
他强调称,“通过与Meta的技术合作,戴尔将提供详尽的实施指南以及适合各类部署规模的最佳软硬件基础设施,确保所有客户都能更轻松地使用开源生成AI模型。”
Llama 2是一套经过预训练的微调语言模型,于今年7月首次公开亮相,具体提供三种体量选项:70亿参数版本,130亿参数版本,以及700亿参数版本,不同版本分别对应不同的硬件需求。
该模型可免费下载以供研究用途,同时也支持部分商业应用。Meta公司已经与微软和亚马逊合作,推动自家模型登陆Azure和AWS云平台。
当时就有媒体指出,由于Llama 2模型并未获得开放源代码促进会(OSI)批准的许可证,因此称其为“开源”其实存在一定争议。
戴尔的生成式AI验证设计(Validated Designs for Generative AI)计划推出于今年8月,主张将其服务器套件与英伟达GPU、存储及软件(包括英伟达的AI Enterprise套件)相结合。戴尔公司已经确认将提供硬件基础和配套的专业服务,以帮助客户启动并运行生成式AI负载——当然,也要收取相应费用。
整套验证设计方案主要强调推理类负载,适用于涉及自然语言生成的应用场景,例如聊天机器人和虚拟助手、营销与内容创建等。戴尔公司还表示,后续将进一步扩展其产品组合以支持对模型的定制和微调。
根据戴尔公司的介绍,70亿参数版本的Llama 2只需单个GPU即可运行,130亿参数版本则需要双GPU承载,而700亿参数版本需要8个GPU。戴尔在博文中概述了如何在PowerEdge R760xa系统上部署70亿与130亿参数两个模型版本(https://infohub.delltechnologies.com/p/deploying-llama-2-on-the-dell-poweredge-xe9680-server/);而700亿参数版本因为需要8个GPU,所以只能在PowerEdge XE9680级别的服务器上运行。
好文章,需要你的鼓励
人工智能芯片初创公司Cerebras Systems称已解决美国外国投资委员会(CFIUS)对其资金来源的担忧,为计划中的首次公开募股(IPO)扫清了一个关键障碍。公司修改了与阿联酋G42的协议,限制其持有无表决权股份,以消除监管机构的顾虑。Cerebras正积极拓展客户群,计划在北美和法国部署大量AI加速器,以提供高性能推理即服务平台。
在人工智能日益承担编码和软件开发工作的今天,人类是否还需要学习这些计算机编程技能?这个问题对于很多人的职业选择以及领导者和人才培养者来说都很重要。本文从多个角度分析了为什么学习编程仍然很有价值,包括培养批判性思维、更好地利用AI辅助编程、了解企业环境、发挥人类创新优势、调试和修复代码等。文章强调,关键是要学习新的"氛围编程"范式,将编程知识与现代世界运作方式相结合。
量子计算技术的发展引发了对传统加密方法安全性的担忧。然而,与其将其视为对网络安全的威胁,不如将其看作科学领域的一次重大突破。量子计算在材料科学、药物研发和医疗保健等领域的应用前景更为广阔,可能为人类带来更多长远利益。本文探讨了量子计算的实际应用场景,以及它对加密技术的影响可能被夸大的原因。
根据全球移动通信协会5G Americas的最新研究,5G网络在商用五年后达到了历史性里程碑。到2024年底,全球5G连接数将达22.5亿,增速是4G的四倍。预计到2029年,5G连接将增至83亿,占全球无线技术的59%。北美率先实现5G和4G LTE商用网络数量持平,5G覆盖率达77%。拉丁美洲5G连接数一年内翻倍至7600万。这些数据凸显了5G技术的快速普及,远超前几代无线技术。