中国苏州——GTC China——2019年12月18日——阿里巴巴近期使用NVIDIA GPU大规模部署AI,在年度最大购物节日——“双十一”,为客户提供服务。
在今年“双十一”购物节期间,阿里巴巴创造了380亿美元的销售额,相比于去年的310亿美元,增长了近四分之一,是“黑色星期五”和“网购星期一”的网购销售额总和的两倍多。
每天有超过1亿购物者在其网站上浏览数十亿种商品。在购物高峰日,网站活动量更是会猛增,阿里巴巴的系统每秒需要处理数十万个查询。
阿里巴巴异构计算总监徐凌杰表示,能够保证了这一切都能正常运行,正是AI 的功劳。
他表示:“为了能够给用户带来良好的客户体验,我们采用NVIDIA加速计算平台大规模部署先进的AI技术,包括T4 GPU、cuBLAS、自定义混合精度和推理加速软件等。”
“通过该平台的直观搜索功能和可靠的推荐,我们能够支持比过去复杂6倍的模型,从而使点击率提高10%。相比于CPU,T4将我们最大模型的吞吐量提高了100倍。”
对于阿里巴巴和其他领先的网络零售商来说,推荐系统都是一个至关重要的应用程序。该系统可以向用户展示与其喜好相匹配的商品,从而提高点击率。而点击率在电商行业一直都是提高销售量的重要驱动力。
点击率的每一次小幅提高都会直接影响用户的体验和商家的营收。使用能够实时大规模运行的先进推荐系统模型可使点击率提高10%,目前这只能通过GPU实现。
阿里巴巴团队使用NVIDIA GPU支持资源分配、模型量化和图变换三项优化策略,从而提高吞吐量和响应性。
这使得NVIDIA T4 GPU能够为阿里巴巴广泛、深入的推荐模型提供加速,实现每秒处理780个查询。这远远领先于基于CPU的推理——后者每秒只能处理3个查询。
阿里巴巴还部署了NVIDIA GPU为各类系统提速,包括自动广告横幅生成、广告推荐、帮助识别假冒产品的图像处理、语言翻译以及语音识别等系统。作为全球第三大云服务提供商,阿里云提供了多种能够智能调度、自动维护和实时扩容的异构计算产品。
面对数十亿种可供选择的商品,AI已成为帮助购物者筛选,并为其提供最相关建议的关键。NVIDIA的AI平台通过使用最先进的AI模型来满足这一需求。
阿里巴巴富有远见性地部署了NVIDIA的AI平台,表明在广泛的新兴行业中,未来还将会有更加蓬勃的发展。
正如其工具能为数百万消费者筛选数十亿的产品一样,运行于NVIDIA GPU之上的AI推荐程序还将在其它数不胜数的数字服务中找到一席之地,这些服务包括应用App Store、新闻提要、餐厅指南和音乐服务,为用户提供优质的用户体验。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。