2024年5月7日 – MediaTek今日在天玑开发者大会(MDDC 2024)上,与Counterpoint携手阿里云通义千问、百川大模型、虎牙、酷狗、零一万物、OPPO、Soul、腾讯AI Lab、腾讯混元、vivo等生态伙伴*,联合发布《生成式AI手机产业白皮书》,共同定义了“生成式AI手机”的概念和典型特征。
MediaTek资深副总经理、无线通信事业部总经理徐敬全表示:“生成式AI手机将是智能手机进化的下一形态,移动生态正迎来远超以往的创新机遇。MediaTek将持续突破天玑移动平台的算力和AI能力,为生成式AI手机提供可靠、完备的解决方案,携手全球先进的AI大模型、开发者、终端厂商等行业生态伙伴,加速推进生成式AI的端侧部署和应用落地,为全球用户开启高度智能化、个性化的生成式AI手机新时代。”
与生成式AI技术的融合无疑是当下与未来智能手机产业发展的主旋律,它将开启手机智能化演进的新篇章,并为移动互联网生态的持续繁荣注入新动能。在此背景下,《生成式AI手机产业白皮书》提出“生成式AI手机”的概念:生成式AI手机是利用大规模、预训练的生成式AI模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。生成式AI手机开启了智能手机发展的新周期,长远看,智能手机将会发展为移动智能体。
该白皮书认为,生成式AI手机需要具备如下必要特征:
? 支持大模型的本地部署,或是通过云端协同的方式执行复杂的生成式AI任务。生成式AI手机本身具备强大的AI算力,无须完全依赖云端服务器。
? 具备多模态能力,即可以处理文本、图像、语音等多种形式的内容输入,以生成各种形式的输出,典型用例如翻译、图像生成和视频生成等。
? 确保流畅、无缝的用户体验,设备能够以自然而直观的交互方式,快速响应用户的请求。
? 拥有实现上述特征的硬件规格,包括但不限于基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。
《生成式AI手机产业白皮书》详细地阐述了生成式AI与智能手机深度融合的趋势,深入探讨了生成式AI手机生态中芯片厂商、手机厂商、大模型厂商、开发者的AI战略,以及生成式AI手机的软硬件科技全景,并给出了Counterpoint对生成式AI手机发展的预测。受益于强大的移动计算平台,丰富的不同体量的模型矩阵,完整的配套工具链,以及产业各方积极的应用探索,生成式AI手机将在未来几年保持高速成长,生成式AI手机的存量规模将在2027年突破10亿大关,帮助实现生成式AI技术的普惠。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。