2024年5月7日 – MediaTek今日在天玑开发者大会(MDDC 2024)上,与Counterpoint携手阿里云通义千问、百川大模型、虎牙、酷狗、零一万物、OPPO、Soul、腾讯AI Lab、腾讯混元、vivo等生态伙伴*,联合发布《生成式AI手机产业白皮书》,共同定义了“生成式AI手机”的概念和典型特征。
MediaTek资深副总经理、无线通信事业部总经理徐敬全表示:“生成式AI手机将是智能手机进化的下一形态,移动生态正迎来远超以往的创新机遇。MediaTek将持续突破天玑移动平台的算力和AI能力,为生成式AI手机提供可靠、完备的解决方案,携手全球先进的AI大模型、开发者、终端厂商等行业生态伙伴,加速推进生成式AI的端侧部署和应用落地,为全球用户开启高度智能化、个性化的生成式AI手机新时代。”
与生成式AI技术的融合无疑是当下与未来智能手机产业发展的主旋律,它将开启手机智能化演进的新篇章,并为移动互联网生态的持续繁荣注入新动能。在此背景下,《生成式AI手机产业白皮书》提出“生成式AI手机”的概念:生成式AI手机是利用大规模、预训练的生成式AI模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。生成式AI手机开启了智能手机发展的新周期,长远看,智能手机将会发展为移动智能体。
该白皮书认为,生成式AI手机需要具备如下必要特征:
? 支持大模型的本地部署,或是通过云端协同的方式执行复杂的生成式AI任务。生成式AI手机本身具备强大的AI算力,无须完全依赖云端服务器。
? 具备多模态能力,即可以处理文本、图像、语音等多种形式的内容输入,以生成各种形式的输出,典型用例如翻译、图像生成和视频生成等。
? 确保流畅、无缝的用户体验,设备能够以自然而直观的交互方式,快速响应用户的请求。
? 拥有实现上述特征的硬件规格,包括但不限于基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。
《生成式AI手机产业白皮书》详细地阐述了生成式AI与智能手机深度融合的趋势,深入探讨了生成式AI手机生态中芯片厂商、手机厂商、大模型厂商、开发者的AI战略,以及生成式AI手机的软硬件科技全景,并给出了Counterpoint对生成式AI手机发展的预测。受益于强大的移动计算平台,丰富的不同体量的模型矩阵,完整的配套工具链,以及产业各方积极的应用探索,生成式AI手机将在未来几年保持高速成长,生成式AI手机的存量规模将在2027年突破10亿大关,帮助实现生成式AI技术的普惠。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。