2024年5月7日 – MediaTek今日在天玑开发者大会(MDDC 2024)上,与Counterpoint携手阿里云通义千问、百川大模型、虎牙、酷狗、零一万物、OPPO、Soul、腾讯AI Lab、腾讯混元、vivo等生态伙伴*,联合发布《生成式AI手机产业白皮书》,共同定义了“生成式AI手机”的概念和典型特征。
MediaTek资深副总经理、无线通信事业部总经理徐敬全表示:“生成式AI手机将是智能手机进化的下一形态,移动生态正迎来远超以往的创新机遇。MediaTek将持续突破天玑移动平台的算力和AI能力,为生成式AI手机提供可靠、完备的解决方案,携手全球先进的AI大模型、开发者、终端厂商等行业生态伙伴,加速推进生成式AI的端侧部署和应用落地,为全球用户开启高度智能化、个性化的生成式AI手机新时代。”
与生成式AI技术的融合无疑是当下与未来智能手机产业发展的主旋律,它将开启手机智能化演进的新篇章,并为移动互联网生态的持续繁荣注入新动能。在此背景下,《生成式AI手机产业白皮书》提出“生成式AI手机”的概念:生成式AI手机是利用大规模、预训练的生成式AI模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。生成式AI手机开启了智能手机发展的新周期,长远看,智能手机将会发展为移动智能体。
该白皮书认为,生成式AI手机需要具备如下必要特征:
? 支持大模型的本地部署,或是通过云端协同的方式执行复杂的生成式AI任务。生成式AI手机本身具备强大的AI算力,无须完全依赖云端服务器。
? 具备多模态能力,即可以处理文本、图像、语音等多种形式的内容输入,以生成各种形式的输出,典型用例如翻译、图像生成和视频生成等。
? 确保流畅、无缝的用户体验,设备能够以自然而直观的交互方式,快速响应用户的请求。
? 拥有实现上述特征的硬件规格,包括但不限于基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。
《生成式AI手机产业白皮书》详细地阐述了生成式AI与智能手机深度融合的趋势,深入探讨了生成式AI手机生态中芯片厂商、手机厂商、大模型厂商、开发者的AI战略,以及生成式AI手机的软硬件科技全景,并给出了Counterpoint对生成式AI手机发展的预测。受益于强大的移动计算平台,丰富的不同体量的模型矩阵,完整的配套工具链,以及产业各方积极的应用探索,生成式AI手机将在未来几年保持高速成长,生成式AI手机的存量规模将在2027年突破10亿大关,帮助实现生成式AI技术的普惠。
好文章,需要你的鼓励
本文评测了六款控制台平铺终端复用器工具。GNU Screen作为老牌工具功能强大但操作复杂,Tmux更现代化但学习曲线陡峭,Byobu为前两者提供友好界面,Zellij用Rust编写界面简洁易用,DVTM追求极简主义,Twin提供类似TurboVision的文本界面环境。每款工具都有各自特点和适用场景。
韩国汉阳大学联合高通AI研究院开发出InfiniPot-V框架,解决了移动设备处理长视频时的内存限制问题。该技术通过时间冗余消除和语义重要性保留两种策略,将存储需求压缩至原来的12%,同时保持高准确性,让手机和AR眼镜也能实时理解超长视频内容。
网络安全公司Snyk宣布收购瑞士人工智能安全研究公司Invariant Labs,收购金额未公开。Invariant Labs从苏黎世联邦理工学院分拆成立,专注于帮助开发者构建安全可靠的AI代理工具和框架。该公司提供Explorer运行时观察仪表板、Gateway轻量级代理、Guardrails策略引擎等产品,并在工具中毒和模型上下文协议漏洞等新兴AI威胁防护方面处于领先地位。此次收购将推进Snyk保护下一代AI原生应用的使命。
纽约大学研究团队通过INT-ACT测试套件全面评估了当前先进的视觉-语言-动作机器人模型,发现了一个普遍存在的"意图-行动差距"问题:机器人能够正确理解任务和识别物体,但在实际动作执行时频频失败。研究还揭示了端到端训练会损害原有语言理解能力,以及多模态挑战下的推理脆弱性,为未来机器人技术发展提供了重要指导。