昨日,题为“Shaping the Connected World”的2015 ARM年度技术论坛登陆北京。在媒体见面会上,ARM处理器部门经理James McNiven、ARM处理器部门市场营销总监Ian Smythe、ARM多媒体处理器事业部市场营销副总裁Dennis Laudick以及ARM物联网部门产品战略总监Paul Bakker悉数出席,阐述了ARM全球移动计算产业的愿景与布局,以及ARM如何支持更便捷的SoC设计,并提升智能硬件的安全性,创造可扩展并安全的物联网世界。
进军移动与嵌入式市场
ARM首先介绍了11约11日发布的全新Cortex-A35处理器,基于ARMv8-A架构的CPU首款产品。它不仅继承了Cortex-A7功耗与效率和体积小巧的特点,还具有32位与64位运算能力以及完整的加密能力。
James McNiven表示,迄今已有超过10亿智能手机和平板计算采用Cortex-A7,Cortex-A35作为目前最高效的64位移动处理器,可以为用户提供无与伦比的64位移动用户体验。
盯上可穿戴与物联网
十月底,ARM推出全新Mail 470图形处理器,为智能手表、家用网关和电器、工业控制面板以及医疗监视器等提供用户界面。
Mail是针对移动和设备的可授权GPU IP,也有超过10亿设备采用。它的特点是在相同工艺条件下,仅以一半的耗电量就能达到同样丰富的图形表现,满足用户对功耗的严苛要求。
Dennis Laudick表示,搭配低功耗的ARM Cortex-A7与Cortex-A53,可为功耗要求高的设备打造优化的SoC。
据悉,首款搭载此GPU的设备预计将于2016年底推出。
主流嵌入式SoC设计
物联网的市场与前景无限。ARM非常重视,发布了多款产品与技术。
近日,ARM提供免费的Cortex-M0处理器IP,以便进行商业化之前的SoC元件的设计、原型建模,而且设计人员可以通过ARM DesighStart门户网站获取这个打包服务。
James McNiven表示,这对于第一次采用ARM技术的公司带来极大的价值。他们能以高起点开始技术开发,加速开发速度并迅速开发具有商业可行性的解决方案。
据悉,开发者如果希望对其设计进行商业化量产,4万美金可以购买简化的、标准化的快速授权,里面包括Cortex-M0处理器IP、SDK和Keil MDK开发工具,同时还能获得ARM的技术支持。
安全、安全,还是安全
如何确保智能嵌入式设备的安全?ARM v8-M架构的推出将ARM TrustZone技术扩展到微处理器,将安全性延伸至硬件层,确保数据、固件和外设的安全性。
Paul Bakker表示,要进一步扩展物联网,需要解决三大难题。一是提高开发者能力,快速将产品推向市场;二是能简单地与云连接,并确保传输数据的安全;三是要有一个多样化的开发模式,丰富完整的生态系统。
编辑手记:物联网离不开ARM
研发半导体知识产权的ARM近几年非常火,去年宣布进入企业级市场很是让业内芯片大佬们不安。甚至英伟达高层都表示,在GPU领域,ARM的表现值得关注。这不仅反映出ARM的实力与强大,也彰显其众多的产品种类。
2015年第三季度,ARM营收达到3.76亿美金,基于它的芯片全球出货量超过750亿。其中,85%的智能移动设备与超过95%的智能手机都基于ARM架构。
移动计算技术的成熟加速了互联网的发展,智能硬件、智能嵌入式、物联网已经成为下一波科技热潮。相信ARM在这一波浪潮中做好了准备,接下来,好戏上场。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。