ZDNet至顶网服务器频道 05月07日 新闻消息:亚马逊Web服务雇佣了新员工,力求创建其服务器中的自定制芯片,而且IT专家期望这样的项目可以导向更低的价格。
亚马逊Web服务(AWS)已经从存储、网络和服务器层面上自定制了硬件,因此其对于芯片优化感兴趣并不让人意外。根据LinkedIn文件,我们看到该公司开放的职位列出了CPU和系统架构师,最近在硬件工程师领域雇佣了新的员工,所有的人员均为来自Calxeda和ARM的芯片专家。
特别的,LinkedIn上这个工作的职位列为硬件开发工程师、硬件设计工程师、芯片优化总监以及硬件工程经理、芯片优化。所列出的大部分工作都位于美国德州奥斯汀。
据悉亚马逊的芯片在坊间已经流传了几个月了,而且这样的自定制不仅仅出现在AWS的硬件自定制战略中,也效法了其他的Web扩展竞争对手,比如Facebook和谷歌,他们都在自定制芯片来适应具体的需求。
某位匿名云咨询师表示:“从扩展的角度看,AWS扩展了1%、2%或者3%的效率,每个月就是数百万的成本。”
AWS一直致力于帮助客户节省成本,IT专家也期望在这个领域也会发生。
“自定制芯片都是为了特殊需求制定,”Aaron Rankin说道,他是AWS的客户,也是Sprout Social的CTO,这是一家社交媒体工具厂商。“英特尔或者AMD x86芯片都是通用专家。他们对于运行Linux很好,但是特定领域的服务来说是无效的。”
进入自定制芯片,可以花小钱办大事,因此可以在每一个时钟周期上节能或者执行更多指令。
“云托管是一种实用的业务,而且赢家最终会是提供更低的价格的一个,”Rankin补充道,“这是一场激烈的竞争。”
某初创云咨询公司顾问Mike Ryan并表示:“这些雇员就是一个征兆。亚马逊已经频繁地降价,而且利用了规模效应,现在引入了自定制硬件,将会进一步改善。”
然而,任何类型的CPU自定制都不会在一夜间发生。ARM芯片技术仍旧在发展中,尚且不支持64位架构,但是有望在今年第三季度得到改善。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。