ZD至顶网服务器频道 06月16日 新闻消息(文/邹大斌): 从高通今年1月宣布要在贵州投资建立从事ARM服务器芯片研发和生产的合资公司开始,关于ARM服务器一直是市场的焦点。其原因在于,随着ARM芯片在移动端的日渐普及,人们也希望ARM芯片能携其高效能、低能耗、大生态的特点,给服务器市场带来x86之外的新选择。日前高通(Qualcomm)中国区董事长孟樸在接受记者采访时表示,搭载高通ARM芯片的服务器有望于2017年下半年上市。
孟樸表示,智能终端市场是高通的传统市场,也是高通一直非常重视的领域。而除此之外,高通还在助力中国物联网等众多领域的发展和创新。比如,Qualcomm骁龙820不仅在小米5、vivo Xplay 5旗舰版、乐视的乐Max2,联想ZUK Z2/Z2 pro等智能手机上得到广泛应用,同时也在无人机、VR等新兴领域也得到应用验证。另外,高通并不满足于前端市场,其业务正在从前端逐渐向后端,包括数据中心领域拓展。
“我们认为,不论是大数据还是云计算都离不开数据中心,而数据中心也离不开服务器,我们在这个产业中看到了机会。在服务器行业中,我们把发展机会确定在两大市场:一个是北美市场,一个是中国市场。”孟樸说,不管在应用形态还是产品技术要求和规模上,高通如果能在北美市场和中国市场做好,就能给高通和其产业链的合作方提供一些新的增长点。
这正是高通与今年1月17号正式宣布与贵州省成立合资公司贵州华芯通半导体技术有限公司的一个背景。根据协议,贵州在该合资公司中将占股55%,高通占股45%。合资公司将专门从事设计、开发和销售面向中国市场的先进服务器芯片。这一条完整的业务链将完全在中国通过合资公司进行。
孟樸表示,尽管目前x86在市场占有绝对优势,但高通在服务器市场还有机会。其原因在于:
第一,高通一直在智能手机SoC领域处于全球领先地位,过去这些年也证明,高通芯片能在智能终端上很好地平衡功耗、计算能力和价格。高通也完全有能力把这种经验应用到服务器领域。
第二,高通对中国市场以及中国合作伙伴有充分的信心。和其他一些合资公司相比,高通是唯一一家既进行了资金投入又进行了技术投入的公司。
而在记者看来,高通在中国市场的机会可能还来自公司高层对中国市场的高度重视。上个月,在贵阳举办的 “2016中国大数据产业峰会暨中国电子商务创新发展峰会”(简称"2016数博会") 期间,公司总裁德里克•阿博利亲临大会现场做了主题演讲,并且还出席了高通在贵州省贵安新区注册成立的高通(中国)控股有限公司的揭牌仪式。
在接受记者采访时,孟樸还透露新成立的贵州华芯通半导体技术有限公司一些最新进展。他介绍说,高通第一批的技术交付也已经完成。数博会期间高通搭建了演示平台,这就是向合资公司交付的第一批技术。不久高通还会向合资公司提供第二批的技术。技术交付完成后,合资公司的技术人员就可以针对中国的市场开发出适合中国市场和中国应用的服务器芯片。
他说,截至5月底,合资公司已经拥有了大概40多位工程师。目标是到今年年底,合资公司会有300-400名研发人员。公司预计在2017年下半年正式向市场交付服务器芯片。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。