ZD至顶网服务器频道 04月15日 编译: 英特尔公司实现了其2015年做出的承诺,即在Knights Landing进入全面销售之前,确保开发者们能够率先用到这款14纳米高性能计算芯片构建的开发平台。
这款通用版本之前的开发设备于去年11月就已经被提上日程,当时芯片巨头在采访中透露称,该平台将是“一套真正的工作站,包含代码移植及测试所必需的全部软件及开发者工具。”
大家还需要拥有相当的财力才能用到:这款台式设备的水冷版本售价为4982.88美元,而四节点双机架单元起价则高达19703.14美元。
这款Ninja开发平台目前已经开始接受预订。其中附带用户指定的内存容量与本地存储机制,CentOS 7.2以及一系列英特尔工具。这套开发平台采用插槽式Knights Landing Phi处理器,而非协处理器卡。
Colfax公司负责美国本土的市场销售工作,或者说担任本地OEM厂商角色。
其软件套件则包含一年期Parallel Studio XE(含英特尔C++与Fortran编译器以及大量相关工具)指定用户许可。
这套台式设备拥有72个计算核心,英特尔则宣称其拥有3万亿次双精度浮点运算性能与8万亿次单精度浮点运算性能。
未来还将有相关网络研讨会及动手项目帮助开发者充分发挥这台设备的强大能量。碎将包括为期3周的Phi协处理器服务器接入许可以及10节时长两小时的培训课程。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。