1月17日消息,瑞穗证券(Mizuho Securities)引述业界消息称,由于晶圆代工及封测成本大增,AMD的EPYC服务器芯片将涨价10%~30%。
据外媒Tom's Hardware、Wccftech 16日报导称,瑞穗引述全球第二大服务器业者浪潮(Inspur Systems)的副总Dolly Wu的说法称,AMD的EPYC处理器售价将调高10%~30%,大客户的涨幅较小。
由于晶圆供给极度吃紧,AMD未告知客户CPU/GPU的出货时间。AMD每个月出货都会涨价,客户「不买就拉倒」(take it or leave it)。Dolly Wu指出,由于厂商不知道下批货何时会到,害怕拿不到货,没有人放过添购机会,大家都支付了更高价码。
代号为“Milan”的AMD EPYC 7003系列处理器,效能极佳,在数据中心的per-watt表现居冠。Milan核心数较多,能提高数据中心服务器的效能,并降低营运成本,客户因而愿意花费更高价格。
AMD芯片都是交给晶圆代工厂生产,由于晶圆代工和封装测试的价格大幅上涨,对EPYC系列服务器芯片的影响远胜AMD其他芯片。EPYC采用Chiplet设计,单一芯片组里最多有9个芯粒,有鉴于供应链每个环节的制造成本均增,AMD涨价或许是要把成本压力转嫁给客户,而非要提高毛利。
英特尔CEO基辛格(Pat Gelsinger)认为,英特尔的新一代数据中心处理器Sapphire Rapids,在与AMD的EPYC较量中将可扳回一城。
但是Inspur Systems副总Dolly Wu预测,AMD的第三代EPYC处理器Milan和第四代EPYC Genoa,表现会继续撂倒英特尔,AMD能维持在数据中心的“爆炸性成长”。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。