ZDNet至顶网服务器频道 05月06日 新闻消息: 在上个月美国NAB 广播及设备展览中,AMD 首次公开展示了最新的专业显示卡FirePro W9100, 同期蓝宝科技也在北京Infocomm中进行了实物展示,体现了对中国市场的重视. 新的AMD FirePro 9100专业显示卡是专为要求最高的设计师并完美配合4K时代的工作站产品。 透过OpenCL标准、设计师和工程专业人员甚至可以利用多片w9100显示卡进行高度密集的4K图像计算任务进行实时处理。
在此我们先简单回顾一下这款史无前例的怪兽级专业4k显示卡。
. 实际专业应用软件的优化和认证
. 16GB GDDR5 ECC显存
. 显存 320GB/s 带宽, 512bit 位宽
. DirectGMA 直连技术
. 6个miniDisplayPort 1.2接口同时支持6路4K输出
. Eyefinity 2.0 宽域技术
. 2816个流处理器, 176个纹理单元,64 ROPs光栅单元
. 5.24TFlops 单精度, 2.62TFlops 双精度
. PCI-E 3.0 x16 总线接口
. OpenCL 1.2 , OpenGL 4.3, DirectX 11.1
作为专业4K图像处理应用为主打卖点,首先看一下FirePro W9100在达芬奇调色系统中的表现。
Davinci Resolve是与好莱坞电影公司合作开发的结晶,它作为后期制作的行业标准已超过30年。达芬奇Davinci Resolve 10.1系统中最优秀的创新就是以节点方式进行图像处理, 每个节点可以是一个独立的色彩校正、Power Windows或者特效。通过更改节点直接的连接方式,就可以把校色处理、特效、混合处理(Mixer)、键处理(Keyer)、自定义曲线结合起来,从而制作出摄人心魄的画面风格。测试中打开4K @ 24FPS影片进行调色, 上代旗舰产品能实时处理3个节点,而竞争对手K6000只能支持1个,即使采用2片K6000进行协同计算,也还是不如W9100所达到的实时4个节点。 如果采用4片W9100甚至可以驱动超过20个节点进行实时处理,而且是4K的影片!
在Adobe Premiere Pro 中, 把RAW格式的4K视频进行1080p @ 24FPS的H.264格式转换, 以适应更多不同的应用场合, 竞争对手倡导的Quadro+Tesla 混合加速模式, 实际表现还不如采用W9100进行独立加速。 可见1+1并不一定等于2, 把产品划分为不同类别进行销售只是增加消费者负担, 还不如提供更强劲的GPU处理性能和更大更快速的显存进行数据交换。
系统基准性能测试工具“Basemark CL”和"LuxMark",这些工具都是针对多核心系统打造,使用了开放式通用计算标准OpenCL。通过BaseMark和LuxMark的测试成绩可以看到为什么W9100在实际应用中如此强大,因为这些实际应用软件都已经加入了OpenCl支持, 这恰恰是单卡双精度运算就高达2.62TFlops的W9100制胜利器。
SolidWorks软件是世界上第一个基于Windows开发的三维CAD系统, 是全球装机量最大、最好用的软件. AMD FirePro 与 Solidworks是长期的软、硬件技术合作伙伴,一直以来AMD 的专业显示卡带给了Solidworks用户很大的帮助,最新版本的Solidworks 2014测试成绩,AMD FirePro依然不会令用户失望,无论是线框模式, 带着色的线框模式,甚至开启全屏抗锯齿着色模式,W9100都显著领先对手。 16GB 大显存的采用并配合VBO技术, 超大规模的装配体从此不再是设计师的恶梦。
以上对蓝宝AMD FirePro W9100的性能做了简单的报告,主要涉及4K制作的各个工作流环节,特别值得一体的是,如果大家都对光线追踪渲染的逼真感到惊叹,而同时又不得不因为渲染速度的缓慢而耗费大量的等待时间, 现在Vray 3.0已经提供3dsMAX 2014 插件,通过单片FirePro W9100就能提供超过CPU 20倍的速度进行渲染, 如果你同时安装多片W9100 ,那更是一个非常值得期待的效能,你准备好拥抱这个强劲的专业4K 显示卡了吗?
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。