2021 年 8 月 23 日 — 在一年一度的 Hot Chips 大会上,IBM今日公布了即将推出的全新 IBM Telum 处理器的细节,该处理器旨在将深度学习推理能力引入企业工作负载,帮助实时解决欺诈问题。Telum 是 IBM 首款具有芯片上加速功能的处理器,能够在交易时进行 AI 推理。经过三年的研发,这款新型芯片上硬件加速技术实现了突破,旨在帮助客户从银行、金融、贸易和保险应用以及客户互动中大规模获得业务洞察。基于 Telum 的系统(IBM Z 和 LinuxONE 下一代)计划于 2022 年上半年推出。
根据 IBM 委托 Morning Consult 开展的最近研究,90% 的受访者表示,必须做到无论数据位于何处,都能够构建和运行 AI 项目,这一点非常重要。[1].
IBM Telum 旨在让应用能够在数据所在之处高效运行,帮助克服传统企业 AI 方法的限制 — 需要大量的内存和数据移动能力才能处理推理。借助 Telum,加速器在非常靠近任务关键型数据和应用的地方运行,这意味着企业可以对实时敏感交易进行海量推理,而无需在平台外调用 AI 解决方案,从而避免对性能产生影响。客户还可以在平台外构建和训练 AI 模型,在支持 Telum 的 IBM 系统上部署模型并执行推理,以供分析之用。
银行、金融、贸易、保险等领域的创新
如今,企业使用的检测方法通常只能发现已经发生的欺诈活动。由于目前技术的局限性,这一过程还可能非常耗时,并且需要大量计算,尤其是当欺诈分析和检测在远离任务关键型交易和数据的地方执行的情况下。由于延迟,复杂的欺诈检测往往无法实时完成 — 这意味着,在零售商意识到发生欺诈之前,恶意行为实施者可能已经用偷来的信用卡成功购买了商品。
根据 2020 年的《消费者“前哨”网络数据手册》,2020 年消费者报告的欺诈损失超过 33 亿美元,高于 2019 年的 18 亿美元[2].。
Telum 可帮助客户从欺诈检测态势转变为欺诈预防,从目前的捕获多个欺诈案例,转变为在交易完成前大规模预防欺诈的新时代,而且不会影响服务级别协议 (SLA)。
这款新型芯片采用了创新的集中式设计,支持客户充分利用 AI 处理器的全部能力,轻松处理特定于 AI 的工作负载;因此,它成为欺诈检测、贷款处理、贸易清算和结算、反洗钱以及风险分析等金融服务工作负载的理想之选。通过这些新型创新,客户能够增强基于规则的现有欺诈检测能力,或者使用机器学习,加快信贷审批流程,改善客户服务和盈利能力,发现可能失败的贸易或交易,并提出解决方案,以创建更高效的结算流程。
Telum 和 IBM 采用全栈方法进行芯片设计
Telum 遵循 IBM 在创新设计和工程方面的悠久传统,包括硬件和软件的共同创新,以及覆盖对半导体、系统、固件、操作系统和主要软件框架的有效整合。
该芯片包含 8 个处理器核心,具有深度超标量乱序指令管道(A deep super-scalar out-of-order instruction pipeline),时钟频率超过 5GHz,并针对异构企业级工作负载的需求进行了优化。彻底重新设计的高速缓存和芯片互连基础架构为每个计算核心提供 32MB 缓存,可以扩展到 32 个 Telum 芯片。双芯片模块设计包含 220 亿个晶体管,17 层金属层上的线路总长度达到 19 英里。
半导体领先地位
Telum 是使用 IBM 研究院 AI 硬件中心的技术研发的首款 IBM 芯片。此外,三星是 IBM 在 7 纳米 EUV 技术节点上研发的 Telum 处理器的技术研发合作伙伴。
Telum 是 IBM 在硬件技术领域保持领先地位的又一例证。作为世界上最大的工业研究机构之一,IBM 研究院最近宣布进军 2 纳米节点,这是 IBM 芯片和半导体创新传统的最新标杆。在纽约州奥尔巴尼市 — IBM AI 硬件中心和奥尔巴尼纳米科技中心的所在地,IBM 研究院与公共/私营领域的行业参与者共同建立了领先的协作式生态系统,旨在推动半导体研究的进展,帮助解决全球制造需求,加速芯片行业的发展。
了解更多信息,敬请访问 >>>IBM Z官网
获取更多相关资料请访问>>> IBM IT基础架构专区
好文章,需要你的鼓励
大数据可观测性初创公司Monte Carlo Data推出全新Agent Observability产品,为AI应用提供全方位数据和AI可观测性。该工具帮助团队检测、分类和修复生产环境中AI应用的可靠性问题,防止代价高昂的"幻觉"现象,避免客户信任度下降和系统宕机。新产品采用大语言模型作为评判器的技术,能够同时监控AI数据输入和输出,提供统一的AI可观测性解决方案。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
网络安全公司Aikido披露了迄今最大规模的npm供应链攻击事件。攻击者通过钓鱼邮件获取维护者账户凭证,向18个热门JavaScript包注入恶意代码,这些包每周下载量超过26亿次。恶意代码专门劫持加密货币交易,监控浏览器API接口将资金转移至攻击者地址。受影响的包括chalk、debug等广泛使用的开发工具库。虽然攻击在5分钟内被发现并及时公开,但专家警告此类上游攻击极具破坏性,可能与朝鲜黑客组织相关。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。