NVIDIA发布全新数据中心推理平台，推进新一轮AI服务发展

NVIDIA今日推出全新人工智能数据中心平台，为语音、视频、图像和推荐服务提供业界最先进的推理加速，从而推动全球AI服务的发展。

Tesla T4 GPU及全新TensorRT软件可助力实现智能语音、视频、图像和推荐服务

东京—GTC Japan—2018年9月13日—NVIDIA今日推出全新人工智能数据中心平台，为语音、视频、图像和推荐服务提供业界最先进的推理加速，从而推动全球AI服务的发展。

NVIDIA TensorRT超大规模推理平台采用基于突破性的NVIDIA Turing架构的NVIDIA Tesla T4 GPU，以及一整套完整的新推理软件。

该平台可为端到端应用提供最快性能和更低延迟，助力超大规模数据中心提供全新服务，例如增强型自然语言交互，以及对搜索查询的给出直接答案而非模糊匹配的一系列结果。

NVIDIA副总裁兼加速业务总经理Ian Buck表示：“未来人工智能将触及每种产品和服务并为之带来改进，我们的客户正在朝此方向发展。NVIDIA TensorRT超大规模平台的设计旨在实现这一目标，即比以往设想的更快、更高效。”

每天，大规模数据中心都会处理数以亿计的语音查询、翻译、图像、视频、推荐和社交媒体交互。所有这些应用的处理过程都需要在位于服务器上不同类型的神经网络进行。

为优化数据中心以实现最高吞吐量和服务器利用率，NVIDIA TensorRT超大规模平台包括实时推理软件和Tesla T4 GPU，处理查询的速度比仅采用CPU时快40倍。

NVIDIA预计AI推理行业有望在未来五年内平稳增长至200亿美元的市场。

业界最先进的AI推理平台

NVIDIA TensorRT超大规模平台包括一整套硬件和软件产品，这些产品针对强大、高效的推理进行了优化。关键要素包括：

NVIDIA Tesla T4 GPU——搭载320个Turing Tensor Core和2560个CUDA Core，这款全新GPU具有突破性的性能，以及灵活的多精度功能，从FP32到FP16再到INT8及INT4。它采用高能效的75瓦小型PCIe封装，可轻松适用于大多数服务器。FP16的峰值性能为65 teraflops，INT8为130 teraflops，INT4为260 teraflops。
NVIDIA TensorRT 5——推理优化器和运行时引擎，NVIDIA TensorRT 5支持Turing Tensor Core，并对适用于多精度工作负载的神经网络优化集进行了扩展。
NVIDIA TensorRT推理服务器——这一容器化的微服务软件使应用能够在数据中心生产中采用AI模型。其在NVIDIA GPU Cloud容器注册中免费提供，可实现数据中心吞吐量和GPU利用率的最大化，支持所有常用AI模型和框架，并集成了Kubernetes和Docker。

来源：业界供稿

NVIDIA

0赞

好文章，需要你的鼓励

英特尔

人工智能

大模型

2025-09-30

数据中心的智算挑战，英特尔要如何应对？

阿里云第九代企业级ECS实例g9i不到150天服务超2万家客户，现在已有接近3万用户。

软件工程

智能体编程

人机协作

2025-09-30

Queen‘s大学重磅研究：程序员的角色即将彻底改变，从码农到智能体指挥官

Queen's大学研究团队提出结构化智能体软件工程框架SASE，重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者，建立双向咨询机制和标准化文档系统，解决AI编程中的质量控制难题，为软件工程向智能化协作时代转型提供系统性解决方案。

移动操作系统

系统更新

错误修复

2025-09-30

苹果发布 iOS 26.0.1 系统更新，修复多项关键问题

苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1，建议所有用户安装。由于重大版本发布通常伴随漏洞，许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试，但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布，测试范围此前受限。预计苹果将继续发布后续修复版本。

医疗AI的“显微镜革命“：西北工业大学团队发布首个超声影像专用智能助手EchoVLM

医疗人工智能

视觉语言模型

超声影像诊断

2025-09-30

医疗AI的“显微镜革命“：西北工业大学团队发布首个超声影像专用智能助手EchoVLM

西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM，通过收集15家医院20万病例和147万超声图像，采用专家混合架构，实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题，为医生提供智能辅助，推动医疗AI向专业化发展。

NVIDIA发布全新数据中心推理平台，推进新一轮AI服务发展

业界最先进的AI推理平台

来源：业界供稿

2018

09/14

11:23

分享

点赞

业界首款符合AEC-Q200标准额定电压高达1,000 VDC高压保险丝

数据中心的智算挑战，英特尔要如何应对？

下一代智能工厂怎么建？开放自动化给出“解题思路”

跟随西门子，在工博会感受沉浸式的工业AI体验

苹果发布 iOS 26.0.1 系统更新，修复多项关键问题

OpenAI将发布类似TikTok的社交应用，搭配Sora 2视频模型

微软推出Office智能体模式让用户"氛围办公"

AI助手现在能帮你创建高质量Word文档和Excel表格

高通新一代骁龙平台将推动智能体AI时代到来

SAPx阿里云，开启一条通往中国市场与全球化发展的全新路径

微软推出"氛围工作"模式，为Office套件加入AI智能体

OpenAI推出智能购物系统挑战谷歌亚马逊

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

NVIDIA 初创加速计划 | 2024 NVIDIA 创业企业展示完美收官!

老黄掏出“迷你版AI超算”，每秒67万亿次运算，仅售2070元人民币

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: