本地端AI应用迎RTX加速时代-业界资讯-智能日报

【智能日报】11月16日消息，

微软在正在进行的Iginte全球技术大会上发布了一系列新的AI相关优化模型和开发工具资源，旨在帮助开发者更充分地利用硬件性能，拓展AI应用场景。

特别值得关注的是针对NVIDIA的举措，微软推出了多项新功能。无论是面向OpenAI Chat API的TensorRT-LLM封装接口，还是RTX驱动的性能改进DirectML for Llama 2，以及其他热门大语言模型(LLM)，都能在NVIDIA硬件上获得更优加速和应用。

在这些功能中，TensorRT-LLM尤为引人注目，它是一款用于加速LLM推理的库，可以显著提升AI推理性能。此库还在持续更新，支持越来越多的语言模型，并且是开源的。

据智能日报了解，NVIDIA在10月份也推出了针对Windows平台的TensorRT-LLM。只需在配备8GB以上显存的RTX 30/40系列GPU的台式机或笔记本上使用，就能更轻松地完成严苛的AI工作负载。

现在，TensorRT-LLM for Windows通过全新的封装接口与OpenAI广受欢迎的聊天API兼容。这使得各种相关应用可以在本地直接运行，无需连接云端，有助于在PC上保护私人和专有数据，预防隐私泄露。

针对TensorRT-LLM优化过的大语言模型都可与这一封装接口相配合，包括Llama 2、Mistral、NV LLM等等。对开发者来说，只需修改一两行代码，而不需繁琐的代码重写和移植，即可快速让AI应用在本地执行。

本月底将推出TensorRT-LLM v0.6.0版本更新，据悉，该版本将在RTX GPU上带来多达5倍的推理性能提升，并支持更多热门的LLM模型，如全新的70亿参数Mistral和80亿参数的Nemotron-3。这将使得台式机和笔记本也能随时、快速、准确地在本地运行LLM。

据实测数据显示，RTX 4060显卡搭配TensorRT-LLM，推理性能可达每秒319 tokens，比其他后端提速高达4.2倍;而RTX 4090甚至将推理性能从每秒tokens提升到每秒829 tokens，提升幅度高达2.8倍。

基于强大的硬件性能、完善的开发生态和广泛的应用场景，NVIDIA RTX正成为本地AI不可或缺的重要助手。优化、模型和资源的不断丰富也在加速AI功能在上亿台RTX PC上的普及。

目前，已有超过400个合作伙伴发布了支持RTX GPU加速的AI应用和游戏。随着模型易用性的提高，预计在Windows PC平台上会出现更多的AIGC功能。

(以上报道内容经过重新梳理表达，以确保与原文有显著差异。)

刚刚，官方公布了 vivo Vision 探索版混合现实头显的预热视频。博主表示，vivo 对于未来人机交互的理解也是国产Top，新头显的硬件规格也导致定价估计不会便宜。博主还在评论区回复了部分网友的问…

近日，谷歌在官方公众号发布推文，加速推进安卓Photo Picker的适配，以“数据最小化”原则为核心强化用户隐私保护，这一动作不仅标志着安卓平台隐私策略迈入全新阶段，也为安卓生态更透明可控的数据授权提供了方向性

IT之家 8 月 11 日消息，据“北京发布”公众号，《北京经济技术开发区关于推动具身智能机器人创新发展的若干措施》在 8 月 9 日的2025 世界机器人大会上发布。据了解，经开区将通过十条“硬核”措施全…

【CNMO科技消息】8月11日，CNMO注意到，岚图汽车科技有限公司CEO卢放在社交平台上回应了网友们关于岚图新车型的问题。岚图汽车据他介绍，岚图汽车的研发团队正在新疆对岚图泰山（代号）进行夏测，并还将在华为…

苹果在该季度出货了近1300万台平板电脑，并保持全球最畅销平板制造商地位。有外媒称，苹果尤其要感谢三款iPad，包括价格范围两端的平板：10.9英寸iPad（三年来首次更新）据称帮助提升了价格敏感买家的销售量…

这一交付，标志着我国实现了高端半导体级纳米压印光刻系统的自主可控，填补了国内在该领域的空白，打破了西方国家在高端纳米压印设备领域对中国的技术封锁。喷墨涂胶工艺的创新是PL-SR设备的核心突破点之一，在传统…

中芯国际联合首席执行官赵海军在会上表示，公司第二季度收入增长，主要因为在国内外政策变化影响下，渠道加紧备货、补库存，公司也积极配合客户保证出货。对于第三季度指引，公司管理层预计出货数量和平均销售单价都预计上…

IT之家 8 月 10 日消息，据上海芯上微装科技股份有限公司消息，8 月 8 日，上海芯上微装科技股份有限公司（简称：芯上微装）举办了第500 台步进光刻机交付仪式。该类产品能够满足 Flip-chip、…

赵哲伦分享了他们最初的产品定义思考：在一个矩阵的两轴上，一条是机器人与人的关系，从工业、冷峻到友善，再到可能过于「低幼化」的玩具感；另一条则是它的行动能力，从桌面级、室内轮式，到能够户外行走但无法上下台阶，再…

IT之家 8 月 8 日消息，爆料博主 Evan Blass 今天上午在 X 平台放出了努比亚主打轻薄的新机 Nubia Air的更多内容，涵盖渲染图、参数信息及真机图，使这款手机完全浮出水面。努比亚 A…

此次发布的“2507”版本的Qwen3-4B模型对手机等端侧硬件部署较为友好，目前已在魔搭社区和Hugging Face正式开源。通义千问此次推出的Qwen3-4B系列新模型，以更小的尺寸实现了性能上的优…

目前，这一功能仅对部分iPhone用户开放，用户可以通过该功能获得关于Apple产品和服务的解答，获取故障排除信息，以及解答有关设备功能的问题等。该聊天机器人专注于提供Apple支持相关的信息，不会回答与A…

小红书，这家以“种草”文化著称的社交平台，近期在AI技术自研领域迈出了重要步伐，连续两个月内发布了三款开源模型，引起了业界的广泛关注。最新亮相的多模态大模型dots.vlm1，凭借其强大的视觉理解和推理能力，展现了接近Gemini 2.5 Pro闭源模型的实力。

A：这是OpenAI模型首次通过亚马逊云服务AWS提供，用户可以通过AWS的Bedrock和SageMaker AI服务使用这些模型。AWS希望通过这次合作在AI领域赶上竞争对手，回应华尔街对其在生成式AI…

【太平洋科技快讯】当地时间周三，苹果公司股价迎来强势上涨，收盘涨幅达 5.09%，单日市值激增 1538 亿美元（约合人民币 1.1万亿元）。公司宣布将追加 1000 亿美元美国本土投资，显著加速其本土化战…

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10