滚动资讯

英伟达Parakeet TDT 0.6B：开源ASR新标杆，秒速转录60分钟音频

时间：2025-05-07 14:03 来源：ITBEAR作者：冯璃月

英伟达近日在语音识别领域迈出了重要一步，其最新推出的Parakeet TDT 0.6B模型已在Hugging Face平台上全面开源，这一消息由科技媒体marktechpost率先报道。这款先进的自动语音识别（ASR）模型，以其卓越的性能和开源的特性，引起了业界的广泛关注。

Parakeet TDT 0.6B的最大亮点在于其惊人的处理速度和高质量的转录效果。据称，该模型能够在短短1秒内完成60分钟音频的处理，这一速度是当前主流开源ASR模型的50倍之多。在Hugging Face的Open ASR Leaderboard上，Parakeet TDT 0.6B的字错率（WER）仅为6.05%，在开源模型中名列前茅，为企业级应用提供了强有力的支持。

该模型基于Transformer架构，并经过高质量转录数据的精细微调，同时针对英伟达硬件进行了优化，以进一步提升推理效率。其6亿参数的编码-解码结构，以及量化和融合内核等技术，都为其出色的性能奠定了坚实基础。Parakeet TDT 0.6B还支持TDT（Transducer Decoder Transformer）架构，并具备精确的时间戳、数字格式化和标点恢复等功能，这些特性使其在处理复杂语音场景时更加得心应手。

Parakeet TDT 0.6B还开创性地支持了歌曲转歌词转录功能，这一功能在音乐索引和媒体平台等领域具有广泛的应用前景。依托英伟达的TensorRT和FP8量化技术，该模型的实时率（RTF）高达3386，进一步提升了其在实际应用中的表现。

除了速度和精度外，Parakeet TDT 0.6B还内置了多项独特功能，以满足不同领域的需求。例如，它能够将歌曲内容转化为歌词，适用于音乐和媒体领域；支持数字和时间戳格式化，提高会议记录、法律转录和医疗记录的可读性；标点恢复功能则能够增强下游自然语言处理（NLP）应用的表现。这些特性不仅大幅提升了转录质量，还减轻了后期处理或人工编辑的负担，特别适合企业级部署。

随着Parakeet TDT 0.6B的开源，更多开发者将能够利用这一先进的ASR模型，推动语音识别技术的发展和应用。未来，我们期待看到更多基于该模型的创新应用和技术突破。

更多>同类内容

《新驯龙高手》真人版IMAX预告来袭，6月13日共赴龙背之战！

05-07

谷歌5月安卓安全大更新：45个漏洞被堵，FreeType高危漏洞受关注

05-07

五菱宏光MINIEV四月再夺冠！A00级市场单月热销28990台

05-07

安森美Q1收入双降，CEO展望谨慎，二季度能否回暖？

05-07

特斯拉纯视觉辅助驾驶遭热议，高价选装费成消费者痛点

05-07

增程汽车技术路线遭质疑，高效混动系统成新宠？

05-07

小米智能音箱，让科技成为母亲节的温馨陪伴

05-07

谷神星一号海射型（遥五）火箭即将升空，任务代号“槐序绯棠”！

05-07

法拉利一季度赚翻了！单车净利润93.9万，全球车企利润榜首

05-07

iOS 18.5 RC发布：iPhone 13全系卫星功能上线，国行用户遗憾错过

05-07

苹果iOS 18.5新升级：孩子破“屏幕时间”密码，家长即刻知晓！

05-07

新能源车险续费难，高科技背后的保费负担何时减？

05-06

《GTA 6》第二预告来袭，2026年5月26日正式发售！

05-06

大疆Mavic 4 Pro即将震撼发布，5月13日晚揭晓七大升级亮点！

05-06

小米携手多家救援组织，本月多地开展“应急响应”公益行动！

05-06

点击查看更多 +

全站最新

商汤科技与敦煌美术馆联手，AI技术如何“活化”敦煌文化IP？

魅族Note 16真机曝光：纯白撞色设计，中端性价比新机来袭！

胖东来联手京东！12.5亿大项目落地河南，年产值预计达25亿

苹果iPhone 18 Pro将迎影像大升级：可变光圈技术首亮相

法拉利一季度财报亮眼：营收涨13%，净利超4亿欧，纯电动车将亮相

思科量子网络芯片原型问世，开启大规模量子计算新时代？

热门内容

本栏最新

英伟达Parakeet TDT 0.6B：开源ASR新标杆，秒速转录60分钟音频

《新驯龙高手》真人版IMAX预告来袭，6月13日共赴龙背之战！

五菱宏光MINIEV四月再夺冠！A00级市场单月热销28990台

特斯拉纯视觉辅助驾驶遭热议，高价选装费成消费者痛点

增程汽车技术路线遭质疑，高效混动系统成新宠？

小米智能音箱，让科技成为母亲节的温馨陪伴

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10