PCDaily手机网站站内搜索

提供便携式设备、创新应用和趋势洞察的深度报道，帮助您在快速发展的科技世界中保持前沿！

滚动资讯

当前位置：智能日报 > 智能手机 > 正文内容

京东全球首开源全栈实时视频视觉语言交互模型JoyAI-VL-Interaction 赋能多场景AI助手

时间：2026-06-22 21:42 来源：快讯作者：柳晴雪

京东近日宣布正式开源全球首个全栈实时视频视觉语言交互模型——JoyAI-VL-Interaction，并同步获得vLLM-Omni框架的day-0原生支持。这一突破性技术标志着大模型应用从传统的"问答式交互"向"主动感知型交互"迈出关键一步，开发者可基于该框架快速构建具备环境感知能力的智能助手。

该模型实现了三大核心技术创新：首先突破传统模型的被动响应模式，通过持续视频流分析实现自主决策，无需等待用户提问即可判断交互时机；其次在实时性方面取得突破，针对安防预警、实时翻译等场景，可在画面变化瞬间完成响应，彻底改变传统视频分析"事后处理"的局限；第三创新设计了智能体委托机制，当遇到复杂任务时，前台模型保持环境观察，后台模型同步处理代码生成、工具调用等任务，形成高效协作的"双脑"架构。

技术架构层面，该系统支持多模态输入输出，包括摄像头、直播流、监控视频等视频源，以及语音交互、可视化界面等交互方式。其模块化设计允许开发者自由替换ASR语音识别、TTS语音合成、后台模型等组件，甚至可接入自定义业务系统。这种高度灵活性使其既能用于学术研究，也可快速适配安防监控、老人看护、直播解说、电商导购等20余个垂直场景。

在真实场景测试中，该模型展现出显著优势。针对监控预警、实时计数、多语言翻译等58个流式交互场景的盲测显示，与豆包视频通话助手相比取得77.6%的胜率，较Gemini视频通话助手更达到87.9%的胜率。测试特别强化了视觉触发响应和实时性两个维度，验证了模型在动态环境中的可靠性和效率。

目前，京东已完整开源模型代码、训练框架及部署方案，并提供vLLM部署工具包。开发者可基于现有组件快速搭建个性化AI助手，例如将语音服务替换为科大讯飞方案，或接入自研的Agent系统。这种开放生态策略有望推动实时交互技术在更多领域的创新应用，特别是在需要人机协同的复杂场景中展现价值。

更多>同类内容

科大讯飞Fika阅读器深度评测：轻便智能，开启高效舒适阅读新体验

其流畅的操作界面和多种阅读模式使得每位用户都能找到最适合自己的阅读方式，极大地提升了用户的阅读体验。在技术创新方面，科大讯飞Fika阅读器搭载了最新的AI伴读功能，帮助用户更高效地学习和获取信息。综上所述…

06-22

国家“体重管理年”收官在即蚂蚁阿福“科学减重1亿斤”行动助力健康

06-22

数字电商搭台直播助力灵武长枣“云”端飘香畅销全国

依托全域电商直播体系，灵武温室长枣搭乘线上快车走俏全国，合作社多元平台常态化带货，打通农户果品产销链路，以数字新业态激活枣产业增收新动能。在灵武市富成枣产业专业合作社，工作人员抢抓销售窗口期，全力打包、接单…

06-22

御溪谷OPC出海创业：以AI与资源赋能，助力个人轻资产开启跨境电商新征程

区别于传统培训机构的服务模式，该社区更加关注创业项目的实际落地与持续成长，围绕出海创业全生命周期需求，构建了以OPC（一人公司）模式为基础、“1+6”深度孵化体系为核心的创业服务机制，帮助创业者实现从学习到…

06-22

科大讯飞40亿定增调整：教育大模型扩至三城算力平台添新力量

随着词元星火科技有限公司的加入，整个算力平台体系将更加完善，能够更好地支撑起未来复杂多变的人工智能应用场景。通过在全国范围内布局子公司的策略，可以有效贴近各个区域市场的实际需求；另一方面，则有助于加速教育大模…

06-22

阿里合伙人迎新变动：AI领域周靖人、财务领域徐宏新晋加入

当时，阿里巴巴方面表示，通义大模型团队从零到一的搭建，到Qwen系列在全球模型中确立领先地位，周靖人是关键人物之一，并于2025年成为阿里巴巴合伙人。2026年4月，阿里巴巴设立集团技术委员会，由CEO吴泳…

06-22

国产人形机器人秀中式敬酒礼仪，社交动作细腻，民用服务潜力可期

宇树科技对外发布全新人机交互演示视频，旗下人形服务机器人完整复刻中式餐桌全套敬酒礼仪，双手平稳托举酒杯，主动侧身低头示意，区分主次顺序礼让举杯，动作流畅自然没有机械卡顿，完整拿捏国内社交餐桌的人情分寸，视频一…

06-21

商界铁娘子之女不拼家世拼实力，500块开启北漂路终成演艺圈“逆袭者”

蓝盈莹考上中央戏剧学院那一年，母亲蓝雪球没有像许多人想象中那样铺好一条星光大道。没有托关系打招呼，没有为女儿的未来提前铺设任何捷径，她只是从钱包里拿出500块钱，轻轻拍在桌上，说得干脆又冷静：学费家里出，生活…

06-21

苹果20周年纪念版iPhone独占台积电2nm制程，高端布局与市场策略全解析

此次为 20 周年纪念机型独占 2nm 初期产能，进一步印证苹果高端产品差异化战略，未来苹果会持续通过芯片工艺、外观设计、专属功能区分产品线，纪念版机型将成为每年硬件天花板，普通标准版控制成本走大众走量路线，…

06-20

葡萄牙建筑3D打印新突破：500㎡回收中心9天建成，成本工期双优化

葡萄牙建筑3D打印公司Havelar近日为马托西纽什市政府完成了一座公共建筑的建设，全程采用建筑3D打印技术。Q1：Havelar的建筑3D打印项目用了多少人和多少时间？ Q2：建筑3D打印技术在曲面墙体…

06-20

AMD线程撕裂者处理器遇HandBrake瓶颈终突破视频转码性能飙升最高达215%

IT之家 6 月 19 日消息，AMD 昨日（6 月 17 日）发布公告，通过修复 HandBrake软件的线程管理限制，线程撕裂者（Threadripper）系列处理器视频转码性能最高提升 215%。 I…

06-19

Codex开放第三方模型接入，DeepSeek实测体验：有潜力但门槛待降

过去很多人吐槽 OpenAI封闭，其实不光是因为模型不开源，更核心的原因是它的工具、模型和工作流都被整个包在自家体系里，你可以用，但很难拆开重组。 DeepSeek V4Pro 一开始尝试的时候内置网页…

06-19

理想汽车明确规划：L系列专注增程，i系列扛起纯电SUV大旗

06-19

新乡经开科创集团3亿元公司债计划发行成功获上交所审核通过

06-19

米哈游新作《BSide：Olivia Lin》登陆Steam，AI女友互动伴桌面动态壁纸新体验

IT之家 6 月 19 日消息，米哈游旗下《BSide：Olivia Lin》6 月 18 日在 Steam平台公开了商店页面，发售日期暂未公布，目前已支持添加愿望单。2025 年 8 月 28 日，B站账…

06-19

点击查看更多 +

全站最新

科大讯飞智能体耳机Pro：职场高效神器，录音转文字让会议记录更轻松

瑞信大屏护眼VS讯飞AI辅导：两款热门学习机真实体验，家长选机不迷茫

科大讯飞Fika阅读器深度评测：轻便智能，开启高效舒适阅读新体验

雷军刘震云对谈AI：能辅助创作难替代核心价值，创新仍是人类专属

未来外贸企业新格局：获客、信任、经营能力成制胜关键要素

蔚来ES8大五座版6月28日开启预订空间优化或成高端市场新宠

热门内容

本栏最新

科大讯飞Fika阅读器深度评测：轻便智能，开启高效舒适阅读新体验

数字电商搭台直播助力灵武长枣“云”端飘香畅销全国

御溪谷OPC出海创业：以AI与资源赋能，助力个人轻资产开启跨境电商新征程

阿里合伙人迎新变动：AI领域周靖人、财务领域徐宏新晋加入

商界铁娘子之女不拼家世拼实力，500块开启北漂路终成演艺圈“逆袭者”

鸿蒙生态新跨越：6600万终端助力，内容创新活力全面迸发

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10 鲁公网安备37010202700527号