【环球网科技报道 记者 李文瑶】大模型应用步入深水区,操作系统层级成为AI助手的新战场。
5月20日,腾讯正式推出操作系统层级AI助手Marvis(马维斯),面向Windows、Mac、安卓三端全量开放,免邀请码。这款产品并非又一款通用对话型AI,而是定位为“操作系统层级”——能直接触达系统设置、文件管理、应用调用与硬件信息,支持端侧隐私模式与跨端可视化操控。
在通用AI助手赛道已显拥挤的当下,腾讯选择从底层系统切入,这也意味着AI助手的竞争正从“云端对话”走向“终端执行”,从“模型参数比拼”转向“系统深度整合”。
在Marvis发布前,记者采访了腾讯Marvis团队,试图厘清这款产品与市面上其他Agentic AI(具有自主执行能力的智能体)的核心差异,它如何降低普通用户的使用门槛,以及当前AI助手行业的发展阶段与未来走向。
“未来的AI助手一定是多端的、跨设备的。”一位行业分析师告诉记者,“用户不会只在一台设备上使用AI,手机、电脑、平板甚至车载系统都需要无缝衔接。Marvis在跨端方面的积累——应用宝四年的跨端引擎技术——是其长期竞争力的一部分。”
差异化:从“聊天的AI”到“干活的AI”
当前市面上的AI助手大致可分为三类:通用对话型(如豆包、Kimi)、工具型(如AI PPT、编程助手)和操作系统层级(如微软Copilot、苹果Apple Intelligence)。Marvis明确选择了第三类。
“Marvis不是Chatbot,也不是一个简单的应用层Agent。”腾讯Marvis产品负责人在采访中表示,“它的核心定位是‘操作系统层级’——能直接触达系统设置、文件管理、应用调用和硬件信息,用户不需要记住设置入口、文件路径或软件操作步骤,只用一句话说明目标,Marvis就能拆解任务、调度对应Agent执行。”

这一能力的底层支撑,来自腾讯应用宝团队多年的积累。据该负责人介绍,Marvis背后是应用宝团队,继承了与软硬件厂商十余年的合作关系和四年跨端引擎技术。具体到技术实现上,Marvis与微软、英特尔分别建立了战略级合作。
与微软的合作聚焦系统层面。 基于Microsoft Foundry on Windows端侧AI开发平台,Marvis通过WinML推理框架实现大模型在本地NPU、GPU和CPU上的优化运行。更重要的是,借助MCP on Windows提供的本地设备代理注册表(ODR),Marvis接入了系统级文件MCP服务,能够通过自然语言直接操作电脑文件——包括变更、查询、理解等。这是普通应用层AI无法做到的。
与英特尔的合作则聚焦芯片级推理性能。 Marvis借助OpenVINO加速技术,针对端侧模型做了芯片级别的运算速度优化,整体推理性能提升20%以上。在中小尺寸模型场景中,Intel AIPC的GPU/NPU推理速度相比传统CPU可提升2到10倍。
这些底层能力转化为用户可感知的差异化功能,主要体现在三个方面:
其一,系统级的理解与操控。 用户可以直接询问“我的电脑能流畅运行黑神话吗?”Marvis会感知本机硬件配置,联网查询游戏要求,做出匹配判断。同样,调整鼠标灵敏度、关闭开机自启动项、清理冗余文件等操作,都可以通过对话完成。
其二,跨端可视化操控。 Marvis支持Windows、Mac、iOS、安卓多端同账号互通。用户可以在手机上直接查看电脑屏幕并实时接管,PC锁屏状态下手机仍可远程输入密码解锁操控。区别于多数停留在“远程命令”层面的产品,Marvis提供桌面级实时可视化操控。这一能力得益于应用宝的跨端引擎技术积累——不仅能操作电脑上的EXE软件,还能直接在电脑上运行手机APP(如微博、小红书等),且不抢占键盘鼠标,可多任务并行。
其三,预置多Agent协作体系。 Marvis出厂时内置了6个Agent协同的“AI团队”:主Agent负责统筹拆解,File Agent处理文件搜索、阅读、编辑、格式转换,Computer Agent负责系统运维与硬件检测,App Agent调用电脑应用,Browser Agent进行网页交互与数据抓取,Search Agent负责网络搜索与信息聚合。用户不需要自行搭建工作流或配置技能,装上就能用。
一位长期关注AI应用层的投资人告诉记者:“目前大部分Agentic AI产品还停留轻任务层面,真正能深入操作系统、理解文件内容、跨端操控的极少。Marvis的差异化在于它‘长’在系统里,而不是‘挂’在系统上。”
降低门槛:从“极客玩具”到“人人可用”
AI助手要走向大众,必须解决两个门槛:一是操作门槛,二是安全隐私门槛。
在操作门槛上,Marvis的策略是“初始多Agent+自然语言交互”。用户不需要学习任何新技能,也不需要像使用某些Agent产品那样先配置工作流或编写技能脚本。在沟通演示环节中,记者看到用户可以直接下达“找出最近一个季度的发票,按时间顺序整理成表格”这样的复合指令,Marvis会自动调用File Agent检索本地文件、识别发票内容、提取关键字段、生成Excel表格。
“我们走了一条‘自下而上’的路径。”Marvis产品负责人回忆,“2023年行业模型能力还比较差的时候,我们没有选择从概念出发,而是先从文件解析、格式转换这些底层工具做起。先把地基打好,再构建Agent框架。到了2025年12月,底层工具链基本完备,Agent框架也搭起来了,才形成今天的产品。”
这一路径的另一个成果是个人知识库的自动化构建。Marvis集合多种本地模型理解文件,能搜索文件内容、图片内文字,还能根据人像、内容主题、节日地点等维度提供AI图库、AI文档库。用户“不记得文件名就找不到文件”的痛点被有效解决。
在安全隐私门槛上,Marvis建立了多层机制。
一是L2级安全兜底。 删除文件、修改系统核心配置等敏感操作,会强制触发“硬垂询”,AI必须先给出执行计划并请求用户确认,用户点击确认后才能执行。支付等更高敏感级别动作必须由用户本人完成。
二是隐私模式。 开启后,所有数据解析、图片识别及对话均在本地完成,完全不上云。即使断网也能正常使用。这一模式对财务、法务、人力资源等处理敏感数据的岗位尤为重要。
三是用户对数据的自主控制权。 首次使用时,用户可以自定义Marvis的索引范围,默认推荐目录可修改。在生成的图谱中,如果发现不希望被索引的图片,可以右键屏蔽。端侧模型已针对极端敏感图片做了基础过滤。
“我们不会用用户数据训练模型。”该负责人明确表示,“原则是‘数据不出域’。隐私模式下全部本地处理;效率模式下数据仅用于当下推理计算,绝不用于训练。”
据了解,Marvis目前向用户提供每人每天1000万免费Token的用量。关于未来收费模式,团队表示“完全免费不现实”,但会提供基础用量配额并支持用户自带API Key,同时通过端侧模型优化将大部分常规操作消化在本地,大幅降低云端Token消耗成本。
AI助手正从“模型竞赛”转向“场景落地”
Marvis的发布,恰逢AI助手行业进入一个新的发展阶段。
从市场格局看,通用AI助手赛道已经非常拥挤。相关AI应用算力消耗攀升,产品迭代加速,通用对话型AI助手头部效应明显。
与此同时,模型层与应用层的关系正在发生变化。 大模型能力持续增强,从单纯的对话向应用层面不断延展。这意味着,做一款“什么都能聊”的AI助手已经很难突围,必须找到特定的场景和深度。
操作系统层级AI助手,正是目前相对空白的领域。 微软Copilot和苹果Apple Intelligence是这一赛道的代表性产品,但在国内市场的落地进度并不理想。国内市场也亟需有本土化的操作系统层级AI产品来提升PC等硬件产品的用户体验。
“这不是一个简单的API调用问题。”Marvis团队技术负责人解释,“要真正理解操作系统、文件系统、硬件信息,需要芯片层和操作系统层的深度合作。我们在这两层的积累,是普通应用层AI公司不具备的。”
从行业趋势看,端云协同和端侧模型正在成为共识。Marvis的“效率模式”采用端云协同——复杂问题理解与规划借助云端模型,文件处理、执行动作和本地索引尽量在端侧完成。“隐私模式”则完全依赖端侧模型。这种分层策略既降低了云端Token消耗成本,也满足了不同用户对数据安全的需求。
“未来的AI助手一定是多端的、跨设备的。”一位行业分析师告诉记者,“用户不会只在一台设备上使用AI,手机、电脑、平板甚至车载系统都需要无缝衔接。Marvis在跨端方面的积累——应用宝四年的跨端引擎技术——是其长期竞争力的一部分。”
不过,Marvis也面临明确的能力边界。出于合规和安全考虑,它不支持任何涉及资金划转的自动交易操作。视频内容的深度理解(如提取字幕、分析画面)由于算力成本较高,被列为后续规划。团队对此保持务实态度:“现阶段更聚焦于解决办公文档处理和系统操控的高频痛点。”
未来:AI Agent从“能对话”到“能干活”
采访中,Marvis团队反复强调一个观点:AI助手的终极形态不是“更会聊天”,而是“更会干活”。
这一判断正在行业中得到验证。从2025年下半年开始,Agentic AI成为大模型应用的热点方向。但与多数停留在“远程命令”或“单点任务”的产品不同,Marvis试图构建一个能够理解整台电脑、跨端协同、自主规划并执行复杂任务的系统级Agent。
“好的产品不是规划出来的,是长出来的。”Marvis产品负责人坦言,“我们2023年就开始尝试,当时模型能力不够,产品体验不好。2024年我们调整方向,从底层工具开始一点一点积累。到了2025年12月,上下两头打通,产品才真正成型。”
这种从底层向上的务实风格,也体现在Marvis的模型策略上。云端效率模式采用混元和DeepSeek V4等最新模型,确保复杂任务的推理能力;本地隐私模式采用Qwen端侧模型。团队表示未来计划接入更多开源模型,供用户选择。
“AI行业节奏太快了。”上述负责人感慨,“我们希望用户多提意见,一起探索这个新品类的发展方向。”
从更宏观的视角看,Marvis的出现也意味着国内AI助手竞争从“模型参数比拼”进入“系统深度整合”阶段。谁能更深入地理解终端、更安全地处理数据、更便捷地跨端协同,谁就有可能在新的竞争中占据优势。