字节“豆包”手机助手上线：重塑人机交互逻辑但安全性引关注

网络 2025-12-14 09:34:09

2025-12-14 09:34:09 阅读

　　字节跳动旗下AI大模型“豆包”12月1日宣布上线手机助手并与中兴通讯合作推出“豆包手机”——努比亚M153，作为一款拥有系统级权限的手机助手，它能像人类一样操作智能手机，试图重塑人机交互逻辑，这款在AI时代颇具突破性的产品很快成为了舆论焦点。

豆包手机助手官网页面

　　不过，对于AI手机助手的安全性也随之迅速引发外界讨论。

　　近日，有报道称，由于担忧网络安全、数据安全以及潜在的竞争问题，监管机构已经约谈字节跳动相关负责人。12月13日，对于上述报道，知情人士向记者回应称，该消息不实。字节跳动多次发布公开声明，对于豆包手机助手的安全性作出解释。

　　12月13日晚，豆包手机助手发布技术说明：近期有网友发布视频称，“豆包手机助手通过READ_FRAME_BUFFER权限，从GPU渲染的图形缓冲区拿走图像数据，不需要走上层的截图API。还用了CAPTURE_SECURE_VIDEO_OUTPUT权限，可以获取银行安全键盘等受保护的界面内容”。

　　豆包手机助手表示，这是对豆包手机助手技术实现方式的错误解读。豆包手机助手采用的是原生截屏接口（WindowManagerService.captureDisplay），严格遵循应用声明的Secure标记，无法截屏银行安全键盘等声明受保护的界面内容。需要强调的是，豆包手机助手仅在有用户指令时才会开始截屏，且无法截屏三方应用Secure标记页面。

　　此外，豆包披露了运行原理：用户下达指令后，系统截屏上传至云端大模型分析（每步间隔约3秒），完成后执行操作。官方强调，截屏仅用于视觉理解和推理，任务完成后不会在云端存储。受限于芯片性能，目前国内多家手机厂商的AI助手产品均采用类似的云端处理原理及系统权限。

　　这种“截图上云”的模式，其实解答了外界对于AI如何“看懂”手机的疑惑。简单来说，就是把手机屏幕画面像发图片一样，每隔几秒传给云端的超级大脑，让大脑看懂后再指挥手机怎么点。

　　豆包在说明中坦言，受限于现在的手机芯片性能，还没法直接在手机本地跑通这么复杂的流程，所以这种由“远程大脑”代驾的模式，不仅是他们一家在用，也是目前行业里的通用做法。

　　至于外界最担心的“银行密码会不会被AI偷看”，这里涉及安卓系统底层的“红线”——Secure（安全）协议。虽然豆包为了实现自动操作，确实申请了较高的系统权限，但这并不意味着它能突破系统的底层防护。按照安卓的规则，只要银行或支付App开启了防截屏保护，AI截取到的画面就是一片漆黑，根本看不见键盘和密码。那些被质疑的特殊权限，实际上是为了让用户自己能看到画面并进行操作，而不是给AI开后门。

　　12月初，“多家App对豆包手机禁用”还曾登上热搜，微信、淘宝、支付宝以及多家银行App出现了对豆包手机的限制或禁用。

　　12月5日，豆包手机助手发布《关于调整AI操作手机能力的说明》，称计划在接下来的一段时间，在部分场景，对AI操作手机的能力做一些规范化调整。还强调，将积极与各方沟通，希望推动形成更加清晰、可预期的规则，避免用一刀切的方式否定用户合理使用AI的权利。

　　相关调整主要涉及三类场景：一是限制在各类App中用于刷分、刷激励的自动操作能力，以尊重厂商鼓励“真实用户主动交互”的初衷；二是进一步限制银行、互联网支付等金融类应用的代操作能力；三是对涉及竞技排名的部分游戏场景暂停开放AI使用，维护公平性。

字节豆包手机助手上线人机交互安全性

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

字节“豆包”手机助手上线：重塑人机交互逻辑但安全性引关注

推荐文章：

AI跨年行情：基金经理聚焦科技股发展