豆包手机助手：使用系统原生截屏接口，无法截屏银行键盘等受保护内容|界面新闻

12月13日，豆包手机助手发布技术说明：近期有网友发布视频称，“豆包手机助手通过 READ_FRAME_BUFFER权限，从GPU渲染的图形缓冲区拿走图像数据，不需要走上层的截图API。还用了CAPTURE_SECURE_VIDEO_OUTPUT权限，可以获取银行安全键盘等受保护的界面内容”。这是对豆包手机助手技术实现方式的错误解读。

豆包手机助手采用的是原生截屏接口（WindowManagerService.captureDisplay），严格遵循应用声明的Secure标记，无法截屏银行安全键盘等声明受保护的界面内容。任何持有豆包手机助手技术预览版的用户，都可以自己写一个带有受保护页面的APK进行测试，让AI讲解页面内容，可以验证AI是无法看到的。

网友提到的READ_FRAME_BUFFER权限，是为了让AI可以在后台完成操作，豆包手机助手让三方应用运行在虚拟屏空间中。为了获取虚拟屏中运行的应用截图内容（对应方法 WindowManagerService.captureDisplay）提供给豆包大模型推理，所以需要 READ_FRAME_BUFFER 权限，但该方法以及权限无法读取到包括银行APP在内的任何三方应用设置为 Secure 的内容。

CAPTURE_SECURE_VIDEO_OUTPUT权限的使用，是因为受保护的页面在虚拟屏的投影（即点击灵动岛打开的粉色边缘的应用界面）中会显示为黑屏，用户无法查看和操作，所以需要此权限将受保护的内容正常展示给用户并能够被用户操作。但在投影后，受保护的页面仍会标记为Secure，仅能被用户查看，无法被截屏。

豆包手机助手操作手机功能的实现原理是：用户下达指令 -> 截屏发送给云端豆包大模型 -> 模型理解后返回具体操作 -> 手机端执行操作指令，不断重复直到完成任务。因此每一步操作后都需要再截图上传给云端大模型分析，每步操作间隔约为 3 秒钟。

由于分析界面所需的大模型参数较大，受限于芯片性能暂时无法运行在手机端侧，需要截图上传云端处理。据我们了解，目前国内多家手机厂商具有AI操作能力的助手产品，也是同样的实现原理，也会使用READ_FRAME_BUFFER等系统权限。

需要强调的是，豆包手机助手仅在有用户指令时才会开始截屏，且无法截屏三方应用 Secure标记页面。上传至云端大模型的截屏仅用于视觉理解和推理，完成任务后不会存储在云端。

豆包手机助手高度重视用户隐私安全，欢迎社会各界提出宝贵意见。我们会以负责任的态度沟通产品技术问题，把安全和信任做好。

历史搜索全部删除

热门搜索

豆包手机助手：使用系统原生截屏接口，无法截屏银行键盘等受保护内容

评论