浏览器端物体检测器

浏览器端处理

即时结果

不存储数据

浏览器端物体检测器是什么？

浏览器端物体检测器让你在浏览器里扫描图片中的物体，而不是把文件上传到外部视觉 API。它适合内部截图、产品图、插图或 QA 图片，当你只想快速看看模型识别到了什么，同时又希望原图留在设备上时尤其有用。

当前工作流基于 Transformers.js，并采用 DETR 路线。首次运行时浏览器可能需要下载并缓存模型，之后如果缓存仍在，后续运行会顺畅得多。

很多物体检测流程都默认要先把图片上传到云端

很多图像识别工具会要求你先把图片发到远程 API，才会返回物体标签和边框。

这不适合内部截图、敏感图片或未公开素材。

而很多时候你只需要一次快速扫描，看看模型识别到了哪些明显物体，以及它有多自信，并不需要完整的计算机视觉平台。

在浏览器里用本地 DETR 扫描物体

这个工具在浏览器内运行本地物体检测流程，直接返回标签、置信度和边框坐标，不需要把图片上传到应用服务器。

你可以切换 WebGPU 与 WASM，并调整置信度阈值，让输出更宽松或更保守。

模型会缓存在浏览器中，因此首次下载后，后续运行通常更快，也更接近离线体验。

如何使用浏览器端物体检测器

1上传图片 - 从设备中选择截图、产品图或其他图片文件。
2选择后端 - 使用 auto，或手动切换到 WebGPU / WASM 来控制速度和兼容性。
3设置阈值 - 决定模型需要多高置信度，检测结果才保留在列表中。
4运行本地检测 - 让工具加载模型，在浏览器里扫描图片并返回物体标签与边框。
5检查结果 - 查看边框覆盖层，然后复制结果或下载 JSON 继续使用。

主要功能

基于 DETR 的浏览器内本地物体检测
边框覆盖层和物体列表
可调置信度阈值
WebGPU / WASM 后端切换
源图片不上传到应用服务器

优势

无需把图片交给托管 vision API 也能扫描物体
先在本地检查标签与置信度再继续使用
让截图、产品图和内部素材留在设备上
后续可继续复用已缓存模型

使用场景

内部图片 QA

先在本地检查模型能识别哪些物体，而不用把图片交给托管 API。

手工标注前准备

把物体标签和边框位置当作人工复核前的第一层提示。

内容运营辅助

在做 metadata 或说明前，先用本地扫描快速理解图片中的主要物体。

更偏离线的工作流

利用已缓存模型，在同一浏览器里继续做后续物体检测。

技巧与常见错误

技巧

尽量使用主体清晰、物体明显的图片，以获得更稳定的初始检测结果。
如果你想看看边缘结果，可以降低阈值；如果只想保留更稳的结果，再把阈值调高。
如果 WebGPU 不稳定，可以切换到 WASM。

常见错误

假设 detector 一定能正确识别所有小众物体、logo 或图片里的文字。
不人工检查就直接把低置信度结果当成可靠标签。
把阈值设得过高后，就误以为图片里没有任何值得关注的内容。

知识要点

DETR 这类模型可以同时预测物体类别和边框位置，适合做浏览器里的第一轮检测。
置信度能帮助排序，但并不保证每个标签在所有场景下都一定正确。
物体检测与 OCR 解决的是不同问题，所以文字很多的截图通常需要两种流程配合。

常见问题

图片会上传到应用服务器吗？

不会。图片在浏览器中完成检测。只有模型文件可能在首次运行时需要下载。

结果包括什么？

结果包括物体标签、置信度分数，以及帮助你查看位置的边框。

它能替代截图 OCR 吗？

不能。这是物体检测流程，不是专用 OCR，所以文字很多的截图往往还需要单独 OCR。

可以把结果直接当最终结论吗？

不建议。更适合作为私密本地第一轮扫描，再结合人工复核来判断。

隐私优先 OCR 本地 AI 图片描述器本地元数据清理器

探索更多本地 AI 工具

浏览器端物体检测器属于本地 AI 工具。探索更多免费在线工具，快速完成相关任务。

查看全部本地 AI 工具

私密本地物体检测

浏览器本地检测缓存

DETR 模型说明

源图片

检测设置

检测结果

运行统计

浏览器端物体检测器是什么？

很多物体检测流程都默认要先把图片上传到云端

在浏览器里用本地 DETR 扫描物体

如何使用浏览器端物体检测器

主要功能

优势

使用场景

内部图片 QA

手工标注前准备

内容运营辅助

更偏离线的工作流

技巧与常见错误

技巧

常见错误

知识要点

常见问题

图片会上传到应用服务器吗？

结果包括什么？

它能替代截图 OCR 吗？

可以把结果直接当最终结论吗？

探索更多本地 AI 工具

浏览器端物体检测器

私密本地物体检测

浏览器本地检测缓存

DETR 模型说明

源图片

检测设置

检测结果

运行统计

浏览器端物体检测器是什么？

很多物体检测流程都默认要先把图片上传到云端

在浏览器里用本地 DETR 扫描物体

如何使用浏览器端物体检测器

主要功能

优势

使用场景

内部图片 QA

手工标注前准备

内容运营辅助

更偏离线的工作流

技巧与常见错误

技巧

常见错误

知识要点

常见问题

图片会上传到应用服务器吗？

结果包括什么？

它能替代截图 OCR 吗？

可以把结果直接当最终结论吗？

相关工具

探索更多 本地 AI 工具

探索更多本地 AI 工具