Quay lại tất cả công cụ
    Công cụ AI Cục bộ

    Trình phát hiện vật thể trong trình duyệt

    Báo lỗi

    Phát hiện vật thể trong ảnh cục bộ ngay trong trình duyệt với workflow DETR riêng tư

    Ảnh nguồn

    Phát hiện vật thể trong ảnh cục bộ ngay trong trình duyệt với workflow DETR riêng tư

    Bấm để tải ảnh lên cho nhận diện vật thể cục bộ

    Ảnh chụp, screenshot và ảnh sản phẩm có thể được quét cục bộ trong trình duyệt để tìm vật thể phổ biến.

    Thiết lập nhận diện

    Chọn backend suy luận và ngưỡng tin cậy tối thiểu cho danh sách vật thể.

    Phân tích vật thể trong bộ nhớ trình duyệt

    Ảnh được giải mã và quét vật thể trong bộ nhớ trình duyệt. Ảnh lớn vẫn phụ thuộc RAM thiết bị và backend suy luận đã chọn.

    Tải ảnh lên để bắt đầu nhận diện vật thể cục bộ riêng tư.0%

    Kết quả nhận diện

    Rà danh sách vật thể cục bộ riêng tư và các khung bao trước khi sao chép hoặc xuất file.

    Kết quả phát hiện vật thể AI cục bộ sẽ xuất hiện ở đây sau khi xử lý.

    Thống kê lượt chạy

    Thông tin nhanh về lượt nhận diện cục bộ, ngưỡng, model, kích thước ảnh và trạng thái offline.

    Runtime offlineService worker theo phạm vi
    Trạng thái offlineService worker không khả dụng
    Số vật thể0
    Nhãn cao nhất-
    Ngưỡng tin cậy-
    ModelXenova/detr-resnet-50
    Kích thước ảnh-
    Xử lý trên trình duyệt
    Kết quả tức thì
    Không lưu trữ dữ liệu

    Trình phát hiện vật thể trong trình duyệt là gì

    Trình phát hiện vật thể trong trình duyệt giúp bạn quét ảnh và nhận diện vật thể ngay trên máy thay vì gửi tệp lên một dịch vụ thị giác máy tính bên ngoài. Công cụ này phù hợp cho ảnh chụp màn hình nội bộ, ảnh sản phẩm, hình minh họa hoặc ảnh kiểm thử khi bạn chỉ cần một lượt kiểm tra nhanh xem mô hình đang nhìn thấy gì mà vẫn giữ tệp gốc trên thiết bị.

    Workflow hiện tại dùng Transformers.js với model DETR theo hướng local-first. Ở lần chạy đầu, trình duyệt có thể cần tải và cache model; sau đó các lượt chạy sau sẽ mượt hơn nếu bộ nhớ đệm vẫn còn.

    Nhiều workflow phát hiện vật thể yêu cầu upload ảnh lên dịch vụ cloud

    Nhiều công cụ nhận diện ảnh yêu cầu bạn gửi hình lên API từ xa trước khi trả về nhãn vật thể và khung bao.

    Điều đó không phù hợp với screenshot nội bộ, ảnh nhạy cảm hoặc asset chưa công bố mà bạn không muốn rời khỏi máy.

    Trong nhiều trường hợp, bạn chỉ cần một lượt quét nhanh để xem model đang nhận ra vật thể nào và độ tự tin ra sao, chứ không cần cả một nền tảng computer vision đầy đủ.

    Dùng DETR cục bộ để quét vật thể ngay trong trình duyệt

    Công cụ này chạy pipeline phát hiện vật thể ngay trong trình duyệt để trả về nhãn, điểm tin cậy và tọa độ khung bao mà không cần upload ảnh lên máy chủ ứng dụng.

    Bạn có thể chọn backend WebGPU hoặc WASM và chỉnh ngưỡng tin cậy để kết quả rộng hơn hoặc chặt hơn tùy nhu cầu.

    Model được lưu đệm trong trình duyệt, nên các lượt quét tiếp theo thường nhanh và thân thiện offline hơn sau lần tải đầu.

    Cách sử dụng Trình phát hiện vật thể trong trình duyệt

    1. 1Tải ảnh lên - Chọn screenshot, ảnh sản phẩm hoặc file hình khác từ thiết bị.
    2. 2Chọn backend - Dùng auto hoặc ép WebGPU / WASM nếu bạn muốn kiểm soát tốc độ và độ tương thích.
    3. 3Chọn ngưỡng tin cậy - Đặt mức độ tự tin tối thiểu để vật thể còn xuất hiện trong danh sách kết quả.
    4. 4Chạy quét cục bộ - Để tool nạp model, quét ảnh trong trình duyệt và trả ra danh sách vật thể cùng khung bao.
    5. 5Rà soát kết quả - Kiểm tra overlay khung bao rồi sao chép hoặc tải JSON để dùng tiếp.

    Tính năng chính

    • Phát hiện vật thể DETR cục bộ trong trình duyệt
    • Hiển thị khung bao và danh sách vật thể
    • Điều chỉnh ngưỡng tin cậy
    • Chọn backend WebGPU / WASM
    • Không upload ảnh nguồn lên máy chủ ứng dụng

    Lợi ích

    • Quét ảnh mà không gửi file sang vision API hosted
    • Rà nhãn và độ tin cậy cục bộ trước khi dùng tiếp
    • Giữ screenshot, ảnh sản phẩm và asset nội bộ trên thiết bị
    • Tái dùng model đã cache cho các lượt quét sau

    Trường hợp sử dụng

    QA ảnh nội bộ

    Kiểm tra nhanh model đang nhìn thấy gì trong screenshot hoặc asset nội bộ mà không gửi file lên API hosted.

    Chuẩn bị annotation thủ công

    Dùng nhãn vật thể và vị trí khung bao như lớp gợi ý đầu tiên trước khi rà tay.

    Hỗ trợ vận hành nội dung

    Quét ảnh cục bộ để hiểu nhóm vật thể chính trước khi làm metadata hay tài liệu mô tả.

    Workflow thân thiện offline

    Tận dụng model đã cache cho các lượt phát hiện vật thể tiếp theo trong cùng trình duyệt.

    Mẹo và lỗi thường gặp

    Mẹo

    • Ưu tiên ảnh rõ và vật thể dễ thấy để lượt nhận diện đầu tiên ổn định hơn.
    • Giảm ngưỡng tin cậy khi bạn muốn xem cả các dự đoán sát mép, rồi tăng lại khi chỉ muốn kết quả chắc hơn.
    • Chuyển sang WASM nếu WebGPU không ổn định trên thiết bị hiện tại.

    Lỗi thường gặp

    • Tin rằng detector sẽ nhận ra đúng mọi logo, vật thể hiếm hoặc chữ trong ảnh.
    • Dùng luôn các nhãn có độ tin cậy thấp mà không kiểm tra lại ảnh bằng mắt.
    • Đặt ngưỡng quá cao rồi kết luận rằng ảnh không có gì đáng chú ý.

    Ghi chú kiến thức

    • Model kiểu DETR có thể dự đoán nhãn vật thể và vị trí khung bao trong một workflow khá gọn cho trình duyệt.
    • Điểm tin cậy giúp xếp hạng kết quả nhưng không đảm bảo rằng nhãn luôn đúng trong mọi ngữ cảnh.
    • Phát hiện vật thể và OCR giải quyết hai bài toán khác nhau, nên screenshot nhiều chữ thường vẫn cần cả hai hướng xử lý.

    Câu hỏi thường gặp

    Ảnh có bị gửi lên máy chủ ứng dụng không?

    Không. Ảnh được xử lý trong trình duyệt. Chỉ model có thể cần tải ở lần chạy đầu.

    Kết quả gồm những gì?

    Kết quả gồm nhãn vật thể, điểm tin cậy và khung bao để bạn kiểm tra vị trí mà model cho là có vật thể.

    Tool có thay OCR cho screenshot nhiều chữ không?

    Không. Đây là workflow phát hiện vật thể, không phải OCR chuyên dụng, nên ảnh nhiều chữ vẫn có thể cần OCR riêng.

    Có nên xem kết quả là đáp án cuối cùng không?

    Không nên. Hãy xem đây là lượt quét riêng tư đầu tiên, rồi rà lại ảnh bằng mắt trước khi gán nhãn hoặc ra quyết định QA.

    Khám phá thêm Công cụ AI Cục bộ

    Trình phát hiện vật thể trong trình duyệt thuộc nhóm Công cụ AI Cục bộ. Khám phá thêm công cụ online miễn phí để xử lý nhanh và chính xác.

    Xem tất cả Công cụ AI Cục bộ