กลับไปยังเครื่องมือทั้งหมด
    เครื่องมือ AI แบบ Local

    Browser-Based Object Detector

    รายงานปัญหา

    ตรวจจับวัตถุในภาพแบบ local ในเบราว์เซอร์ด้วย workflow DETR แบบ private

    ภาพต้นฉบับ

    ตรวจจับวัตถุในภาพแบบ local ในเบราว์เซอร์ด้วย workflow DETR แบบ private

    คลิกเพื่ออัปโหลดภาพสำหรับการตรวจจับวัตถุแบบ local

    ภาพถ่าย screenshot และภาพสินค้า สามารถสแกนหา object ทั่วไปได้ในเบราว์เซอร์แบบ local

    การตั้งค่าการตรวจจับ

    เลือก backend สำหรับการประมวลผลและค่า confidence ขั้นต่ำของรายการวัตถุ

    การวิเคราะห์วัตถุในหน่วยความจำเบราว์เซอร์

    ภาพจะถูกถอดรหัสและสแกนหาวัตถุในหน่วยความจำของเบราว์เซอร์ ภาพขนาดใหญ่ยังขึ้นกับ RAM ของอุปกรณ์และ backend ที่เลือก

    อัปโหลดภาพเพื่อเริ่มการตรวจจับวัตถุแบบ private ในเครื่อง0%

    ผลการตรวจจับ

    ตรวจสอบรายการวัตถุแบบ local และกรอบตำแหน่งก่อนคัดลอกหรือส่งออก

    ผลการตรวจจับวัตถุด้วย AI แบบ local จะปรากฏที่นี่หลังประมวลผลเสร็จ

    สถิติการรัน

    รายละเอียดอย่างย่อของการตรวจจับแบบ local, threshold, โมเดล, ขนาดภาพ และสถานะ offline

    Offline runtimeScoped service worker
    สถานะออฟไลน์Service worker ใช้งานไม่ได้
    จำนวนวัตถุ0
    Label สูงสุด-
    Confidence threshold-
    โมเดลXenova/detr-resnet-50
    ขนาดภาพ-
    ประมวลผลในเบราว์เซอร์
    ผลลัพธ์ทันที
    ไม่จัดเก็บข้อมูล

    Browser-Based Object Detector คืออะไร?

    Browser-Based Object Detector ช่วยให้คุณสแกนวัตถุในภาพได้ในเบราว์เซอร์ แทนการส่งไฟล์ไปยัง vision API ภายนอก เหมาะกับ screenshot ภายใน รูปสินค้า ภาพประกอบ หรือภาพสำหรับ QA เมื่อคุณต้องการดูอย่างรวดเร็วว่าโมเดลมองเห็นอะไรบ้างโดยยังเก็บไฟล์ต้นฉบับไว้บนอุปกรณ์.

    workflow ปัจจุบันใช้ Transformers.js และโมเดลตระกูล DETR รอบแรกอาจต้องดาวน์โหลดและ cache โมเดลก่อน แต่ถ้า cache ยังอยู่ รอบถัดไปจะลื่นขึ้นมาก.

    workflow ตรวจจับวัตถุมักต้องอัปโหลดภาพไปยัง cloud ก่อน

    เครื่องมือรู้จำภาพหลายตัวต้องให้คุณส่งภาพไปยัง API ระยะไกลก่อน จึงจะคืน label และกรอบตำแหน่งกลับมาได้.

    แนวทางนี้ไม่เหมาะกับ screenshot ภายใน ภาพที่อ่อนไหว หรือ asset ที่ยังไม่เผยแพร่.

    ในหลายกรณี คุณแค่ต้องการสแกนเร็ว ๆ ว่าโมเดลเห็นวัตถุอะไรบ้างและมั่นใจแค่ไหน ไม่ได้ต้องการแพลตฟอร์ม computer vision แบบเต็ม.

    ใช้ DETR แบบ local เพื่อสแกนวัตถุในเบราว์เซอร์

    เครื่องมือนี้รันการตรวจจับวัตถุในเบราว์เซอร์และคืน label คะแนนความมั่นใจ และกรอบตำแหน่ง โดยไม่ต้องอัปโหลดภาพไปยัง app server.

    คุณสามารถสลับ WebGPU กับ WASM และปรับ threshold เพื่อให้ผลลัพธ์กว้างขึ้นหรือเข้มงวดขึ้นได้ตามงาน.

    โมเดลจะถูก cache ในเบราว์เซอร์ ทำให้หลังจากดาวน์โหลดครั้งแรกแล้ว การรันครั้งถัดไปเร็วขึ้นและเป็นมิตรกับออฟไลน์มากขึ้น.

    วิธีใช้งาน Browser-Based Object Detector

    1. 1อัปโหลดภาพ - เลือก screenshot รูปสินค้า หรือไฟล์ภาพอื่นจากอุปกรณ์.
    2. 2เลือก backend - ใช้ auto หรือเลือก WebGPU / WASM เองตามความเร็วและความเข้ากันได้ที่ต้องการ.
    3. 3ตั้งค่า threshold - กำหนดว่าผลลัพธ์ต้องมีความมั่นใจมากแค่ไหนจึงจะแสดงอยู่ในรายการ.
    4. 4รันการตรวจจับแบบ local - ให้เครื่องมือโหลดโมเดล สแกนภาพในเบราว์เซอร์ และคืน label พร้อมกรอบตำแหน่ง.
    5. 5ตรวจผลลัพธ์ - ดู overlay ของกรอบ แล้วคัดลอกผลหรือดาวน์โหลด JSON ไปใช้ต่อ.

    คุณสมบัติเด่น

    • ตรวจจับวัตถุแบบ local ด้วย DETR ในเบราว์เซอร์
    • มีกรอบตำแหน่งและรายการวัตถุ
    • ปรับ confidence threshold ได้
    • สลับ backend WebGPU / WASM ได้
    • ไม่อัปโหลดภาพต้นฉบับไปยัง app server

    ประโยชน์

    • สแกนภาพโดยไม่ต้องส่งไปยัง vision API แบบ hosted
    • ตรวจ label และคะแนนความมั่นใจก่อนใช้งานต่อ
    • เก็บ screenshot และภาพภายในไว้บนอุปกรณ์
    • ใช้โมเดลที่ cache แล้วซ้ำได้ในรอบถัดไป

    กรณีการใช้งาน

    QA ภาพภายใน

    ตรวจดูว่าโมเดลรู้จำอะไรในภาพ โดยไม่ต้องส่งภาพไปยัง API แบบ hosted.

    เตรียม annotation แบบ manual

    ใช้ label และตำแหน่งกรอบเป็นชั้นช่วยเริ่มต้นก่อนการตรวจด้วยคน.

    ช่วยงาน content operations

    สแกนภาพเพื่อดูหมวดวัตถุหลักก่อนทำ metadata หรือเอกสารประกอบ.

    workflow ที่เป็นมิตรกับออฟไลน์

    ใช้โมเดลที่ cache แล้วสำหรับการตรวจจับวัตถุครั้งต่อไปในเบราว์เซอร์เดิม.

    เคล็ดลับและข้อผิดพลาดที่พบบ่อย

    เคล็ดลับ

    • ใช้ภาพที่ชัดและมีวัตถุที่มองเห็นได้ง่ายเพื่อให้ผลตรวจจับแรกเริ่มเสถียรมากขึ้น.
    • ลด threshold เมื่อต้องการดูผลที่ก้ำกึ่ง และเพิ่ม threshold เมื่อต้องการเฉพาะผลที่มั่นใจมากกว่า.
    • ถ้า WebGPU ไม่เสถียร ให้ลองสลับไป WASM.

    ข้อผิดพลาดที่พบบ่อย

    • คิดว่า detector จะรู้จำวัตถุเฉพาะทาง โลโก้ หรือข้อความในภาพได้ถูกเสมอ.
    • เชื่อผลที่คะแนนต่ำโดยไม่ตรวจภาพด้วยตาอีกครั้ง.
    • ตั้ง threshold สูงเกินไปแล้วสรุปว่าภาพไม่มีอะไรสำคัญ.

    บันทึกความรู้

    • โมเดลตระกูล DETR สามารถทำนายทั้งชนิดของวัตถุและตำแหน่งกรอบได้ใน workflow ที่ค่อนข้างกะทัดรัดสำหรับเบราว์เซอร์.
    • คะแนนความมั่นใจช่วยจัดลำดับผลลัพธ์ แต่ไม่ได้รับประกันว่าป้ายกำกับจะถูกต้องเสมอในทุกบริบท.
    • การตรวจจับวัตถุกับ OCR แก้คนละปัญหา ดังนั้นภาพที่มีข้อความสำคัญมักต้องใช้ทั้งสอง workflow ร่วมกัน.

    คำถามที่พบบ่อย

    ภาพถูกส่งไปยัง app server ไหม?

    ไม่ ภาพจะถูกตรวจจับภายในเบราว์เซอร์ มีเพียงไฟล์โมเดลที่อาจต้องดาวน์โหลดในครั้งแรก

    ผลลัพธ์มีอะไรบ้าง?

    ผลลัพธ์มี label ของวัตถุ คะแนนความมั่นใจ และกรอบตำแหน่งเพื่อช่วยให้คุณดูว่าระบบมองวัตถุอยู่ตรงไหน

    ใช้แทน OCR สำหรับ screenshot ได้ไหม?

    ไม่ได้ นี่คือ workflow สำหรับตรวจจับวัตถุ ไม่ใช่ OCR โดยเฉพาะ ดังนั้นภาพที่มีข้อความสำคัญยังควรใช้ OCR เพิ่มเติม

    ควรใช้ผลลัพธ์เป็นคำตอบสุดท้ายเลยไหม?

    ไม่ควร ควรใช้เป็นการสแกนแบบ private รอบแรก แล้วตรวจภาพจริงด้วยคนอีกครั้งก่อนตัดสินใจ

    สำรวจเพิ่มเติม เครื่องมือ AI แบบ Local

    Browser-Based Object Detector อยู่ในหมวด เครื่องมือ AI แบบ Local ลองสำรวจเครื่องมือออนไลน์ฟรีอื่นๆ ได้เลย.

    ดูทั้งหมด เครื่องมือ AI แบบ Local