ข่าวไอที Blognone » กูเกิลโอเพนซอร์สโมเดลปัญญาประดิษฐ์ค้นหาภาพความแม่นยำสูง

กูเกิลโอเพนซอร์สโมเดลปัญญาประดิษฐ์ค้นหาภาพความแม่นยำสูง

27 กันยายน 2020
107   0

กูเกิลนำเสนอโมเดลปัญญาประดิษฐ์ใหม่ DELG (DEep Local and Global Features) สำหรับแก้ปัญหาค้นหาภาพด้วยภาพ (Instance-Level Recognition - ILR) เช่นการค้นหาแบบ Google Images ที่ผู้ใช้สามารถใส่ภาพสถานที่ท่องเที่ยวเข้าไปแล้วบริการค้นหาจะคืนภาพสถานที่เดียวกันออกมาให้

จุดเด่นของ DELG คือการใช้โมเดลเดียวตลอดการทำงาน โดยตัวโมเดลใช้ ResNet เป็นฐาน จากนั้นแยกส่วน global feature สำหรับค้นหาภาพที่ใกล้เคียงจากฐานข้อมูล และ local feature เพื่อเทียบความคล้ายแล้วเรียงลำดับผลการค้นหา

ทีมงานทดสอบ DELG กับชุดข้อมูล Google Landmarks Dataset v2 (GLDv2) ที่เป็นภาพสถานที่ 5 ล้านภาพจากสถานที่ 200,000 แห่ง ได้ความแม่นยำถึง 61.2% แม้จะไม่ดีที่สุดเมื่อเทียบกับการแข่งขันจดจำสถานที่เมื่อปี 2019 แต่โมเดลจากการแข่งขันนั้นซับซ้อนหลายขั้นตอน ส่วนโมเดลของกูเกิลนั้นฝึกได้รวดเดียวจากภาพอินพุตไปจนถึงผลลัพธ์ (end-to-end)

กูเกิลใส่ซอร์สโค้ดของ DELG ไว้ในโครงการ Tensorflow แล้ว และค่าพามิเตอร์ที่เทรนโมเดลมาได้ก็แจกไว้พร้อมกัน

ที่มา - Google AI Blog

No Description

โมเดล DELG ที่ใช้ส่วนเริ่มต้นของโมเดลร่วมกันระหว่าง global feature และ local feature ลดระยะเวลาเทรนโมเดลโดยรวม

[source: https://www.blognone.com/node/118668]