ข่าวไอที Blognone » กูเกิลปล่อย DeepLab-v3+ โมเดล deep learning แบ่งส่วนภาพความแม่นยำสูงระดับ 89%

กูเกิลปล่อย DeepLab-v3+ โมเดล deep learning แบ่งส่วนภาพความแม่นยำสูงระดับ 89%

12 มีนาคม 2018
60   0

ปัญหา deep learning อย่างหนึ่งที่มีการพัฒนามายาวนานคือการแบ่งส่วนภาพระดับพิกเซล หรือปัญหา segmentation ที่ทำให้เราสามารถแยกภาพคนหรือวัตถุออกจากพื้นหลังได้โดยไม่ต้องอาศัยมือกราฟิกมาทำไดคัต ในกูเกิลเองก็มีพัฒนาโมเดล deep learning ที่ชื่อว่า DeepLab มาตั้งแต่ปี 2015 และตอนนี้ก็ปล่อยเวอร์ชั่น v3+ ที่พัฒนาความแม่นยำค่า IoU (intersection over union) เฉลี่ยไปถึงระดับ 89% เมื่อทดสอบด้วยชุดข้อมูล PASCAL VOC 2012 นับว่าดีที่สุดในตอนนี้

DeepLab-v3+ พัฒนาความแม่นยำเพิ่มจาก DeepLab-v3 ที่ออกมาเมื่อปีที่แล้วอย่างมีนัยสำคัญ (v3 ทำค่า mIoU ได้ 86.9%) ด้วยการเพิ่มโมดูล decoder ที่ไม่ซับซ้อนนัก แต่กลับสามารถทำให้ความแม่นยำรวมเพิ่มขึ้นได้มาก

โค้ดอยู่ภายใต้โครงการ TensorFlow และโมเดลที่ฝึกจากชุดข้อมูล PASCAL VOC 2012 และ Cityscapes ก็มีให้ดาวน์โหลดด้วยเช่นกัน

ที่มา - Google Research

No Description

[source: https://www.blognone.com/node/100519]