ข่าวไอที Blognone » พลังแห่ง AutoML นักวิทยาศาสตร์ข้อมูลสร้างโมเดลแยก “สาขา” จากภาพชามราเมน ความแม่นยำ 94.5%

พลังแห่ง AutoML นักวิทยาศาสตร์ข้อมูลสร้างโมเดลแยก “สาขา” จากภาพชามราเมน ความแม่นยำ 94.5%

2 เมษายน 2018
21   0

กูเกิลเปิดตัว AutoML มาตั้งแต่งาน Google I/O ปีที่แล้ว และเปิดเป็นบริการ Cloud AutoML ในภายหลัง โดยที่ยังไม่มีใครรู้ถึงศักยภาพของมันนัก แต่ล่าสุดกูเกิลก็ยกตัวอย่างงานของ Kenji Doi นักวิทยาศาสตร์ข้อมูลจากบริษัท NTT ที่สร้างโมเดล deep learning สำหรับแยก "สาขา" ของร้าน Jiro Ramen ในญี่ปุ่นที่มีถึง 41 สาขาทั่วประเทศ

เขาดูดภาพจาก Twitter และ Instagram สร้างชุดข้อมูลชุดแรก 33,130 ภาพ โดย ไม่มีข้อมูลว่าเขาสร้างชุดข้อมูลที่เหลืออย่างไร

Kenji รวบรวมภาพชามราเมนจากสาขาต่างๆ ได้ถึง 48,000 ภาพ และเมื่ออัพโหลดภาพเข้าไปยัง AutoML และใช้เวลาฝึกโมเดลอีก 24 ชั่วโมง ก็ได้โมเดลที่ได้ความแม่นยำถึง 94.5%

อย่างไรก็ดี โมเดลที่ได้จาก AutoML ไม่ใช่โมเดลที่แม่นยำที่สุด เพราะ Kenji เคยสร้างโมเดลจาก ResNet-152 ได้ความแม่นยำ 96% และ ResNeXt-101 ได้ความแม่นยำ 97% มาก่อนแล้ว แต่เขาระบุกับกูเกิลว่า AutoML ช่วยให้องค์กรไม่ต้องเสียเวลาไปกับการปรับแต่งโมเดลมากนัก และองค์กรที่มีทรัพยากรบุคคลจำกัดก็ยังสร้างโมเดลที่ดีได้ โดยโมเดลแรกที่ Kenji สร้างขึ้นมาจาก ResNet-50 ก็มีความแม่นยำเพียง 83% เท่านั้น

ตัว Kenji เป็นวิศวกรของบริษัท NTT ที่สร้างโมเดล deep learning สำหรับการหาความเสียหายบนพื้นถนนมาตั้งแต่ปี 2016 และโมเดล deep learning ที่เขาสร้างมาได้ก็สาธิตการทำงานด้วย บอตทวิตเตอร์ @jirou_deep ที่จะตอบทวีตที่ไปถามว่าราเมนชามนี้เป็นสาขาใด

ความประหลาดของ deep learning คือ Kenji เองก็ไม่ทราบว่าโมเดลแม่นยำได้ขนาดนี้ เพราะมันดูจากอะไร ตอนแรกเขาคิดว่าโมเดลอาจจะดูจากสภาพแวดล้อมนอกชาม เช่นโต๊ะหรือภาพด้านหลัง แต่ทุกสาขาก็ใช้ชามและโต๊ะที่เหมือนกัน ความเป็นไปได้อีกอย่างคือมันอาจจะหารูปแบบการตัดเนื้อและจัดชามของแต่ละสาขาก็เป็นได้

ที่มา - Google Blog

No Description

[source: https://www.blognone.com/node/101191]