ข่าวไอที Blognone » โค้งสุดท้าย! ร่วมตรวจสอบเสียงใน Common Voice เพื่อช่วยพัฒนา AI รู้จำเสียงภาษาไทย

โค้งสุดท้าย! ร่วมตรวจสอบเสียงใน Common Voice เพื่อช่วยพัฒนา AI รู้จำเสียงภาษาไทย

5 กันยายน 2022
4   0

Common Voice เป็นโครงการที่ Mozilla ซึ่งเป็นองค์กรไม่แสวงหาผลกำไร ได้สร้างขึ้นเพื่อแก้ปัญหาการขาดแคลนชุดข้อมูลเสียงที่เป็นสาธารณสมบัติ (ไม่มีลิขสิทธิ์) ที่ทุกคน ทุกหน่วยงาน สามารถมีส่วนร่วมและใช้เพื่อสอนระบบ AI ต่าง ๆ เช่นระบบพิมพ์ด้วยเสียงได้

ปัจจุบันในภาษาไทยมีจำนวนเสียงที่บันทึกแล้ว 393 ชั่วโมง แต่ตรวจสอบไปเพียง 154 ชั่วโมง (ไม่ถึงครึ่งของจำนวนเสียงที่บันทึกไว้ทั้งหมด) ในขณะที่ชุดข้อมูลรอบถัดไปจะตัดรอบในวันที่ 7 กันยายน 2565 นี้ เราจึงต้องการให้ทุกคนเข้ามาร่วมตรวจสอบเสียงง่าย ๆ โดยไม่ต้องโหลดแอปใด ๆ ตามขั้นตอนด้านล่างนี้

  1. กดที่นี่ เพื่อเข้าสู่หน้าตรวจสอบเสียง
  2. ประโยคจะปรากฏบนหน้าจอ กดปุ่มเล่น (สามเหลี่ยม) 1 ครั้งเพื่อเล่นคลิปเสียง
  3. ประโยคจะต้องไม่มีการสะกดผิด ตัวอักษรภาษาอื่นที่ไม่ใช่ภาษาไทย หรือตัวเลข ส่วนคลิปเสียงต้องพูดให้ถูกต้องทุกคำ ไม่ขาด ไม่เกิน ไม่มีพูดผิดแล้วพูดใหม่ (ไม่จำเป็นต้องชัดเจน ขอแค่ฟังรู้เรื่องและมีเสียงรบกวนน้อย)
  4. หากถูกต้องให้กด "ใช่" แต่ถ้าไม่ถูกต้อง เสียงเบาเกินไป หรือกระตุก ให้กด "ไม่" (หากพบปัญหาในประโยคหรือคลิปเสียง ควรกด "รายงาน" เพื่อรายงานปัญหา)

นอกจากนี้ยังมีส่วนอื่น ๆ ที่ต้องการความช่วยเหลือ โดยเฉพาะการตรวจสอบประโยคใหม่สำหรับการบันทึกเสียง สามารถดูเพิ่มเติมได้ในบทความนี้ (หมายเหตุ: ควรชะลอการบันทึกเสียงและเพิ่มประโยคใหม่ไปก่อน จนกว่าจะตรวจสอบคลิปเสียงและประโยคที่มีอยู่เดิมได้มากพอ)

ขอให้สนุกกับการมีส่วนร่วมครับ!

ที่มา: Common Voice, ข้อมูลวันที่ตัดรอบชุดข้อมูลจากห้องแชท Matrix ของ Common Voice

โลโก้ Common Voice

[source: https://www.blognone.com/node/130220]