ข่าวไอที Blognone » กูเกิลรายงานโครงการ Unison ตั้งเป้าสร้างระบบออกเสียงจากข้อความในภาษาที่มีข้อมูลน้อย

กูเกิลรายงานโครงการ Unison ตั้งเป้าสร้างระบบออกเสียงจากข้อความในภาษาที่มีข้อมูลน้อย

9 กันยายน 2015
1   0

กูเกิลรายงานถึงโครงการวิจัย Unison เป็นโครงการเพื่อการเก็บข้อมูลพัฒนาระบบออกเสียงจากข้อความ (text-to-speech - TTS) จากภาษาที่มีข้อมูลน้อย (low resource languages) โดยเลือกภาษาบังคลาเทศ และใช้อาสาสมัครที่เป็นพนักงานของกูเกิลเองมาช่วยพูดให้เสียง

ทางโครงการพัฒนาเครื่องมือที่ชื่อว่า ChitChat เป็นเว็บแอพที่บันทึกเสียงตามข้อความที่กำหนด สำรวจเสียง, รบกวนในห้อง, และเล่นไฟล์ที่บันทึกไปแล้ว อุปกรณ์ทั้งชุดมีราคาไม่ถึง 2,000 ดอลลาร์ ส่วนประโยคที่ต้องอ่าน ใช้เวลาบันทึกเสียงทั้งหมด 3 วัน บันทึกครั้งละ 250 ประโยค แต่ละครั้งใช้เวลา 30-60 นาที รวมทั้งหมด 2000 ข้อความ โดยเลือกข้อความจากการวิเคราะห์ฐานข้อมูล Wikipedia

ตอนนี้ทีมงานใช้โมเดลเสียงจากสถาบันเทคโนโลยีอินเดีย แต่โมเดลเสียงยังต่างจากเสียงที่ทีมงานใช้อยู่บ้าง อย่างไรก็ดี เสียงที่ออกมาจาก TTS ต้นแบบดีกว่าที่คาดไว้

ที่มา - Google Research

upic.me

Google, Text-to-Speech, Research

[source: https://www.blognone.com/node/72265]