ข่าวไอที Blognone » กูเกิลเปิดตัว Cloud Text-to-Speech บริการสร้างเสียงพูดเหมือนมนุษย์ ใช้เทคโนโลยีเดียวกับ Assistant

กูเกิลเปิดตัว Cloud Text-to-Speech บริการสร้างเสียงพูดเหมือนมนุษย์ ใช้เทคโนโลยีเดียวกับ Assistant

28 มีนาคม 2018
49   0

DeepMind นำเสนองานวิจัย WaveNet โมเดลปัญญาประดิษฐ์ deep learning สำหรับสร้างเสียงพูดและเสียงดนตรีมาตั้งแต่ปี 2016 และนำมาใช้กับ Google Assistant เมื่อปีที่แล้ว ตอนนี้มันก็กลายเป็นสินค้าบน Google Cloud Platform แล้ว แต่ยังไม่รองรับภาษาไทย

กูเกิลระบุว่ามีจำนวนเสียงให้เลือกกว่า 30 เสียงแล้วแต่ภาษา เช่น ภาษาอังกฤษแบบสหรัฐฯ มี 6 เสียง บริการรองรับภาษา SSML (Speech Synthesis Markup Language) สำหรับการกำหนดจังหวะหายใจ การเน้นเสียง หรือการปรับความเร็วในบางช่วง เพื่อความสมจริงยิ่งขึ้นด้วย

ค่าบริการต่อ 1 ล้านตัวอักษรสำหรับสำหรับระบบธรรมดาอยู่ที่ 4 ดอลลาร์ (ฟรี 4 ล้านอักษรแรก) และ WaveNet อยู่ที่ 16 ดอลลาร์ (ฟรี 1 ล้านตัวอักษรแรก)

ที่มา - Google Cloud Platform

[source: https://www.blognone.com/node/101032]