ข่าวไอที Blognone » PyThaiNLP 3.0 ออกแล้ว

PyThaiNLP 3.0 ออกแล้ว

29 มกราคม 2022
24   0

วันนี้ 30 มกราคม พ.ศ.2565 ทางทีมพัฒนา PyThaiNLP ได้ปล่อยแพ็กเกจประมวลผลภาษาธรรมชาติ PyThaiNLP รุ่น 3.0 หลังจากที่ปล่อย PyThaiNLP 2.3 ไปเมื่อปีก่อน

PyThaiNLP 3.0 มีความเปลี่ยนแปลงสรุปได้ดังนี้

  • เพิ่มโมเดลแปลภาษาจีนกลาง - ภาษาไทย
  • ปรับปรุงพจานุกรมตัดคำหลักและตัวตัดคำ newmm
  • ปรับปรุงคลาสสำหรับเรียกเครื่องมือแปลภาษา
  • เพิ่มตัวแก้คำผิด
  • เพิ่มเครื่องมือสำหรับสร้างข้อความและ Text Augmentation ภาษาไทย
  • ปรับปรุง API จาก syllable_tokenize ให้เปลี่ยนไปใช้งาน subword_tokenize
  • ปรับปรุง API สำหรับ Word Vector
  • เพิ่ม TLTK เข้ามาเป็นตัวเลือก engine ในทั้งตัดคำ, วิเคราะห์ไวยากรณ์, แก้คำผิด และอื่น ๆ

ข้อมูลเปิดเผย: ผู้เขียนเป็นหนึ่งในทีมนักพัฒนา PyThaiNLP

No Description

ที่มา: PyThaiNLP v3.0.0 Released! - GitHub

[source: https://www.blognone.com/node/126926]