ข่าวไอที Blognone » Alibaba โอเพนซอร์สโมเดล AI ที่สามารถเรียนรู้ข้อมูลในภาพ รองรับภาษาอังกฤษและจีน

Alibaba โอเพนซอร์สโมเดล AI ที่สามารถเรียนรู้ข้อมูลในภาพ รองรับภาษาอังกฤษและจีน

25 สิงหาคม 2023
40   0

Alibaba Cloud เปิดตัวโมเดลภาษาภาพขนาดใหญ่ (Large Vision Language) แบบโอเพนซอร์ส ซึ่งมีความสามารถในการเข้าใจภาพและตัวหนังสือ

สองโมเดลได้แก่ Qwen-VL เป็นโมเดลภาษาภาพขนาดใหญ่ที่ถูกเทรนมาก่อน และ Qwen-VL-Chat โมเดลสำหรับการสนทนาโต้ตอบ ขนาด 7 พันล้านพารามิเตอร์ มีความสามารถทำความเข้าใจภาพในภาษาอังกฤษและภาษาจีน และสร้างบทสนทนาโต้ตอบ รวมถึงทำงานประมวลผล เช่น บวกเลขในภาพได้ ซึ่งสามารถนำมาช่วยทั้งการอ่านป้ายภาษาจีน สำหรับคนที่ไม่รู้ภาษาจีน หรือใช้ช่วยอ่านป้ายต่าง ๆ สำหรับผู้มีปัญหาการมองเห็น

ทั้ง Qwen-7B และ Qwen-7B-Chat เปิดให้ดาวน์โหลดใช้งานแล้วที่ ModelScope ซึ่งเป็นชุมชนนักพัฒนา AI ของ Alibaba Cloud และที่ Hugging Face

ที่มา: Alibaba

No Description

[source: https://www.blognone.com/node/135454]