อย่าพลาด Qwen 2.5 VL!

尽管มีการโปรโมต Deepseek อย่างมาก Qwen ก็เพิ่งเปิดตัวโมเดล Multimodal ที่ดีที่สุดแบบเปิดแล้ว!

อย่าพลาด Qwen 2.5 VL! แม้จะมีการโปรโมต Deepseek อย่างมาก แต่ Qwen ก็เพิ่งเปิดตัวโมเดล Multimodal ที่ดีที่สุด! Qwen 2.5 VL เป็น Vision Language Model ที่สามารถควบคุมคอมพิวเตอร์ของคุณได้ เหมือนกับ OpenAI operator นอกจากนี้ยังสามารถดึงข้อมูลที่มีโครงสร้างจากแผนภูมิ และอื่นๆ อีกมากมาย!

TL;DR; 3️⃣ มี 3 ขนาด: 3B, 7B, และ 72B พารามิเตอร์ 🧬 ใช้ Qwen 2.5 เป็นโครงสร้างพื้นฐานข้อความ 🎯 มีความสามารถของเอเย่นต์สำหรับการใช้คอมพิวเตอร์และโทรศัพท์โดยตรง 🧠 มีการปรับปรุงความเข้าใจภาพของข้อความ แผนภูมิ ไอคอน กราฟิก และเลย์เอาต์ 🎥 มีการสนับสนุนวิดีโอนานถึง 1 ชั่วโมงขึ้นไป 📊 มีการแสดงผลที่มีโครงสร้างสำหรับเอกสารทางการเงิน/เชิงพาณิชย์ 💡 เป็น Sota ในหลายๆ บンチมาร์ก DocVQA, TextVQA, ScreenSpot, Android Control 📦 มีใบอนุญาต Apache 2.0 (ยกเว้น 72B) และมีให้ใช้งานบน Hugging Face

โปรดทราบว่าเวอร์ชันภาษาไทยได้รับการช่วยเหลือจาก AI ดังนั้นอาจมีข้อผิดพลาดเล็กน้อย

ผู้เขียน

Ai Base Network (ABN), ABN ASIA ถูกก่อตั้งขึ้นโดยคนที่มีรากฐานลึกในวงการวิชาการ มีประสบการณ์การทำงานในสหรัฐอเมริกา ดัตช์ ฮังการี ญี่ปุ่น เกาหลีใต้ สิงคโปร์ และเวียดนาม ABN Asia เป็นที่เราพบกันของวิทยาลัยและเทคโนโลยี ด้วยโซลูชันขั้นสูงและบริการพัฒนาซอฟต์แวร์ที่มีความสามารถ เราช่วยธุรกิจเติบโตและเข้าสู่ฉากโลก ความมุ่งมั่นของเรา: ด่วนขึ้น ดีขึ้น น่าเชื่อถือมากขึ้น ในกรณีส่วนมาก: ราคาถูกด้วย

หากคุณต้องการบริการ IT การให้คำปรึกษาดิจิทัล โซลูชันซอฟต์แวร์ใช้ได้หรือหากคุณต้องการส่งคำขอข้อเสนอ (RFPs) อย่าลังเลที่จะติดต่อเรา คุณสามารถติดต่อเราได้ที่ [email protected] เราพร้อมช่วยเหลือคุณด้านทุกความต้องกรทางเทคโนโลยีของคุณทุกเมื่อ