อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ให้กับวงการ Open-Source AI ด้วยความสามารถแบบ Hybrid Reasoning

ข่าวเทคโนโลยี Wednesday April 30, 2025 15:44 —ThaiPR.net

อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ให้กับวงการ Open-Source AI ด้วยความสามารถแบบ Hybrid Reasoning

อาลีบาบา สร้างมาตรฐานใหม่ให้กับนวัตกรรมด้าน AI เปิดตัว Qwen3 ซึ่งเป็นรุ่นล่าสุดของตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์สของบริษัทฯ

ซีรีส์ Qwen3 ประกอบด้วยหก dense model และสอง Mixture-of-Experts (MoE) model ซึ่งช่วยให้ผู้พัฒนาซอฟต์แวร์สร้างแอปพลิเคชันยุคใหม่สำหรับอุปกรณ์เคลื่อนที่ แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่น ๆ อีกมากมายได้อย่างยืดหยุ่นโมเดล Qwen3 ทั้งหมด ปัจจุบันเปิดเป็นโอเพ่นซอร์สทั่วโลก ซึ่งรวมถึง dense models (ขนาดพารามิเตอร์ 0.6B, 1.7B, 4B, 8B, 14B, และ 32B) และ MoE models (30B with 3B active, และ 235B with 22B active)

โมเดลการใช้เหตุผลแบบผสมผสาน (hybrid reasoning models) คือการผสานรวมโหมดการคิดเป็นขั้นเป็นตอน (thinking mode) และโหมดการใช้สัญชาตญาณ (non-thinking mode) ไว้ด้วยกัน

Qwen3 เป็น hybrid reasoning models แรกของอาลีบาบา เป็นการรวมความสามารถของ LLM แบบเดิม เข้ากับการใช้เหตุผลแบบไดนามิกที่ล้ำหน้า โมเดล Qwen3 สามารถสลับการใช้งานทั้งสองโหมดไปมา โดยใช้ thinking mode กับงานที่ซับซ้อนหลายขั้นตอน เช่น คณิตศาสตร์ การเขียนโค้ด การอนุมานเชิงตรรกะ และใช้ non-thinking mode เมื่อต้องการการตอบสนองที่รวดเร็วและตามวัตถุประสงค์อื่นทั่ว ๆ ไป

นักพัฒนาซอฟต์แวร์ที่เข้าใช้งาน Qwen3 ผ่าน API จะสามารถควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38K โทเค็น) ช่วยให้เกิดสมดุลระหว่างการดำเนินงานที่ชาญฉลาดและประสิทธิภาพในการประมวลผล โดยเฉพาะ Qwen3-235B-A22B MoE model ที่ช่วยลดต้นทุนการติดตั้งใช้งานได้อย่างมากเมื่อเทียบกับโมเดลระดับเดียวกันอื่น ๆ เป็นการย้ำให้เห็นความมุ่งมั่นของอาลีบาบาที่มุ่งสร้าง AI สมรรถนะสูงที่ให้ทุกคนเข้าใช้งานได้

ความก้าวหน้าครั้งสำคัญด้านทักษะหลายภาษา, ความสามารถของเอเจนต์, การใช้เหตุผล และความสอดคล้องทางความคิดและพฤติกรรมของมนุษย์

Qwen3 ได้รับการเทรนจากชุดข้อมูลขนาดใหญ่จำนวน 36 ล้านล้านโทเค็น ซึ่งมากกว่า Qwen2.5 ซึ่งเป็นรุ่นก่อนหน้าถึงสองเท่า จึงมีประสิทธิภาพล้ำหน้าอย่างมากทั้งด้านการใช้เหตุผล การทำตามคำสั่ง การใช้เครื่องมือและงานที่เป็นภาษาต่าง ๆ หลายภาษา

ความสามารถสำคัญ ๆ ได้แก่

  • เชี่ยวชาญหลายภาษา: รองรับ 119 ภาษาหลักและภาษาถิ่น มีความสามารถในการแปลและปฏิบัติตามคำสั่งได้หลายภาษาด้วยประสิทธิภาพสูง
  • สามารถผสานรวมเอเจนต์ประสิทธิภาพสูง: รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชันหรือการเรียกใช้เครื่องมือที่ทรงประสิทธิภาพ นับเป็นโมเดลโอเพ่นซอร์สระดับแนวหน้าเพื่องานที่ต้องใช้เอเจนต์ที่ซับซ้อน
  • มีการใช้เหตุผลที่เหนือกว่า: เหนือกว่าโมเดล Qwen รุ่นก่อนหน้านี้ (QwQ ใช้ thinking mode และ Qwen2.5 ใช้ non-thinking mode) ในด้านการวัดประสิทธิภาพทางคณิตศาสตร์ การเขียนโค้ด และการใช้เหตุผลเชิงตรรกะ
  • สอดคล้องกับความคิดและพฤติกรรมของมนุษย์มากขึ้น: สามารถมอบการเขียนเชิงสร้างสรรค์ การแสดงบทบาทสมมติ และการสนทนาโต้ตอบไปมา เพื่อทำให้การสนทนาเป็นธรรมชาติและน่าสนใจมากขึ้น

ความก้าวหน้าทางสถาปัตยกรรมของโมเดล ปริมาณข้อมูลการเทรนที่เพิ่มขึ้น และวิธีการเทรนที่มีประสิทธิภาพมากขึ้น ช่วยให้ Qwen3 สามารถทำผลงานได้อย่างโดดเด่นในการทดสอบระดับมาตรฐานอุตสาหกรรมต่าง ๆ เช่น AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความสามารถในการเขียนโค้ด), BFCL (ความสามารถในการใช้เครื่องมือและการเรียกใช้ฟังก์ชัน) และ Arena-Hard (เกณฑ์มาตรฐานสำหรับ LLM ที่สามารถปรับแต่งเพื่อให้เข้าใจและทำตามคำสั่งเฉพาะได้)

นอกจากนี้ ได้มีการนำกระบวนการเทรนสี่ขั้นตอนมาใช้เพื่อพัฒนา hybrid reasoning model ประกอบด้วย การเริ่มต้นการเทรนให้มีความสามารถในการใช้เหตุผลแบบเป็นขั้นตอน โดยใช้ห่วงโซ่การคิดที่เป็นลำดับในปริมาณจำกัดตั้งแต่ระยะแรกของการเทรน (long chain-of-thought cold start), การเรียนรู้แบบเสริมแรงโดยใช้เหตุผล (reasoning-based reinforcement learning: RL), การผสานผสาน thinking mode (thinking mode fusion) และ การเรียนรู้แบบเสริมแรงทั่วไป (general RL)

เปิดให้เข้าถึงเพื่อขับเคลื่อนนวัตกรรม

โมเดล Qwen3 พร้อมให้ดาวน์โหลดฟรีแล้วบน Hugging Face, Github, ModelScope และสามารถทดลองใช้ได้ที่ chat.qwen.ai สำหรับการเข้าใช้ผ่าน API บน Model Studio ซึ่งเป็นแพลตฟอร์มสำหรับการพัฒนาโมเดล AI ของอาลีบาบาจะเปิดให้เข้าใช้ได้เร็ว ๆ นี้ นอกจากนี้ Qwen3 ยังเป็นโมเดลที่ขับเคลื่อน Quark ซึ่งเป็นแอปพลิเคชันผู้ช่วยอัจฉริยะ AI สำคัญของอาลีบาบาอีกด้วย

นับแต่เปิดตัว โมเดลในตระกูล Qwen มียอดดาวน์โหลดแล้วมากกว่า 300 ล้านครั้งทั่วโลก นักพัฒนาซอฟต์แวร์ได้สร้างโมเดลต่อยอดจาก Qwen มากกว่า 100,000 โมเดลบน Hugging Face ทำให้ Qwen กลายเป็นหนึ่งใน ซีรีส์โมเดล open-source AI ที่มีการนำไปใช้อย่างแพร่หลายที่สุดในโลก


เว็บไซต์นี้มีการใช้งานคุกกี้ ศึกษารายละเอียดเพิ่มเติมได้ที่ นโยบายความเป็นส่วนตัว และ ข้อตกลงการใช้บริการ รับทราบ