ไมโครซอฟต์เปิดตัวโมเดล DeepSeek R1 บน PC รุ่น Copilot+ พร้อมรองรับ Azure AI Foundry
วันที่โพสต์: 31 มกราคม 2568 11:02:59 การดู 1 ครั้ง ผู้โพสต์ admin
DeepSeek ที่ประสบความสำเร็จในวงการ AI บนมือถือ ได้ขยายตัวเข้าสู่ระบบปฏิบัติการ Windows พร้อมกับการสนับสนุนจากไมโครซอฟต์ โดยไมโครซอฟต์ได้แนะนำโมเดล DeepSeek R1 ให้กับ Azure AI Foundry เพื่อให้นักพัฒนาสามารถใช้ในการพัฒนาแอปพลิเคชันและบริการที่ใช้คลาวด์ได้ นอกจากนี้ ไมโครซอฟต์ยังประกาศว่าจะนำโมเดล DeepSeek R1 ที่ถูก "กลั่น" (distilled) มาให้ใช้งานบน PC รุ่น Copilot+ ด้วย
โมเดลที่ถูกกลั่นในเวอร์ชันแรกจะสามารถใช้ได้กับอุปกรณ์ที่มีชิป Snapdragon X, โปรเซสเซอร์ Intel Core Ultra 200V และ PC ที่ใช้ AMD Ryzen AI 9 โดยโมเดลแรกที่มีชื่อว่า DeepSeek-R1-Distill-Qwen-1.5B ซึ่งมีพารามิเตอร์ 1.5 พันล้านตัว และจะมีรุ่นที่ใหญ่กว่า เช่น 7B และ 14B ตามมาในเร็วๆ นี้ โมเดลเหล่านี้สามารถดาวน์โหลดได้จาก AI Toolkit ของไมโครซอฟต์
การปรับแต่งสำหรับอุปกรณ์ผู้ใช้
ไมโครซอฟต์ได้ปรับแต่งโมเดลเหล่านี้ให้สามารถใช้งานได้กับอุปกรณ์ที่มี NPUs (Neural Processing Units) โดยงานที่ต้องการการเข้าถึงหน่วยความจำมากๆ จะทำงานบน CPU ขณะที่งานที่ใช้การคำนวณหนักๆ เช่น transformer block จะถูกประมวลผลด้วย NPU ด้วยการปรับแต่งนี้ ไมโครซอฟต์สามารถทำให้เวลาเริ่มต้นการประมวลผล (time to first token) อยู่ที่ 130 มิลลิวินาที และอัตราผลลัพธ์ 16 โทเค็นต่อวินาทีสำหรับข้อความสั้นๆ (ไม่เกิน 64 โทเค็น)
โมเดลแรกที่ถูกกลั่นคือ DeepSeek-R1-Distill-Qwen-1.5B จะมีพารามิเตอร์ 1.5 พันล้านตัว และจะมีรุ่นที่มีพารามิเตอร์มากขึ้น เช่น 7B และ 14B ตามมาในเร็วๆ นี้
ไมโครซอฟต์สนับสนุน AI หลายค่าย
ไมโครซอฟต์เป็นผู้สนับสนุนและลงทุนใน OpenAI ผู้พัฒนา GPT-4 และ ChatGPT มาโดยตลอด แต่ดูเหมือนว่าบริษัทจะไม่เลือกข้าง โดยให้การสนับสนุนโมเดล AI จากหลายค่ายในแพลตฟอร์ม Azure ของตน รวมถึงโมเดลจาก OpenAI, Llama ของ Meta, Mistral และตอนนี้ก็รวมถึง DeepSeek ด้วย ซึ่งสะท้อนให้เห็นถึงความมุ่งมั่นของไมโครซอฟต์ในการสนับสนุนการพัฒนา AI จากหลายค่ายโดยไม่เลือกข้าง
การเข้าถึงโมเดลกลั่น
สำหรับผู้ที่ต้องการใช้งาน AI บนเครื่องคอมพิวเตอร์ส่วนตัว ไมโครซอฟต์แนะนำให้ดาวน์โหลด AI Toolkit สำหรับ VS Code ก่อน จากนั้นสามารถดาวน์โหลดโมเดล DeepSeek-R1-Distill-Qwen-1.5B และทดสอบประสิทธิภาพของมันได้ใน VS Code สุดท้ายสามารถคลิก "Try in Playground" เพื่อทดสอบความสามารถของโมเดลนี้
การกลั่นโมเดล (หรือที่เรียกว่า knowledge distillation) คือการนำความรู้จากโมเดลขนาดใหญ่ (เช่น DeepSeek R1 ที่มีพารามิเตอร์ 671 พันล้านตัว) และถ่ายโอนความรู้เหล่านั้นไปยังโมเดลที่เล็กลง (เช่น 1.5 พันล้านพารามิเตอร์) แม้ว่ากระบวนการนี้จะไม่ได้ผลลัพธ์ที่สมบูรณ์แบบ แต่โมเดลที่ถูกกลั่นจะมีขนาดที่เล็กลงและสามารถทำงานได้บนฮาร์ดแวร์ทั่วไป ซึ่งต่างจากฮาร์ดแวร์ที่ต้องใช้งบประมาณสูงหลายหมื่นดอลลาร์
AI สำหรับทุกคน
การขยายตัวของ DeepSeek R1 บน PC และการปรับแต่งเพื่อใช้งานกับอุปกรณ์ผู้ใช้ทั่วไปทำให้ AI สามารถเข้าถึงได้ง่ายขึ้นสำหรับผู้ใช้ทั่วไป นักพัฒนา และธุรกิจต่างๆ โดยไมโครซอฟต์มุ่งมั่นที่จะสร้างประสบการณ์ AI ที่มีประสิทธิภาพและสามารถใช้งานได้ในวงกว้างมากขึ้น
แท็ก: Microsoft DeepSeek R1 Azure AI Foundry