Google DeepMind ได้เปิดตัวโมเดลใหม่ที่ชื่อว่า Gemini 2.0 Flash Thinking, ซึ่งถูกออกแบบมาเพื่อยกระดับความสามารถในการคิดเชิงเหตุผลของ AI โดยเฉพาะในด้านการตอบคำถามที่ซับซ้อน โมเดลนี้ไม่เพียงแต่ให้คำตอบที่ถูกต้อง แต่ยังแสดงกระบวนการคิดที่ละเอียดและสามารถอธิบายได้อย่างชัดเจน ทำให้ผู้ใช้งานสามารถเข้าใจได้ว่าการตัดสินใจนั้นเกิดขึ้นได้อย่างไร เป้าหมายหลักของโมเดลนี้คือการสามารถแข่งขันกับ o1 โมเดลจาก OpenAI ที่มีฟังก์ชันคล้ายกันในการใช้เหตุผล

Gemini 2.0 Flash Thinking ใช้พื้นฐานจาก Gemini 2.0 Flash, ซึ่งเป็นโมเดลที่มีความเร็วและประสิทธิภาพในการประมวลผลสูง โดยได้รับการฝึกฝนให้สามารถใช้เหตุผลในการแก้ปัญหาที่ซับซ้อนได้อย่างแม่นยำ ในตัวอย่างที่เผยแพร่โดยเจฟฟ์ ดีน (Jeff Dean) หัวหน้านักวิทยาศาสตร์ของ Google, Gemini 2.0 Flash Thinking ถูกใช้ในการแก้ปัญหาฟิสิกส์ที่เกี่ยวข้องกับโฟตอนและอิเล็กตรอน โดยแสดงกระบวนการคิดที่มีความละเอียดและสามารถแยกแยะออกเป็นขั้นตอนย่อย ๆ เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

ในขณะเดียวกัน, โลแกน คิลแพทริก (Logan Kilpatrick), หัวหน้าฝ่ายผลิตภัณฑ์ของ Google, ได้โพสต์ตัวอย่างของโมเดลนี้ในการแก้ปัญหาที่มีทั้งภาพและข้อความ โดยให้โจทย์บิลเลียดที่มีหมายเลข 4 ตัว และต้องหาคำตอบที่ได้ 30 โดยการใช้ 3 ตัวเลข ซึ่งโมเดลสามารถแก้ปัญหานี้ได้อย่างถูกต้อง และได้เปิดโอกาสให้ผู้ใช้งานทดลองโมเดลนี้ผ่าน AI Studio โดยเขายังเน้นว่าโมเดลนี้เพิ่งเริ่มต้นการพัฒนาและจะมีการปรับปรุงอย่างต่อเนื่อง

นอกจากนี้, Google ยังได้เปิดตัว Gemini 2.0 โมเดล AI ที่สามารถสร้างภาพและเสียงได้ ซึ่งเป็นการเปิดโอกาสให้ AI สามารถทำงานที่ซับซ้อนแทนมนุษย์ได้ ขณะเดียวกัน, OpenAI ก็เปิดตัว o1 โมเดลการใช้เหตุผลในเวอร์ชันเต็มสำหรับผู้ใช้ ChatGPT Pro, เพิ่มการแข่งขันในด้านการพัฒนา AI ที่สามารถใช้เหตุผลในระดับสูง