นอกจาก Gemini 3.5 Flash แล้ว ในงาน Google I/O 2026 ยังเปิดตัว “Gemini Omni” โมเดล AI ใหม่ ที่ชูจุดเด่นเรื่องการคิดวิเคราะห์ และการสร้างสรรค์ เข้าด้วยกันอย่างไร้รอยต่อ โดยเริ่มต้นเน้นไปที่การสร้างและตัดต่อวิดีโออย่างจริงจังครับ!
Gemini Omni สร้างสรรค์วิดีโอผ่าน AI ได้หลากหลายกว่าเดิม โมเดล AI สร้างวิดีโอทั่วไปมักจะรับได้เพียงคำสั่งข้อความ (Prompt) เท่านั้น แต่ Gemini Omni ถูกออกแบบมาให้เป็น Multimodal สามารถผสมผสานอินพุตที่หลากหลาย ไม่ว่าจะเป็นข้อความ, รูปภาพ, เสียง หรือแม้กระทั่งคลิปวิดีโอต้นแบบ เข้าพร้อม ๆ กัน เพื่อแปลงออกมาเป็นวิดีโอคุณภาพสูงชิ้นใหม่ที่ตรงใจผู้ใช้มากที่สุด
ยกตัวอย่างเช่น สามารถอัปโหลดภาพตัวละคร ส่งคลิปสไตล์ภาพที่ชอบ และพิมพ์สั่งเนื้อเรื่องเข้าไป Omni ก็จะผสมผสานทุกอย่างออกมาเป็นวิดีโอตัวใหม่ได้อย่างสมบูรณ์
รวมถึงรูปแบบในการตัดต่อ Gemini Omni ยังให้เราแก้ไขสิ่งต่าง ๆ ได้ผ่านการพิมพ์หรือคุยกับ AI ได้โดยตรงเช่น “เปลี่ยนฉากหลังให้อยู่ในอวกาศหน่อย” “เพิ่มเอฟเฟกต์ให้กระจกกลายเป็นของเหลวตอนเอามือจับ” หรือ “เปลี่ยนมุมกล้องเป็นมุมโดนโดรนถ่ายจากด้านบน” เป็นต้น
Google ระบุว่า Gemini Omni ไม่ได้ทำหน้าที่แค่เดาสีของพิกเซลให้ภาพสวยงามเท่านั้น แต่มันถูกฝึกฝนมาให้เป็น World Model ทำให้เข้าใจกฎฟิสิกส์พื้นฐาน เช่น แรงโน้มถ่วง, ของเหลว และพลังงานจลน์ ส่งผลให้การเคลื่อนไหวของวัตถุหรือสายน้ำในวิดีโอดูสมจริงอย่างเป็นธรรมชาติ นอกจากนี้ยังผสานความรู้ด้านประวัติศาสตร์ วิทยาศาสตร์ และวัฒนธรรมของ Gemini เข้าไป ทำให้มีความถูกต้องเชิงข้อมูลเชิงลึกด้วย
Gemini Omni ยังมาพร้อมความสามารถในการสร้าง Digital Avatar หรืออวตารเสมือนจริงของผู้ใช้งาน โดย AI สามารถเลียนแบบหน้าตา รูปลักษณ์ และโทนเสียงของผู้ใช้ได้อย่างแม่นยำ ช่วยให้ครีเอเตอร์สามารถผลิตคอนเทนต์วิดีโอที่มีตัวเองอยู่ในนั้นได้ผ่าน AI
ด้านความปลอดภัย Google จะได้ติดตั้งระบบความปลอดภัยขั้นสูง โดยวิดีโอทุกชิ้นที่ถูกสร้างหรือดัดแปลงด้วย Gemini Omni จะถูกฝังลายน้ำดิจิทัลที่มนุษย์มองไม่เห็นด้วยตาเปล่าที่เรียกว่า SynthID ของ Google DeepMind เพื่อให้แพลตฟอร์มต่าง ๆ สามารถตรวจสอบและยืนยันได้ทันทีว่าเป็นวิดีโอที่สร้างขึ้นด้วย AI ครับ
Google ได้เริ่มทยอยเปิดตัวโมเดลรุ่นแรกในชื่อ Gemini Omni Flash โดยแบ่งกลุ่มผู้ใช้งานดังนี้
- สมาชิก Google AI : ผู้ใช้งาน Google AI Plus, Pro และ Ultra สามารถเข้าใช้งานได้ทันทีผ่านแอป Gemini และ Google Flow
- ผู้ใช้งานทั่วไป : กำลังทยอยเปิดให้ใช้งานฟรีแบบจำกัดฟีเจอร์บน YouTube Shorts และแอป YouTube Create
- นักพัฒนาและองค์กร : จะเปิดให้เข้าถึงผ่านทาง API ในอีกไม่กี่สัปดาห์ข้างหน้า และในอนาคตจะมีโมเดลรุ่นใหญ่อย่าง Omni Pro มาให้เลือกใช้งานอีกด้วย
เรียกว่าเอาจริงเอาจังขึ้นมาอีก จากตัวอย่างที่ Google นำเสนอ เราจะเห็นว่าวิธีการสร้างวิดีโออาจเปลี่ยนไปอีกในอนาคต เพราะเราอาจไม่ต้องใช้ Prompt ที่ยาก ๆ แค่พูดหรือพิมพ์สิ่งที่ต้องการเข้าไป AI ก็จัดการให้ได้หมดแล้ว
ที่มา : Blog Google