Google เปิดตัว Gemini Omni โมเดลสร้างวิดีโอขั้นเทพใหม่ สมจริงยิ่งขึ้น อลังการกว่าที่เคย! (มีคลิป)

โดย Map

นอกจาก Gemini 3.5 Flash แล้ว ในงาน Google I/O 2026 ยังเปิดตัว “Gemini Omni” โมเดล AI ใหม่ ที่ชูจุดเด่นเรื่องการคิดวิเคราะห์ และการสร้างสรรค์ เข้าด้วยกันอย่างไร้รอยต่อ โดยเริ่มต้นเน้นไปที่การสร้างและตัดต่อวิดีโออย่างจริงจังครับ!

Gemini Omni สร้างสรรค์วิดีโอผ่าน AI ได้หลากหลายกว่าเดิม โมเดล AI สร้างวิดีโอทั่วไปมักจะรับได้เพียงคำสั่งข้อความ (Prompt) เท่านั้น แต่ Gemini Omni ถูกออกแบบมาให้เป็น Multimodal สามารถผสมผสานอินพุตที่หลากหลาย ไม่ว่าจะเป็นข้อความ, รูปภาพ, เสียง หรือแม้กระทั่งคลิปวิดีโอต้นแบบ เข้าพร้อม ๆ กัน เพื่อแปลงออกมาเป็นวิดีโอคุณภาพสูงชิ้นใหม่ที่ตรงใจผู้ใช้มากที่สุด

ยกตัวอย่างเช่น สามารถอัปโหลดภาพตัวละคร ส่งคลิปสไตล์ภาพที่ชอบ และพิมพ์สั่งเนื้อเรื่องเข้าไป Omni ก็จะผสมผสานทุกอย่างออกมาเป็นวิดีโอตัวใหม่ได้อย่างสมบูรณ์

รวมถึงรูปแบบในการตัดต่อ Gemini Omni ยังให้เราแก้ไขสิ่งต่าง ๆ ได้ผ่านการพิมพ์หรือคุยกับ AI ได้โดยตรงเช่น “เปลี่ยนฉากหลังให้อยู่ในอวกาศหน่อย” “เพิ่มเอฟเฟกต์ให้กระจกกลายเป็นของเหลวตอนเอามือจับ” หรือ “เปลี่ยนมุมกล้องเป็นมุมโดนโดรนถ่ายจากด้านบน” เป็นต้น

Google ระบุว่า Gemini Omni ไม่ได้ทำหน้าที่แค่เดาสีของพิกเซลให้ภาพสวยงามเท่านั้น แต่มันถูกฝึกฝนมาให้เป็น World Model ทำให้เข้าใจกฎฟิสิกส์พื้นฐาน เช่น แรงโน้มถ่วง, ของเหลว และพลังงานจลน์ ส่งผลให้การเคลื่อนไหวของวัตถุหรือสายน้ำในวิดีโอดูสมจริงอย่างเป็นธรรมชาติ นอกจากนี้ยังผสานความรู้ด้านประวัติศาสตร์ วิทยาศาสตร์ และวัฒนธรรมของ Gemini เข้าไป ทำให้มีความถูกต้องเชิงข้อมูลเชิงลึกด้วย

Gemini Omni ยังมาพร้อมความสามารถในการสร้าง Digital Avatar หรืออวตารเสมือนจริงของผู้ใช้งาน โดย AI สามารถเลียนแบบหน้าตา รูปลักษณ์ และโทนเสียงของผู้ใช้ได้อย่างแม่นยำ ช่วยให้ครีเอเตอร์สามารถผลิตคอนเทนต์วิดีโอที่มีตัวเองอยู่ในนั้นได้ผ่าน AI

ด้านความปลอดภัย Google จะได้ติดตั้งระบบความปลอดภัยขั้นสูง โดยวิดีโอทุกชิ้นที่ถูกสร้างหรือดัดแปลงด้วย Gemini Omni จะถูกฝังลายน้ำดิจิทัลที่มนุษย์มองไม่เห็นด้วยตาเปล่าที่เรียกว่า SynthID ของ Google DeepMind เพื่อให้แพลตฟอร์มต่าง ๆ สามารถตรวจสอบและยืนยันได้ทันทีว่าเป็นวิดีโอที่สร้างขึ้นด้วย AI ครับ

Google ได้เริ่มทยอยเปิดตัวโมเดลรุ่นแรกในชื่อ Gemini Omni Flash โดยแบ่งกลุ่มผู้ใช้งานดังนี้

  • ​สมาชิก Google AI : ผู้ใช้งาน Google AI Plus, Pro และ Ultra สามารถเข้าใช้งานได้ทันทีผ่านแอป Gemini และ Google Flow
  • ​ผู้ใช้งานทั่วไป : กำลังทยอยเปิดให้ใช้งานฟรีแบบจำกัดฟีเจอร์บน YouTube Shorts และแอป YouTube Create
  • ​นักพัฒนาและองค์กร : จะเปิดให้เข้าถึงผ่านทาง API ในอีกไม่กี่สัปดาห์ข้างหน้า และในอนาคตจะมีโมเดลรุ่นใหญ่อย่าง Omni Pro มาให้เลือกใช้งานอีกด้วย

เรียกว่าเอาจริงเอาจังขึ้นมาอีก จากตัวอย่างที่ Google นำเสนอ เราจะเห็นว่าวิธีการสร้างวิดีโออาจเปลี่ยนไปอีกในอนาคต เพราะเราอาจไม่ต้องใช้ Prompt ที่ยาก ๆ แค่พูดหรือพิมพ์สิ่งที่ต้องการเข้าไป AI ก็จัดการให้ได้หมดแล้ว

ที่มา : Blog Google

เรื่องที่เกี่ยวข้อง

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More