
Google DeepMind právě představil Gemini Omni – AI model, který z textu, fotek, audia i existujících klipů vytvoří nebo upraví video. A to vše přes normální konverzaci.
Na Google I/O 2026 oznámil CEO DeepMindu Demis Hassabis nový model s ambiciózním cílem: vytvořit cokoliv z jakéhokoliv vstupu. Gemini Omni je největší krok Googlu do světa multimodální AI – a pro tvůrce obsahu to může změnit hodně.
Gemini Omni je multimodální AI model, který kombinuje možnosti Gemini, Veo, Nano Banana a Genie do jednoho systému. Jednoduše řečeno: přijme text, obrázky, audio nebo existující video – a na výstupu dostanete konzistentní, fyzikálně věrohodný klip.
Oproti předchozím nástrojům má Omni jedno zásadní plus – rozumí kontextu. Díky napojenému Gemini reasoning dokáže sledovat instrukce jako „přidej dramatické osvětlení a posuň scénu do noci” bez nutnosti specifikovat každý detail ručně.
Největší novinka Gemini Omni je konverzační editace videí. Funguje podobně jako Nano Banana pro fotky – jen tentokrát pro video.
Co to v praxi znamená?
Google na I/O ukázal například claymation vzdělávací video o skládání proteinů – vygenerované přímo z Omni.
Google's new Gemini Omni, can generate "anything from any input"
— Rohan Paul (@rohanpaul_ai) May 19, 2026
A video AI model that can create and edit clips from video, images, audio, text, and sketches.
A user can record a normal video, then ask Omni to add a character, replace an object, change the action, alter the… pic.twitter.com/or28ubTVrh
První release se jmenuje Gemini Omni Flash a přichází s jedním omezením – klipy jsou zatím zastropovány na 10 sekund. Google to vysvětluje vysokou poptávkou po výpočetním výkonu, ne technickým limitem modelu.
Kde Omni Flash najdete:
Gemini Omni není jen hračka pro filmařské nadšence. Praktické dopady jsou širší:
Upřímné upozornění: čistá kvalita generace zatím může zaostávat za specializovanými nástroji jako Seedance 2.0 nebo Kling 3.0. Silnou kartou Googlu je ale distribuce – Omni je rovnou v Gemini apce, Search, Flow i YouTube.
Gemini Omni je jasný signál, že Google bere video vážně – a tentokrát to není jen další standalone nástroj, ale součást ekosystému, který denně používají miliardy lidí. Pro marketéry a tvůrce obsahu to znamená: konverzační tvorba videí přestává být sci-fi.
Sledujte náš Instagram @AI4Marketing.cz, kde tohle nové workflow rozebíráme do šroubku.
📌 Zdroje:
Gemini Omni je multimodální AI model od Google DeepMind představený na Google I/O 2026. Umožňuje generovat a editovat videa pomocí textu, obrázků, audia a existujících klipů. Klíčovou funkcí je konverzační editace – uživatel upravuje scény přirozeným jazykem bez nutnosti ovládat střihové nástroje. První verze Gemini Omni Flash je dostupná pro předplatitele Google AI Plus/Pro/Ultra a zdarma pro uživatele YouTube Shorts.






