Mein Veo 3.1 Workflow: Wie ich mich von Gedanken zu Bilder zu Videos prompte
Der Einstieg: Der Funke (oder: Die Eisberg-Warnung) ⚡
Jeder gute generative Workflow beginnt nicht mit einem Tool, sondern mit einem Gedanken. Einem Hook. Bei mir war's ein Spruch mit perfektem Dark-Cringe-Vibe: "TeamViewer ist wie auf der Titanik."
Aua. Aber statt das wegzuschieben, hab ich's als Zündfunke für meinen AI-Workflow genutzt. Hier sind die 3 Phasen, die ich durchlaufen habe.
Step 1: Das Meta-Game – Frag nicht was, frag wie.
Ich hab Gemini nicht einfach befohlen: 'Mach mir ein Bild von der Titanic'. Das kann jeder Depp. Ich bin in den Meta-Modus gegangen. 'Bro, gib mir fünf verschiedene Prompt-Vorschläge für ein Image-Tool, um dieses 'Titanic'-Feeling düster und grafisch anspruchsvoll umzusetzen.' Das ist der Unterschied zwischen Prompt-User und Prompt-Gladiator. Du lässt die AI die Munition designen.

Step 2: Der "Validation-Shift" – Vom Untergang zur Team-Power
Aber je länger ich auf dieses Elend starrte, desto mehr meldete sich der 'TeamViewer'-Teil in mir. Sind wir wirklich die Truppe, die untergeht? Oder sind wir die, die die Rettungsboote klarmachen?
Also, direkter Konter. Follow-up-Prompt: 'Jetzt, positiv durch Team Power.' Keine große Kunst, einfach ein direkter Befehl zur Umkehrung.

Genauso geil. Vom Abgrund zur Utopie. Jetzt hatte ich zwei Frames. A und B. Den totalen Crash und die glorreiche Rettung. Mein Hirn schrie: Animieren!

Phase 3: Die unterschiedlichen Video Generatoren
Also hab ich mir das Vertex AI Studio (Google Cloud) angesehen. Ist halt nicht das fancy Chat-Fenster, sondern das "Maschinenraum"-Interface. Aber: Dort gab es die Optionen, die ich brauchte.
Ich hab mir also fix 'nen Account gemacht. Der entscheidende Unterschied:
In Vertex AI Studio kannst du im Gegensatz zu Gemini UI ein Start-Frame UND ein End-Frame hochladen.
Genau das hab ich getan:
- Start-Frame: <Output erstes bild> (Der Abgrund)
- End-Frame: <Output zweites bild> (Die Rettung)
- Transformation-Prompt:
/animate style:hyperrealistic, 4K, cinematic, high contrast
Phase 1 (0-3 seconds):
Extreme long shot of a modern glass building shaped like a ship, set against a dark, stormy, apocalyptic sky. The building is crumbling, concrete shattering. A massive, glowing red bearish stock chart arrow is integrated into the architecture, plunging downwards and striking the ground. Atmosphere: Despair, heavy, dramatic. Camera: Slow dolly zoom IN.
Phase 2 (3-5 seconds):
Transition: The red arrow hits bottom, shatters violently into digital particles. A new, vibrant green bullish arrow erupts from the impact point, growing rapidly upwards. The storm clouds instantly dissipate, replaced by a bright, sunny sky. The transition is explosive and energetic.
Phase 3 (5-8 seconds):
As the green arrow rises, energetic, cheering people (diverse, modern casual wear) run into frame and appear on the graph, climbing it, holding up positive icons, and celebrating wildly. The building, though still showing battle scars (rubble remains), stands tall. Atmosphere: Eruption of joy, triumph, success. Camera: Crane shot UP, following the arrow's rise.
* (Enstanden aus dem Chat der Bildergenierung, wie denn die Optiomale Prompt für Video Generatoren sei.")
Ich drücke "Generieren" und warte auf den Payoff.
Das finale Ergebnis (Der Workflow, der funktioniert):
BAM! Das ist es.
Veo 3.1 hat nicht nur A nach B gemorpht. Es hat die Story verstanden. Es hat die Transformation narrativ umgesetzt – du siehst, wie die Stimmung kippt und die "Team-Power" die "Titanic" metaphorisch überwindet.
Zusätzlich hab ich nur die Prompt genommen und das ausgangbild und dies bei Imagine von Grok probiert, war auch nicht schlecht, aber noch sehr gekünstelt:
Danach bin ich auf Idee gekommen, das auch bei Gemini einzugeben mit nur dem ersten Bild und das Ergebnis war auch schon richtig nice. Vielleicht hätte es Vertex nicht gebraucht, aber spannend verschiedene UIs und Möglichkeiten zu sehen
Mein Fazit (TL;DR)
- Phase 1 (Gedanke -> Chat): Du startest mit dem deinem-Gedanken ("Titanic"). Du öffnest den Chat.
- Phase 2 (Chat -> Meta-Prompting): Du lässt die AI als Sparring-Partner arbeiten: "Gib mir 5 verschiedene Image-Prompt-Vorschläge für diesen Vibe."
- Phase 3 (Chat -> Keyframes): Du lässt dir die Bilder (Start-Frame A und End-Frame B) basierend auf diesen Prompts generieren.
- Phase 4 (Chat -> Video-Prompt): Das ist der entscheidende Schritt. Du gehst zurück in den Chat und sagst: "Bro, schreib mir jetzt die perfekte Video-Transformations-Prompt, die die Story von A nach B erzählt."
- Phase 5 (Tooling): Du nimmst all diese AI-generierten Artefakte –
Bild A,Bild Bund dieTransformations-Prompt– und fütterst damit das High-End-Tool (wie Vertex AI Studio), das diesen Dreiklang versteht.
Use AI to use AI! ✨🎉
Cheers 😏