Waiting for your creations!
KLING 2.6 ist das native Audio-Video-Modell: Ein Klick erzeugt einen 5–10 Sekunden langen Clip, der visuelle Elemente mit lippensynchronen Erzählungen, Dialogen, Gesang und Umgebungsgeräuschen verbindet – eine Nachbearbeitung ist nicht erforderlich. Text-zu-Video- und Bild-zu-Video-Pfade, zweisprachiger Chinesisch-Englisch-Support und ein auf Credits basierendes Preismodell verkürzen die Videoerstellung von Stunden auf Sekunden.
On the beach, the waves crash against the shore. [Young Caucasian male] wearing a backward baseball cap, holding a camera and taking a selfie, with a smile at the corner of his mouth. [Young Caucasian male, sunny voice] says: "The weather is amazing today! All my worries feel totally gone. I've been needing a day like this—sun, breeze, just the sound of the waves." The camera is in vlog close-up style.
Visual: In a tidy living room, a white robotic vacuum sits in the center, with no clutter around it. Dialog: [Narrator, soft female voice] accompanied by the gentle sound of vacuuming: "Are you still troubled by dust in hard-to-reach corners? This robotic vacuum features edge-to-edge cleaning, leaving no gaps behind—making your life easier and effortless!" The camera closely follows the vacuum's path as it cleans.
In a bright rehearsal room, sunlight streams through the window, and a standing microphone is placed in the center of the room. [Campus band female lead singer] stands in front of the microphone with her eyes closed, while the other members stand around her. [Campus band female lead singer, full voice] leads: "I will try to fix you, with all my heart and soul..." The background is an a cappella harmony, and the camera slowly circles around the band members.
Visual: In front of an outdoor shopping mall, a crowd gathers, cheering. Dialog: [African-American male reporter] stands next to the crowd, holding a microphone, his body slightly turned. [African-American male reporter, steady voice] says: "Now we can see the atmosphere here is absolutely electric. Let's go check it out together! There's so much happening all at once." Background: Cheerful crowd noises and event BGM, with occasional close-ups of the event.
Visual: On a comedy stage, the spotlight is focused on the center, while the audience remains in the shadows. Dialog: [Stand-up comedian] holds a microphone on stage, slightly swaying his body. [Stand-up comedian, humorous male voice]: "My gym trainer said the first step is the hardest... Lies! The first step is easy. It's the 5,000th step that's trying to murder you!" After finishing, the comedian shrugs and raises his hands. Background: Laughter and applause from the audience, with the camera focused on the comedian's face.
A scene in Antarctica with towering ice formations, the overall tone being a cold, white, frigid color palette. The glacier cracks with a loud noise, followed by the sound of ice shattering, as the engines of the research team's snowmobiles roar. The camera follows the retreating research team and the collapsing ice towers.
In a sports news studio, the screen behind the sports anchor is showing a basketball game replay.[Sports anchor] sits behind the news desk, tapping his fingers lightly on the table. [Sports anchor, clear and strong voice] says: "Look at this clutch play! He stepped up when it mattered most, hitting the shot that decided the championship! This game-winning shot sealed the victory outright." Background: Cheers from the live game, with the camera focusing on the sports anchor's face.
On a street stage, the audience stands around. [Young rapper] wears a silver chain and a black hoodie, swaying his body to the beat. [Young rapper, dynamic male voice] raps: "Yo, pavement to stage, flow lit, crowd goin’ wild! Mic in my grip, dreams unchained, let the rhythm ride! Raw vibe, sharp rhymes, keep the energy high—this is how we fly, no need to deny! Grind hard, spit fire, make the moment mine, street-born rhythm, let times shine!" The camera focuses on the young Caucasian rapper's movements.
In a cinematic rainy-day café, rain splashes against the window, with a cool, blue-green tone overall. [Blonde French woman] walks in and sits down, her hair slightly damp, gazing directly at the camera. [Blonde French woman, low voice]: "You don't remember the moment, you just remember the feeling." The camera then focuses on a bottle of golden perfume that appears in the center, zooming in on the blonde French woman's face.
Dokumentarische Vignetten, E-Commerce-Erklärungen, Highlight-Reels – sperren Sie den Rahmen und lassen Sie das Model die Erzählung, Atmosphäre und Mikro-Sound-Gestaltung für Sie steuern.

Dokumentarische Vignetten, E-Commerce-Erklärungen, Highlight-Reels – sperren Sie den Rahmen und lassen Sie das Model die Erzählung, Atmosphäre und Mikro-Sound-Gestaltung für Sie steuern.

Interviews, Sketche, Sitcom-Beats – wer spricht, bekommt das richtige Gesicht, die richtige Stimme und das richtige Timing; Wechseln Sie die Rollen ohne Übersprechen oder Ausbluten der Stimme.

Dokumentarische Vignetten, E-Commerce-Erklärungen, Highlight-Reels – sperren Sie den Rahmen und lassen Sie das Model die Erzählung, Atmosphäre und Mikro-Sound-Gestaltung für Sie steuern.

ASMR-Geflüster, Hochglanzanzeigen, Arthouse-Kurzfilme – fügen Sie unmögliche Visuals, stimmungsangepasste SFX und Mikro-Erzählungen in ein und dieselbe Eingabeaufforderung ein und erleben Sie, wie das Surreale real wird.




Um bei der Erstellung von Talking-Head- oder Musikvideos die beste Leistung aus Kling 2.6 herauszuholen, behandeln Sie die Eingabeaufforderung wie ein Miniaturdrehbuch: Sagen Sie der Engine, wo wir sind, wer da ist, was sie tun, wie sie klingen und wie Sie es aufnehmen möchten. Halten Sie sich an die unten gezeigte Reihenfolge und Zeichensetzung – Kling 2.6 wurde genau auf diese Syntax trainiert.
Szene (Ort
Generate perfect audio. You can design your prompt with reference to the following solutions.
Jessica, 27, Mikro-Influencerin, Austin
Ich tippte „Sonnenverwöhnter Brunch auf dem Dach“, [F] „Ist es zu früh für Mimosen?“ „Playful Fast High“ und Kling 2.6 spuckte eine Spule aus, in der mein eigener Avatar mit einem sprudelnden Knall anstieß – die Lippen waren auf jede Silbe fixiert. Gepostet um 9 Uhr morgens, erreichte bis zum Mittagessen 120.000 Aufrufe. Mein Sponsor hat mir per DM gesagt: „Bitte mehr davon.“ Ich zittere buchstäblich.
Marcus, 34, Indie-Rapper, Berlin
Füttern Sie die Bar „Geschwindigkeit so schnell, reimen Sie sich so scharf“ selbstbewusst und fügen Sie eine schmutzige U-Bahn-Kulisse hinzu. Kling 2.6 gab mir einen Clip zurück, in dem mein virtuelles Ich in eine klappernde Kutsche spuckt und Hi-Hats an den Stangen rasseln. Habe es auf TikTok gepostet – die ersten 10.000 Streams in einer Stunde, kein Studio, kein Techniker. Mein Label-Typ hat gerade geschrieben: „Wir stellen das MV-Budget zurück.“
Luna, 22, ASMRtistin, Montreal
Aufgefordert Kiefernwaldvögel
Ethan, 41, SaaS-Gründer, San Jose
Benötigt wurde eine Produktdemo von EOD. Eingegeben: „Helles Loft-Büro, [M] „Einarbeitungszeit auf Minuten verkürzen“, sicher mittel normal“, eingefügt in unserem UI-Mock-up. Kling 2.6 lieferte einen Rundgang – Cursorbewegungen, Stimmen landen, subtiles Rauschen bei jedem Klick. Board hat es geliebt; Unser CAC sank um 18 %.
Chloe
Gab Kling 2.6 ein Flitterwochen-Selfie am Strand und fügte hinzu: „[Chloe, kichernd] „Wir sind durchgebrannt!“ [Omar, stolz] „Und dir einen Platz auf der After-Party gesichert.“ Ausgabe: Wellen schlagen im Rhythmus ihres Lachens, ihr Schleier flattert genau im Takt. Gepostet als unsere Hochzeitsankündigung – Mama weinte in Michigan, Freunde spammten Herz-Emojis. Wir haben unsere Liebesgeschichte in Flip-Flops gedreht. Kling 2.6 ist die dritte Person in dieser Ehe und wir sind begeistert.
Dmitri, 45, Filmlehrer
Mein 12-Jähriger wollte einen Science-Fiction-Kurzfilm. Wir schrieben: „Neon Garage Lab, [Papa, aufgeregt] „Warp-Antrieb einleiten!“ [SFX: dröhnender Motor]. Kling 2.6 hat ein Lens-Flare-Meisterwerk gerendert – unsere Gesichter glühten, die Stimmen roboterhaft, der Auspuff rauschte in 5.1. Wir haben es an der Wohnzimmerwand uraufgeführt; Popcorn überall.“
Kling 2.6 ist das weltweit erste native Audio-Video-Diffusionsmodell. Geben Sie eine Zeile ein oder laden Sie ein Bild hoch und es wird ein 5–10 Sekunden langer, sendebereiter Clip zurückgegeben, in dem lippensynchrone Sprache, Gesang, Umgebungsgeräusche und Bewegungen auf dem Bildschirm miteinander verbunden sind – kein Bearbeitungsraum, keine Foley-Sitzung oder Neuaufnahme erforderlich.
Jedes Phonem, jede Mundform und jede Mikrogeste wird im selben latenten Raum wie der Soundtrack vorhergesagt. Das Modell zeichnet einen Bild-für-Bild-„audiovisuellen Hash“ auf, sodass Trittfrequenz, Gesichtsemotion und Kamerabewegung niemals abweichen – selbst wenn Sie mitten im Clip die Sprache oder die Stimme wechseln.
Ja.
Verwenden Sie die Mini-Drehbuch-Syntax:
M/F „Zeile“.
Emotion-Speed-Pitch „Kamera-Push-In 15 %.“
Kling 2.6 liest die von Ihnen eingegebene Reihenfolge und Zeichensetzung und setzt sie direkt in Leistung um – keine Keyframes, keine sofortigen technischen Hacks.
Absolut. Beschriften Sie jeden Sprecher oder jede Textzeile mit [CN] oder [EN] und das Modell wechselt automatisch die Phonemsätze, wobei Lippenformen, Akzentfarben und Reimschema erhalten bleiben – perfekt für marktübergreifende Werbung oder chinesisch-englische Duette ohne manuelles Überspielen.
Schreiben Sie es wie ein Drehbuch:
Alex, wütend „Wie konntest du!“
Sam,ruhig „Ich habe die Wahrheit gesagt.“
„Lyrics“ mit fröhlichem Pop
Object:door Action:slam SFX:bang
Kling 2.6 rendert Dialoge, Gesang und Spot-Effekte in einem einzigen Durchgang, jede Quelle isoliert und dennoch phasenstarr – kein manuelles Mischen erforderlich.
100 %. Zu jedem Kling 2.6-Rendering gehört eine weltweite, gebührenfreie Lizenz – Werbung, Kundenpräsentationen, Streaming-Dokumente, Weiterverkauf, NFTs, keine zusätzlichen Gebühren, keine Quellenangabe erforderlich.
