Waiting for your creations!
KLING 2.6 is het native audio-videomodel: één klik levert een clip van 5 tot 10 seconden op waarin beelden worden gecombineerd met lipgesynchroniseerde vertelling, dialoog, zang en omgevingsgeluid – er is geen postproductie nodig. Tekst-naar-video- en afbeelding-naar-video-paden, tweetalige Chinees-Engelse ondersteuning en een op credits gebaseerd prijsmodel comprimeren het maken van video's van uren naar seconden.
On the beach, the waves crash against the shore. [Young Caucasian male] wearing a backward baseball cap, holding a camera and taking a selfie, with a smile at the corner of his mouth. [Young Caucasian male, sunny voice] says: "The weather is amazing today! All my worries feel totally gone. I've been needing a day like this—sun, breeze, just the sound of the waves." The camera is in vlog close-up style.
Visual: In a tidy living room, a white robotic vacuum sits in the center, with no clutter around it. Dialog: [Narrator, soft female voice] accompanied by the gentle sound of vacuuming: "Are you still troubled by dust in hard-to-reach corners? This robotic vacuum features edge-to-edge cleaning, leaving no gaps behind—making your life easier and effortless!" The camera closely follows the vacuum's path as it cleans.
In a bright rehearsal room, sunlight streams through the window, and a standing microphone is placed in the center of the room. [Campus band female lead singer] stands in front of the microphone with her eyes closed, while the other members stand around her. [Campus band female lead singer, full voice] leads: "I will try to fix you, with all my heart and soul..." The background is an a cappella harmony, and the camera slowly circles around the band members.
Visual: In front of an outdoor shopping mall, a crowd gathers, cheering. Dialog: [African-American male reporter] stands next to the crowd, holding a microphone, his body slightly turned. [African-American male reporter, steady voice] says: "Now we can see the atmosphere here is absolutely electric. Let's go check it out together! There's so much happening all at once." Background: Cheerful crowd noises and event BGM, with occasional close-ups of the event.
Visual: On a comedy stage, the spotlight is focused on the center, while the audience remains in the shadows. Dialog: [Stand-up comedian] holds a microphone on stage, slightly swaying his body. [Stand-up comedian, humorous male voice]: "My gym trainer said the first step is the hardest... Lies! The first step is easy. It's the 5,000th step that's trying to murder you!" After finishing, the comedian shrugs and raises his hands. Background: Laughter and applause from the audience, with the camera focused on the comedian's face.
A scene in Antarctica with towering ice formations, the overall tone being a cold, white, frigid color palette. The glacier cracks with a loud noise, followed by the sound of ice shattering, as the engines of the research team's snowmobiles roar. The camera follows the retreating research team and the collapsing ice towers.
In a sports news studio, the screen behind the sports anchor is showing a basketball game replay.[Sports anchor] sits behind the news desk, tapping his fingers lightly on the table. [Sports anchor, clear and strong voice] says: "Look at this clutch play! He stepped up when it mattered most, hitting the shot that decided the championship! This game-winning shot sealed the victory outright." Background: Cheers from the live game, with the camera focusing on the sports anchor's face.
On a street stage, the audience stands around. [Young rapper] wears a silver chain and a black hoodie, swaying his body to the beat. [Young rapper, dynamic male voice] raps: "Yo, pavement to stage, flow lit, crowd goin’ wild! Mic in my grip, dreams unchained, let the rhythm ride! Raw vibe, sharp rhymes, keep the energy high—this is how we fly, no need to deny! Grind hard, spit fire, make the moment mine, street-born rhythm, let times shine!" The camera focuses on the young Caucasian rapper's movements.
In a cinematic rainy-day café, rain splashes against the window, with a cool, blue-green tone overall. [Blonde French woman] walks in and sits down, her hair slightly damp, gazing directly at the camera. [Blonde French woman, low voice]: "You don't remember the moment, you just remember the feeling." The camera then focuses on a bottle of golden perfume that appears in the center, zooming in on the blonde French woman's face.
Solo talkshow
Documentairevignetten, e-commerce uitleg, hoogtepunten: vergrendel het frame en laat het model de vertelling, sfeer en microgeluidsontwerp voor u bepalen.

Voice-over verhalen vertellen
Documentairevignetten, e-commerce uitleg, hoogtepunten: vergrendel het frame en laat het model de vertelling, sfeer en microgeluidsontwerp voor u bepalen.

Dialoog met meerdere karakters
Interviews, sketches, sitcom-beats: wie spreekt, krijgt het juiste gezicht, de juiste stem en timing; wissel van rol zonder overspraak of stembloeding.

Muziekprestaties
Documentairevignetten, e-commerce uitleg, hoogtepunten: vergrendel het frame en laat het model de vertelling, sfeer en microgeluidsontwerp voor u bepalen.

Hyper-creatieve scènes
ASMR-fluisteringen, glanzende advertenties, arthouse-shorts: laat onmogelijke beelden, op de stemming afgestemde SFX en micro-verhaal in dezelfde prompt vallen en zie hoe het surrealistische werkelijkheid wordt.




Om de beste prestaties uit Kling 2.6 te halen bij het maken van video's met pratende hoofden of muziek, moet je de prompt behandelen als een miniatuurscenario: vertel de engine waar we zijn, wie daar is, wat ze doen, hoe ze klinken en hoe je het wilt laten opnemen.
Houd je aan de onderstaande volgorde en interpunctie: Kling 2.6 is precies op deze syntaxis getraind.
Scène (plaats
Generate perfect audio. You can design your prompt with reference to the following solutions.
Jessica, 27, micro-influencer, Austin
Ik typte ‘zonovergoten brunch op het dak, [F] “Is het te vroeg voor mimosa’s?” speelse snelle high’ en Kling 2.6 spuwde een haspel uit waar mijn eigen avatar een bril rammelde tot een bruisende knal – lippen op elke lettergreep geklemd. Gepost om 9.00 uur, 120.000 keer bekeken tijdens de lunch. Mijn sponsor DM me ‘meer daarvan, alsjeblieft. Ik sta letterlijk te trillen.
Marcus, 34, Indie Rapper, Berlijn
Voedde de lat 'Snel zo snel, rijm zo scherp' trapvol vertrouwen, en voegde een groezelige U-Bahn-achtergrond toe. Kling 2.6 gaf me een fragment terug waarin mijn virtuele zelf in een rammelende koets spuugt, terwijl hi-hats aan de palen rammelen. Ik heb het op TikTok gedropt: de eerste 10.000 streams in een uur, geen studio, geen ingenieur. Mijn labelman sms'te net: 'We leggen het MV-budget opzij.
Luna, 22, ASMRtist, Montreal
Gevraagd dennenbosvogels
Ethan, 41, SaaS-oprichter, San Jose
Ik had een productdemo nodig van EOD. Getypt: “helder loftkantoor, [M] “Verkort de onboardingtijd tot minuten” zelfverzekerd gemiddeld normaal”, viel in onze UI-mock-up. Kling 2.6 gaf een walk-through terug: cursorbewegingen, stem landt, subtiele whoosh bij elke klik. Het bestuur vond het geweldig; onze CAC daalde met 18%.
Chloë
Gaf Kling 2.6 een huwelijksreis-selfie op het strand en voegde eraan toe: “[Chloe, giechelend] “We zijn weggelopen!” [Omar, trots] “En ik heb je een plaatsje bespaard op de afterparty.” Output: golven beuken op het ritme van hun gelach, haar sluier wappert precies op de maat. Gepost als onze huwelijksaankondiging: mijn moeder huilde in Michigan, vrienden spamden hartjesemoji's. We hebben ons liefdesverhaal op slippers gefilmd. Kling 2.6 is de derde persoon in dit huwelijk en we zijn er heel blij mee.
Dmitri, 45, filmleraar
Mijn 12-jarige wilde een korte sciencefictionfilm. We schreven: “neon garage lab, [Papa, opgewonden] “Initieer warp drive!” [SFX: ronkende motor]. Kling 2.6 leverde een meesterwerk met lensflare op: onze gezichten gloeiend, stemmen robotachtig, uitlaatgassen in 5.1. We brachten het in première op de muur in de woonkamer; overal popcorn.”
Kling 2.6 is 's werelds eerste native audio-video-diffusiemodel. Typ één regel of upload één afbeelding en er verschijnt een uitzendklaar fragment van 5 tot 10 seconden waarin lipgesynchroniseerde spraak, zang, omgevingsgeluid en beweging op het scherm aan elkaar zijn gekoppeld - geen bewerkingssuite, Foley-sessie of opnieuw opnemen vereist.
Elk foneem, mondvorm en microgebaar wordt voorspeld in dezelfde latente ruimte als de soundtrack. Het model stempelt frame voor frame een 'audiovisuele hash', zodat cadans, gezichtsemotie en camerabewegingen nooit afwijken, zelfs niet als u halverwege de clip van taal verandert of van stem wisselt.
Ja.
Gebruik de syntaxis van het mini-scenario:
M/F “Line.”
emotie snelheid pitch “camera push-in 15%.”
Kling 2.6 leest de volgorde en interpunctie die u typt en vertaalt deze rechtstreeks naar prestaties: geen keyframes, geen snelle technische hacks.
Absoluut. Label elke spreker of tekstregel met [CN] of [EN] en het model schakelt automatisch tussen foneemsets, waarbij de lipvormen, accentkleur en rijmschema intact blijven – perfect voor cross-market advertenties of Chinees-Engelse duetten zonder handmatig nasynchroniseren.
Schrijf het als een script:
Alex, boos “Hoe kon je!”
Sam,kalm “Ik vertelde de waarheid.”
“Songteksten” met vrolijke pop
Object:door Action:slam SFX:bang
Kling 2.6 geeft dialoog, zang en spoteffecten in één keer weer, waarbij elke bron geïsoleerd maar fasevergrendeld is – handmatig mixen is niet nodig.
100%. Elke Kling 2.6-render wordt geleverd met een wereldwijde, royaltyvrije licentie: advertenties, pitches voor klanten, streamingdocumenten, wederverkoop, NFT's, geen extra kosten, geen toeschrijving nodig.
