Waiting for your creations!
KLING 2.6 est le modèle audio-vidéo natif : un clic produit un clip de 5 à 10 secondes qui associe des visuels à une narration, des dialogues, des chants et un son ambiant synchronisés sur les lèvres - aucune post-production n'est nécessaire. Les chemins texte-vidéo et image-vidéo, la prise en charge bilingue chinois-anglais et un modèle de tarification basé sur les crédits compressent la création vidéo de quelques heures à quelques secondes.
On the beach, the waves crash against the shore. [Young Caucasian male] wearing a backward baseball cap, holding a camera and taking a selfie, with a smile at the corner of his mouth. [Young Caucasian male, sunny voice] says: "The weather is amazing today! All my worries feel totally gone. I've been needing a day like this—sun, breeze, just the sound of the waves." The camera is in vlog close-up style.
Visual: In a tidy living room, a white robotic vacuum sits in the center, with no clutter around it. Dialog: [Narrator, soft female voice] accompanied by the gentle sound of vacuuming: "Are you still troubled by dust in hard-to-reach corners? This robotic vacuum features edge-to-edge cleaning, leaving no gaps behind—making your life easier and effortless!" The camera closely follows the vacuum's path as it cleans.
In a bright rehearsal room, sunlight streams through the window, and a standing microphone is placed in the center of the room. [Campus band female lead singer] stands in front of the microphone with her eyes closed, while the other members stand around her. [Campus band female lead singer, full voice] leads: "I will try to fix you, with all my heart and soul..." The background is an a cappella harmony, and the camera slowly circles around the band members.
Visual: In front of an outdoor shopping mall, a crowd gathers, cheering. Dialog: [African-American male reporter] stands next to the crowd, holding a microphone, his body slightly turned. [African-American male reporter, steady voice] says: "Now we can see the atmosphere here is absolutely electric. Let's go check it out together! There's so much happening all at once." Background: Cheerful crowd noises and event BGM, with occasional close-ups of the event.
Visual: On a comedy stage, the spotlight is focused on the center, while the audience remains in the shadows. Dialog: [Stand-up comedian] holds a microphone on stage, slightly swaying his body. [Stand-up comedian, humorous male voice]: "My gym trainer said the first step is the hardest... Lies! The first step is easy. It's the 5,000th step that's trying to murder you!" After finishing, the comedian shrugs and raises his hands. Background: Laughter and applause from the audience, with the camera focused on the comedian's face.
A scene in Antarctica with towering ice formations, the overall tone being a cold, white, frigid color palette. The glacier cracks with a loud noise, followed by the sound of ice shattering, as the engines of the research team's snowmobiles roar. The camera follows the retreating research team and the collapsing ice towers.
In a sports news studio, the screen behind the sports anchor is showing a basketball game replay.[Sports anchor] sits behind the news desk, tapping his fingers lightly on the table. [Sports anchor, clear and strong voice] says: "Look at this clutch play! He stepped up when it mattered most, hitting the shot that decided the championship! This game-winning shot sealed the victory outright." Background: Cheers from the live game, with the camera focusing on the sports anchor's face.
On a street stage, the audience stands around. [Young rapper] wears a silver chain and a black hoodie, swaying his body to the beat. [Young rapper, dynamic male voice] raps: "Yo, pavement to stage, flow lit, crowd goin’ wild! Mic in my grip, dreams unchained, let the rhythm ride! Raw vibe, sharp rhymes, keep the energy high—this is how we fly, no need to deny! Grind hard, spit fire, make the moment mine, street-born rhythm, let times shine!" The camera focuses on the young Caucasian rapper's movements.
In a cinematic rainy-day café, rain splashes against the window, with a cool, blue-green tone overall. [Blonde French woman] walks in and sits down, her hair slightly damp, gazing directly at the camera. [Blonde French woman, low voice]: "You don't remember the moment, you just remember the feeling." The camera then focuses on a bottle of golden perfume that appears in the center, zooming in on the blonde French woman's face.
Vignettes documentaires, explicatifs de commerce électronique, bandes-annonces : verrouillez le cadre et laissez le modèle rythmer la narration, l'ambiance et la conception micro-sonore pour vous.

Vignettes documentaires, explicatifs de commerce électronique, bandes-annonces : verrouillez le cadre et laissez le modèle rythmer la narration, l'ambiance et la conception micro-sonore pour vous.

Interviews, sketchs, rythmes de sitcom : celui qui parle obtient le bon visage, la bonne voix et le bon timing ; Changez de rôle sans diaphonie ni saignement de voix.

Vignettes documentaires, explicatifs de commerce électronique, bandes-annonces : verrouillez le cadre et laissez le modèle rythmer la narration, l'ambiance et la conception micro-sonore pour vous.

Chuchotements ASMR, publicités sur papier glacé, courts métrages d'art et essai : déposez des visuels impossibles, des effets sonores adaptés à l'ambiance et des micro-récits dans la même invite et regardez le surréaliste devenir réel.




Pour tirer le meilleur parti de Kling 2.6 lors de la création de vidéos avec des têtes parlantes ou de la musique, traitez l'invite comme un scénario miniature : indiquez au moteur où nous sommes, qui est là, ce qu'il fait, comment il sonne et comment vous souhaitez que le film soit tourné.
Respectez l'ordre et la ponctuation indiqués ci-dessous : Kling 2.6 a été formé exactement sur cette syntaxe.
Scène (lieu
Generate perfect audio. You can design your prompt with reference to the following solutions.
Jessica, 27 ans, micro-influenceuse, Austin
J'ai tapé « brunch sur le toit au soleil », [F] « Est-ce trop tôt pour les mimosas ? ludique et rapide » et Kling 2.6 a craché une bobine où mon propre avatar trinquait avec une pop pétillante – les lèvres verrouillées sur chaque syllabe. Publié à 9h du matin, atteint 120 000 vues avant le déjeuner. Mon sponsor en a envoyé plus, s'il vous plaît. Je tremble littéralement.
Marcus, 34 ans, rappeur indépendant, Berlin
Alimenté le bar « Vitesse si rapide, rime si nette » piège confiant, ajouté une toile de fond crasseuse du U-Bahn. Kling 2.6 m'a rendu un clip dans lequel mon moi virtuel crache à l'intérieur d'un chariot qui vibre, des charleys faisant vibrer les poteaux. Je l'ai déposé sur TikTok : 10 000 premiers streams en une heure, pas de studio, pas d'ingénieur. Le gars de mon label vient de m'envoyer un texto : « Nous mettons de côté le budget MV.
Luna, 22 ans, ASMRtiste, Montréal
Oiseaux de la forêt de pins invités
Ethan, 41 ans, fondateur de SaaS, San José
J'avais besoin d'une démonstration de produit par EOD. Tapé : « bureau loft lumineux, [M] « Réduire le temps d'intégration à quelques minutes » confiant moyen normal », a été ajouté dans notre maquette d'interface utilisateur. Kling 2.6 a renvoyé une présentation : le curseur se déplace, la voix atterrit, un sifflement subtil à chaque clic. Board a adoré ; notre CAC a chuté de 18 %.
Chloé
Il a donné à Kling 2.6 un selfie de lune de miel sur la plage et a ajouté "[Chloé, gloussant] "Nous nous sommes enfuis !" [Omar, fier] "Et je t'ai gardé une place à l'after-party." Résultat : les vagues s'écrasent au rythme de leurs rires, son voile bat exactement au rythme. Publié comme annonce de notre mariage : maman a pleuré dans le Michigan, des amis ont envoyé des emojis en forme de cœur. Nous avons tourné notre histoire d'amour en tongs. Kling 2.6 est la troisième personne de ce mariage et nous sommes ravis.
Dmitri, 45 ans, professeur de cinéma
Mon fils de 12 ans voulait un court métrage de science-fiction. Nous avons écrit : « Neon Garage Lab, [Papa, excité] « Lancez le Warp Drive ! » [SFX : moteur vrombissant]. Kling 2.6 a rendu un chef-d'œuvre de reflets d'objectif : nos visages brillants, nos voix robotiques, un sifflement d'échappement en 5.1. Nous l'avons créé sur le mur du salon ; du pop-corn partout.
Kling 2.6 est le premier modèle de diffusion audio-vidéo natif au monde. Tapez une ligne ou téléchargez une image et elle renvoie un clip de 5 à 10 secondes prêt à être diffusé dans lequel la parole, le chant, le son ambiant et le mouvement à l'écran synchronisés sur les lèvres sont verrouillés ensemble - aucune suite de montage, session Foley ou réenregistrement requis.
Chaque phonème, forme de bouche et micro-geste est prédit dans le même espace latent que la bande sonore. Le modèle estampille un « hachage audiovisuel » image par image afin que la cadence, les émotions faciales et les mouvements de la caméra ne dérivent jamais, même si vous changez de langue ou échangez des voix au milieu du clip.
Oui.
Utilisez la syntaxe du mini-scénario :
H/F « Line ».
pitch de vitesse d'émotion « insertion de la caméra 15 %. »
Kling 2.6 lit l'ordre et la ponctuation que vous tapez et les traduit directement en performances : pas d'images clés, pas de hacks d'ingénierie rapides.
Absolument. Étiquetez chaque haut-parleur ou ligne de paroles avec [CN] ou [EN] et le modèle changera automatiquement de jeu de phonèmes, en gardant intacts la forme des lèvres, la couleur d'accentuation et le schéma de rimes - parfait pour les publicités cross-market ou les duos chinois-anglais sans doublage manuel.
Écrivez-le comme un script :
Alex, en colère "Comment as-tu pu !"
Sam, calme "J'ai dit la vérité."
« Paroles » chantant une pop joyeuse
Objet : porte Action : slam SFX : bang
Kling 2.6 restitue les dialogues, les voix et les effets ponctuels en un seul passage, chaque source isolée mais verrouillée en phase — aucun mixage manuel requis.
100 %. Chaque rendu Kling 2.6 est accompagné d'une licence mondiale et libre de droits : publicités, présentations clients, documents en streaming, revente, NFT, pas de frais supplémentaires, aucune attribution nécessaire.
