Waiting for your creations!
KLING 2.6 adalah model audio-video asli: satu klik menghasilkan klip berdurasi 5–10 detik yang memadukan visual dengan narasi, dialog, nyanyian, dan suara sekitar yang disinkronkan bibir—tidak memerlukan pascaproduksi. Jalur teks-ke-video dan gambar-ke-video, dukungan bilingual Mandarin-Inggris, dan model penetapan harga berbasis kredit mempersingkat pembuatan video dari hitungan jam menjadi detik.
On the beach, the waves crash against the shore. [Young Caucasian male] wearing a backward baseball cap, holding a camera and taking a selfie, with a smile at the corner of his mouth. [Young Caucasian male, sunny voice] says: "The weather is amazing today! All my worries feel totally gone. I've been needing a day like this—sun, breeze, just the sound of the waves." The camera is in vlog close-up style.
Visual: In a tidy living room, a white robotic vacuum sits in the center, with no clutter around it. Dialog: [Narrator, soft female voice] accompanied by the gentle sound of vacuuming: "Are you still troubled by dust in hard-to-reach corners? This robotic vacuum features edge-to-edge cleaning, leaving no gaps behind—making your life easier and effortless!" The camera closely follows the vacuum's path as it cleans.
In a bright rehearsal room, sunlight streams through the window, and a standing microphone is placed in the center of the room. [Campus band female lead singer] stands in front of the microphone with her eyes closed, while the other members stand around her. [Campus band female lead singer, full voice] leads: "I will try to fix you, with all my heart and soul..." The background is an a cappella harmony, and the camera slowly circles around the band members.
Visual: In front of an outdoor shopping mall, a crowd gathers, cheering. Dialog: [African-American male reporter] stands next to the crowd, holding a microphone, his body slightly turned. [African-American male reporter, steady voice] says: "Now we can see the atmosphere here is absolutely electric. Let's go check it out together! There's so much happening all at once." Background: Cheerful crowd noises and event BGM, with occasional close-ups of the event.
Visual: On a comedy stage, the spotlight is focused on the center, while the audience remains in the shadows. Dialog: [Stand-up comedian] holds a microphone on stage, slightly swaying his body. [Stand-up comedian, humorous male voice]: "My gym trainer said the first step is the hardest... Lies! The first step is easy. It's the 5,000th step that's trying to murder you!" After finishing, the comedian shrugs and raises his hands. Background: Laughter and applause from the audience, with the camera focused on the comedian's face.
A scene in Antarctica with towering ice formations, the overall tone being a cold, white, frigid color palette. The glacier cracks with a loud noise, followed by the sound of ice shattering, as the engines of the research team's snowmobiles roar. The camera follows the retreating research team and the collapsing ice towers.
In a sports news studio, the screen behind the sports anchor is showing a basketball game replay.[Sports anchor] sits behind the news desk, tapping his fingers lightly on the table. [Sports anchor, clear and strong voice] says: "Look at this clutch play! He stepped up when it mattered most, hitting the shot that decided the championship! This game-winning shot sealed the victory outright." Background: Cheers from the live game, with the camera focusing on the sports anchor's face.
On a street stage, the audience stands around. [Young rapper] wears a silver chain and a black hoodie, swaying his body to the beat. [Young rapper, dynamic male voice] raps: "Yo, pavement to stage, flow lit, crowd goin’ wild! Mic in my grip, dreams unchained, let the rhythm ride! Raw vibe, sharp rhymes, keep the energy high—this is how we fly, no need to deny! Grind hard, spit fire, make the moment mine, street-born rhythm, let times shine!" The camera focuses on the young Caucasian rapper's movements.
In a cinematic rainy-day café, rain splashes against the window, with a cool, blue-green tone overall. [Blonde French woman] walks in and sits down, her hair slightly damp, gazing directly at the camera. [Blonde French woman, low voice]: "You don't remember the moment, you just remember the feeling." The camera then focuses on a bottle of golden perfume that appears in the center, zooming in on the blonde French woman's face.
Talk Show Tunggal
Sketsa dokumenter, penjelasan e-commerce, highlight reel—kunci bingkai dan biarkan model mengatur narasi, suasana, dan desain suara mikro untuk Anda.

Bercerita Pengisi Suara
Sketsa dokumenter, penjelasan e-commerce, highlight reel—kunci bingkai dan biarkan model mengatur narasi, suasana, dan desain suara mikro untuk Anda.

Dialog Multi-Karakter
Wawancara, sketsa, sitkom—siapa pun yang berbicara akan mendapatkan wajah, suara, dan waktu yang tepat; bertukar peran tanpa saling bicara atau mengeluarkan suara.

Pertunjukan Musik
Sketsa dokumenter, penjelasan e-commerce, highlight reel—kunci bingkai dan biarkan model mengatur narasi, suasana, dan desain suara mikro untuk Anda.

Adegan Hiper-Kreatif
Bisikan ASMR, iklan mengkilap, film pendek art-house—masukkan visual yang mustahil, SFX yang sesuai dengan suasana hati, dan narasi mikro ke dalam prompt yang sama dan saksikan hal-hal nyata menjadi nyata.




Untuk mendapatkan performa terbaik dari Kling 2.6 saat membuat video yang menarik atau berdasarkan musik, perlakukan perintah tersebut seperti skenario miniatur: beri tahu mesin di mana kita berada, siapa yang ada di sana, apa yang mereka lakukan, bagaimana suaranya, dan bagaimana Anda ingin pengambilan gambarnya.
Tetap ikuti urutan dan tanda baca yang ditunjukkan di bawah—Kling 2.6 dilatih dengan sintaksis persis seperti ini.
Adegan (tempat
Generate perfect audio. You can design your prompt with reference to the following solutions.
Jessica, 27, Mikro-Influencer, Austin
Saya mengetik 'sarapan siang di atap yang disinari matahari, [F] “Apakah ini terlalu dini untuk mimosa?” main-main cepat tinggi' dan Kling 2.6 mengeluarkan gulungan di mana avatar saya mendentingkan gelas ke letupan bersoda—bibir terkunci pada setiap suku kata. Diposting pada jam 9 pagi, mencapai 120 ribu penayangan saat makan siang. Sponsor saya ingin DM lebih banyak lagi. Saya benar-benar gemetar.
Marcus, 34, Rapper Indie, Berlin
Mengumpankan batasan “Kecepatan sangat cepat, sajak sangat tajam” menjebak percaya diri, menambahkan latar belakang U-Bahn yang kotor. Kling 2.6 mengembalikan klip di mana diri virtual saya meludah di dalam kereta yang berderak, hi-hat menggetarkan tiang. Meluncurkannya di TikTok—10 ribu streaming pertama dalam satu jam, tanpa studio, tanpa teknisi. Petugas labelku baru saja mengirim pesan: ‘Kami menunda anggaran MV.
Luna, 22, ASMRtist, Montreal
Anjuran burung hutan pinus
Ethan, 41, Pendiri SaaS, San Jose
Diperlukan demo produk oleh EOD. Diketik: “kantor loteng yang terang, [M] “Memotong waktu orientasi menjadi beberapa menit” dengan percaya diri sedang normal,” dimasukkan ke dalam mock-up UI kami. Kling 2.6 mengembalikan panduan—gerakan kursor, suara terdengar, suara mendesing halus di setiap klik. Dewan menyukainya; CAC kami turun 18%.
Chloe
Memberi Kling 2.6 selfie bulan madu di pantai, menambahkan “[Chloe, terkikik] “Kami kawin lari!” [Omar, bangga] “Dan memberimu tempat duduk di pesta setelahnya.” Keluaran: deburan ombak seirama dengan gelak tawanya, kerudungnya berkibar tepat mengikuti irama. Diposting sebagai pengumuman pernikahan kami—Ibu menangis di Michigan, teman-teman mengirim spam emoji hati. Kami merekam kisah cinta kami dengan sandal jepit. Kling 2.6 adalah orang ketiga dalam pernikahan ini, dan kami sangat senang.
Dmitri, 45, Guru Film
Anak saya yang berusia 12 tahun menginginkan film pendek fiksi ilmiah. Kami menulis: “lab garasi neon, [Ayah, bersemangat] “Mulai warp drive!” [SFX: mesin berdebar]. Kling 2.6 menghadirkan mahakarya suar lensa—wajah kita bersinar, suara robot, knalpot menderu-deru di 5.1. Kami menayangkan perdananya di dinding ruang tamu; popcorn di mana-mana.”
Kling 2.6 adalah model difusi audio-video asli pertama di dunia. Ketik satu baris atau unggah satu gambar dan itu akan mengembalikan klip siap siaran berdurasi 5–10 detik di mana ucapan, nyanyian, suara sekitar, dan gerakan di layar yang disinkronkan bibir dikunci bersama—tidak diperlukan rangkaian pengeditan, sesi Foley, atau perekaman ulang.
Setiap fonem, bentuk mulut, dan gestur mikro diprediksi berada dalam ruang laten yang sama dengan soundtracknya. Model ini menandai “hash audio-visual” frame-by-frame sehingga irama, emosi wajah, dan gerakan kamera tidak pernah menyimpang—meskipun Anda mengganti bahasa atau bertukar suara di tengah klip.
Ya.
Gunakan sintaksis skenario mini:
M/F “Garis.”
nada kecepatan emosi “penekanan kamera 15%.”
Kling 2.6 membaca urutan dan tanda baca yang Anda ketik dan menerjemahkannya langsung ke dalam performa—tanpa bingkai utama, tanpa peretasan teknis yang cepat.
Sangat. Beri label pada setiap pembicara atau baris lirik dengan [CN] atau [EN] dan model akan berganti rangkaian fonem secara otomatis, menjaga bentuk bibir, warna aksen, dan skema rima tetap utuh—sempurna untuk iklan lintas pasar atau duet Mandarin-Inggris tanpa sulih suara manual.
Tulislah seperti naskah:
Alex,marah “Bagaimana bisa!”
Sam,calm “Aku mengatakan yang sebenarnya.”
“Lyrics” mengusung pop ceria
Object:door Action:slam SFX:bang
Kling 2.6 menerjemahkan dialog, vokal, dan efek spot dalam satu pass, setiap sumber terisolasi namun terkunci fase—tidak perlu mixing manual.
100%. Setiap render Kling 2.6 hadir dengan lisensi bebas royalti di seluruh dunia—iklan, penawaran klien, dokumen streaming, penjualan kembali, NFT, tanpa biaya tambahan, tanpa perlu atribusi.
