Waiting for your creations!
KLING 2.6 là mô hình âm thanh-video gốc: một cú nhấp chuột sẽ tạo ra một clip dài 5–10 giây kết hợp hình ảnh với tường thuật, hội thoại, ca hát và âm thanh xung quanh được đồng bộ hóa môi—không cần hậu kỳ. Đường dẫn chuyển văn bản thành video và hình ảnh thành video, hỗ trợ song ngữ Trung-Anh và mô hình định giá dựa trên tín dụng nén quá trình tạo video từ hàng giờ xuống còn vài giây.
On the beach, the waves crash against the shore. [Young Caucasian male] wearing a backward baseball cap, holding a camera and taking a selfie, with a smile at the corner of his mouth. [Young Caucasian male, sunny voice] says: "The weather is amazing today! All my worries feel totally gone. I've been needing a day like this—sun, breeze, just the sound of the waves." The camera is in vlog close-up style.
Visual: In a tidy living room, a white robotic vacuum sits in the center, with no clutter around it. Dialog: [Narrator, soft female voice] accompanied by the gentle sound of vacuuming: "Are you still troubled by dust in hard-to-reach corners? This robotic vacuum features edge-to-edge cleaning, leaving no gaps behind—making your life easier and effortless!" The camera closely follows the vacuum's path as it cleans.
In a bright rehearsal room, sunlight streams through the window, and a standing microphone is placed in the center of the room. [Campus band female lead singer] stands in front of the microphone with her eyes closed, while the other members stand around her. [Campus band female lead singer, full voice] leads: "I will try to fix you, with all my heart and soul..." The background is an a cappella harmony, and the camera slowly circles around the band members.
Visual: In front of an outdoor shopping mall, a crowd gathers, cheering. Dialog: [African-American male reporter] stands next to the crowd, holding a microphone, his body slightly turned. [African-American male reporter, steady voice] says: "Now we can see the atmosphere here is absolutely electric. Let's go check it out together! There's so much happening all at once." Background: Cheerful crowd noises and event BGM, with occasional close-ups of the event.
Visual: On a comedy stage, the spotlight is focused on the center, while the audience remains in the shadows. Dialog: [Stand-up comedian] holds a microphone on stage, slightly swaying his body. [Stand-up comedian, humorous male voice]: "My gym trainer said the first step is the hardest... Lies! The first step is easy. It's the 5,000th step that's trying to murder you!" After finishing, the comedian shrugs and raises his hands. Background: Laughter and applause from the audience, with the camera focused on the comedian's face.
A scene in Antarctica with towering ice formations, the overall tone being a cold, white, frigid color palette. The glacier cracks with a loud noise, followed by the sound of ice shattering, as the engines of the research team's snowmobiles roar. The camera follows the retreating research team and the collapsing ice towers.
In a sports news studio, the screen behind the sports anchor is showing a basketball game replay.[Sports anchor] sits behind the news desk, tapping his fingers lightly on the table. [Sports anchor, clear and strong voice] says: "Look at this clutch play! He stepped up when it mattered most, hitting the shot that decided the championship! This game-winning shot sealed the victory outright." Background: Cheers from the live game, with the camera focusing on the sports anchor's face.
On a street stage, the audience stands around. [Young rapper] wears a silver chain and a black hoodie, swaying his body to the beat. [Young rapper, dynamic male voice] raps: "Yo, pavement to stage, flow lit, crowd goin’ wild! Mic in my grip, dreams unchained, let the rhythm ride! Raw vibe, sharp rhymes, keep the energy high—this is how we fly, no need to deny! Grind hard, spit fire, make the moment mine, street-born rhythm, let times shine!" The camera focuses on the young Caucasian rapper's movements.
In a cinematic rainy-day café, rain splashes against the window, with a cool, blue-green tone overall. [Blonde French woman] walks in and sits down, her hair slightly damp, gazing directly at the camera. [Blonde French woman, low voice]: "You don't remember the moment, you just remember the feeling." The camera then focuses on a bottle of golden perfume that appears in the center, zooming in on the blonde French woman's face.
Talk-Show một mình
Đoạn phim tài liệu, phần giải thích về thương mại điện tử, đoạn phim nổi bật—khóa khung hình và để mô hình tăng tốc tường thuật, không khí và thiết kế âm thanh vi mô cho bạn.

Kể chuyện bằng giọng nói
Đoạn phim tài liệu, phần giải thích về thương mại điện tử, đoạn phim nổi bật—khóa khung hình và để mô hình tăng tốc tường thuật, không khí và thiết kế âm thanh vi mô cho bạn.

Đối thoại nhiều nhân vật
Các cuộc phỏng vấn, phác thảo, phim sitcom—bất cứ ai nói sẽ có khuôn mặt, giọng nói và thời điểm phù hợp; chuyển đổi vai trò mà không có tình trạng nói chuyện chéo hoặc chảy máu giọng nói.

Biểu diễn âm nhạc
Đoạn phim tài liệu, phần giải thích về thương mại điện tử, đoạn phim nổi bật—khóa khung hình và để mô hình tăng tốc tường thuật, không khí và thiết kế âm thanh vi mô cho bạn.

Cảnh siêu sáng tạo
Những lời thì thầm của ASMR, những quảng cáo hào nhoáng, những bộ phim ngắn đậm chất nghệ thuật—thả những hình ảnh không tưởng, SFX phù hợp với tâm trạng và câu chuyện vi mô vào cùng một lời nhắc và xem điều siêu thực trở thành hiện thực.




Để có được hiệu suất tốt nhất từ Kling 2.6 khi tạo video có đầu người biết nói hoặc video có nhạc, hãy coi lời nhắc giống như một kịch bản phim thu nhỏ: cho công cụ biết chúng ta đang ở đâu, ai ở đó, họ làm gì, âm thanh của họ như thế nào và bạn muốn quay video như thế nào.
Hãy tuân thủ thứ tự và dấu câu hiển thị bên dưới—Kling 2.6 đã được đào tạo chính xác về cú pháp này.
Cảnh (địa điểm
Generate perfect audio. You can design your prompt with reference to the following solutions.
Jessica, 27, Người có ảnh hưởng vi mô, Austin
Tôi gõ 'bữa sáng muộn trên sân thượng ngập nắng, [F] "Có quá sớm để ăn mimosa không?" vui tươi nhanh chóng' và Kling 2.6 phun ra một cuộn phim trong đó hình đại diện của chính tôi cụng ly thành một tiếng bốp sủi bọt — đôi môi khóa chặt vào từng âm tiết. Đăng lúc 9h sáng, trưa đạt 120k view. Làm ơn, nhà tài trợ của tôi, sẽ gửi thêm những thứ đó nữa. Tôi thực sự đang run rẩy.
Marcus, 34, Rapper Indie, Berlin
Fed thanh “Tốc độ quá nhanh, vần rất sắc nét” bẫy tự tin, thêm một bối cảnh U-Bahn cáu bẩn. Kling 2.6 đã trả lại cho tôi một đoạn clip trong đó bản thân ảo của tôi lao vào bên trong một cỗ xe lạch cạch, những chiếc mũ hi hi làm rung chuyển các cột điện. Đã bỏ nó trên TikTok—10 nghìn luồng đầu tiên sau một giờ, không có studio, không có kỹ sư. Anh chàng công ty của tôi vừa nhắn tin: 'Chúng tôi đang tạm dừng kinh phí làm MV.
Luna, 22, ASMRtist, Montréal
Nhắc nhở chim rừng thông
Ethan, 41 tuổi, Người sáng lập SaaS, San Jose
Cần bản demo sản phẩm của EOD. Đã nhập: “văn phòng gác xép sáng sủa, [M] “Giảm thời gian giới thiệu xuống còn vài phút” tự tin ở mức trung bình bình thường,” xuất hiện trong mô hình giao diện người dùng của chúng tôi. Kling 2.6 đã trả lại một hướng dẫn cụ thể—di chuyển con trỏ, hạ cánh bằng giọng nói, tiếng vù vù tinh tế trên mỗi cú nhấp chuột. Board yêu thích nó; CAC của chúng tôi giảm 18%.
Chloe
Đã cho Kling 2.6 một bức ảnh selfie trong tuần trăng mật trên bãi biển, nói thêm “[Chloe, cười khúc khích] “Chúng tôi đã bỏ trốn!” [Omar, tự hào] “Và đã giúp bạn có được một chỗ ngồi ở bữa tiệc sau đó.” Đầu ra: những con sóng vỗ vào theo nhịp với tiếng cười của chúng, tấm màn che của cô ấy tung bay đúng nhịp. Được đăng làm thông báo về đám cưới của chúng tôi—Mẹ đã khóc ở Michigan, bạn bè gửi spam biểu tượng cảm xúc hình trái tim. Chúng tôi quay câu chuyện tình yêu của mình bằng đôi dép xỏ ngón. Kling 2.6 là người thứ ba trong cuộc hôn nhân này và chúng tôi rất vui mừng.
Dmitri, 45 tuổi, Giáo viên Điện ảnh
Đứa con 12 tuổi của tôi muốn xem một bộ phim ngắn khoa học viễn tưởng. Chúng tôi đã viết: “phòng thí nghiệm trong ga ra đèn neon, [Bố, hào hứng] “Bắt đầu lái xe dọc!” [SFX: động cơ đập mạnh]. Kling 2.6 đã tạo nên một kiệt tác về ống kính lóa—khuôn mặt của chúng tôi bừng sáng, giọng nói như robot, tiếng rít của khí thải trong 5.1. Chúng tôi đã công chiếu nó trên tường phòng khách; bỏng ngô ở khắp mọi nơi.”
Kling 2.6 là mô hình khuếch tán âm thanh-video gốc đầu tiên trên thế giới. Nhập một dòng hoặc tải lên một hình ảnh và nó sẽ trả về một clip dài 5–10 giây, sẵn sàng phát sóng, trong đó lời nói, giọng hát, âm thanh xung quanh và chuyển động trên màn hình được khóa cùng nhau—không cần bộ chỉnh sửa, phiên Foley hoặc ghi âm lại.
Mọi âm vị, hình dáng miệng và cử chỉ vi mô đều được dự đoán trong cùng một không gian tiềm ẩn với nhạc nền. Mô hình này đóng dấu “băm âm thanh-hình ảnh” theo từng khung hình để nhịp điệu, cảm xúc khuôn mặt và chuyển động của camera không bao giờ bị lệch—ngay cả khi bạn chuyển đổi ngôn ngữ hoặc hoán đổi giọng nói ở giữa clip.
Đúng.
Sử dụng cú pháp kịch bản phim nhỏ:
M/F “Line”.
tốc độ cảm xúc cao độ “máy ảnh đẩy vào 15 %.”
Kling 2.6 đọc thứ tự và dấu câu bạn nhập và chuyển thẳng thành hiệu suất—không có khung hình chính, không có thủ thuật kỹ thuật nhanh chóng.
Tuyệt đối. Gắn nhãn cho mỗi người nói hoặc dòng lời bài hát bằng [CN] hoặc [EN] và mô hình sẽ tự động chuyển đổi bộ âm vị, giữ nguyên hình dạng môi, màu nhấn và sơ đồ vần—hoàn hảo cho các quảng cáo trên nhiều thị trường hoặc song ca Trung-Anh mà không cần lồng tiếng thủ công.
Viết nó như một kịch bản:
Alex,tức giận "Sao bạn có thể!"
Sam,bình tĩnh “Tôi đã nói sự thật.”
“Lời bài hát” mang âm hưởng nhạc pop vui tươi
Object:door Action:slam SFX:bang
Kling 2.6 kết xuất hội thoại, giọng hát và hiệu ứng tại chỗ trong một lần truyền, mỗi nguồn được tách biệt nhưng bị khóa pha—không cần trộn thủ công.
100 %. Mỗi kết xuất Kling 2.6 đều đi kèm với giấy phép miễn phí bản quyền trên toàn thế giới—quảng cáo, quảng cáo chiêu hàng của khách hàng, tài liệu phát trực tuyến, bán lại, NFT, không tính thêm phí, không cần ghi công.
