Waiting for your creations!
KLING 2.6 はネイティブのオーディオビデオ モデルです。ワンクリックで、ビジュアルと口パクのナレーション、会話、歌、環境音を組み合わせた 5 ~ 10 秒のクリップが作成されます。ポストプロダクションは必要ありません。 テキストからビデオへのパス、画像からビデオへのパス、中国語と英語の 2 か国語サポート、クレジット ベースの価格モデルにより、ビデオ作成が数時間から数秒に圧縮されます。
On the beach, the waves crash against the shore. [Young Caucasian male] wearing a backward baseball cap, holding a camera and taking a selfie, with a smile at the corner of his mouth. [Young Caucasian male, sunny voice] says: "The weather is amazing today! All my worries feel totally gone. I've been needing a day like this—sun, breeze, just the sound of the waves." The camera is in vlog close-up style.
Visual: In a tidy living room, a white robotic vacuum sits in the center, with no clutter around it. Dialog: [Narrator, soft female voice] accompanied by the gentle sound of vacuuming: "Are you still troubled by dust in hard-to-reach corners? This robotic vacuum features edge-to-edge cleaning, leaving no gaps behind—making your life easier and effortless!" The camera closely follows the vacuum's path as it cleans.
In a bright rehearsal room, sunlight streams through the window, and a standing microphone is placed in the center of the room. [Campus band female lead singer] stands in front of the microphone with her eyes closed, while the other members stand around her. [Campus band female lead singer, full voice] leads: "I will try to fix you, with all my heart and soul..." The background is an a cappella harmony, and the camera slowly circles around the band members.
Visual: In front of an outdoor shopping mall, a crowd gathers, cheering. Dialog: [African-American male reporter] stands next to the crowd, holding a microphone, his body slightly turned. [African-American male reporter, steady voice] says: "Now we can see the atmosphere here is absolutely electric. Let's go check it out together! There's so much happening all at once." Background: Cheerful crowd noises and event BGM, with occasional close-ups of the event.
Visual: On a comedy stage, the spotlight is focused on the center, while the audience remains in the shadows. Dialog: [Stand-up comedian] holds a microphone on stage, slightly swaying his body. [Stand-up comedian, humorous male voice]: "My gym trainer said the first step is the hardest... Lies! The first step is easy. It's the 5,000th step that's trying to murder you!" After finishing, the comedian shrugs and raises his hands. Background: Laughter and applause from the audience, with the camera focused on the comedian's face.
A scene in Antarctica with towering ice formations, the overall tone being a cold, white, frigid color palette. The glacier cracks with a loud noise, followed by the sound of ice shattering, as the engines of the research team's snowmobiles roar. The camera follows the retreating research team and the collapsing ice towers.
In a sports news studio, the screen behind the sports anchor is showing a basketball game replay.[Sports anchor] sits behind the news desk, tapping his fingers lightly on the table. [Sports anchor, clear and strong voice] says: "Look at this clutch play! He stepped up when it mattered most, hitting the shot that decided the championship! This game-winning shot sealed the victory outright." Background: Cheers from the live game, with the camera focusing on the sports anchor's face.
On a street stage, the audience stands around. [Young rapper] wears a silver chain and a black hoodie, swaying his body to the beat. [Young rapper, dynamic male voice] raps: "Yo, pavement to stage, flow lit, crowd goin’ wild! Mic in my grip, dreams unchained, let the rhythm ride! Raw vibe, sharp rhymes, keep the energy high—this is how we fly, no need to deny! Grind hard, spit fire, make the moment mine, street-born rhythm, let times shine!" The camera focuses on the young Caucasian rapper's movements.
In a cinematic rainy-day café, rain splashes against the window, with a cool, blue-green tone overall. [Blonde French woman] walks in and sits down, her hair slightly damp, gazing directly at the camera. [Blonde French woman, low voice]: "You don't remember the moment, you just remember the feeling." The camera then focuses on a bottle of golden perfume that appears in the center, zooming in on the blonde French woman's face.
ドキュメンタリーのビネット、電子商取引の説明、ハイライト リールなど、フレームをロックして、モデルにナレーション、雰囲気、マイクロサウンドのデザインのペースを合わせてもらいます。

ドキュメンタリーのビネット、電子商取引の説明、ハイライト リールなど、フレームをロックして、モデルにナレーション、雰囲気、マイクロサウンドのデザインのペースを合わせてもらいます。

インタビュー、スケッチ、ホームコメディのビートなど、誰が話しても適切な顔、声、タイミングが得られます。 クロストークや声漏れを発生させずに役割を切り替えることができます。

ドキュメンタリーのビネット、電子商取引の説明、ハイライト リールなど、フレームをロックして、モデルにナレーション、雰囲気、マイクロサウンドのデザインのペースを合わせてもらいます。

ASMR のささやき声、光沢のある広告、アートハウスの短編映画など、ありえないビジュアル、ムードにマッチした SFX、マイクロ ナラティブを同じプロンプトに落とし込み、超現実的なものが現実になっていく様子をご覧ください。




トーキングヘッドや音楽主導のビデオを作成するときに Kling 2.6 のパフォーマンスを最大限に引き出すには、プロンプトをミニチュア脚本のように扱います。エンジンに、私たちがどこにいるか、誰がいるか、何をするか、どのように聞こえるか、どのように撮影したいかを伝えます。
以下に示す順序と句読点を厳守してください。Kling 2.6 は、まさにこの構文に基づいてトレーニングされています。
シーン(場所)
Generate perfect audio. You can design your prompt with reference to the following solutions.
ジェシカ、27 歳、マイクロインフルエンサー、オースティン
私は「太陽の光を浴びながら屋上でブランチ、[F] 「ミモザにはまだ早いですか?」と入力しました。 遊び心のある高速ハイ』と Kling 2.6 がリールを吐き出し、私自身のアバターがグラスをカチャカチャと炭酸音に合わせて鳴らし、唇をすべての音節に固定しました。 午前9時に投稿され、昼までに12万回の再生回数に達した。 私のスポンサーのDMは「もっとお願いします。文字通り震えています。」
マーカス、34 歳、インディーズラッパー、ベルリン
「スピードはとても速く、韻はとても鋭く」という自信に満ちたトラップをバーに送り込み、汚れたUバーンの背景を追加しました。 Kling 2.6 は、カタカタ音を立てる馬車の中で仮想の自分が唾を吐き、ハイハットがポールをカタカタ音を立てているクリップを返してくれました。 それを TikTok にドロップしました。最初は 1 時間で 10,000 ストリーム、スタジオもエンジニアもいませんでした。 私のレーベル担当者が、「MVの予算を棚上げしています。」とメールを送りました。
ルナ、22 歳、ASMRtist、モントリオール
促された松林の鳥
イーサン、41 歳、SaaS 創設者、サンノゼ
EOD による製品デモが必要でした。 UI モックアップには、「明るいロフトのオフィス、[M] 「オンボーディング時間を数分に短縮」自信がある、中程度の標準」と入力されました。 Kling 2.6 では、カーソルの移動、音声の着地、クリックするたびにかすかにヒューという音などのウォークスルーが返されました。 ボードはそれを気に入りました。 CAC は 18% 減少しました。
クロエ
クリング 2.6 にビーチでの新婚旅行の自撮り写真を送り、「[クロエ、笑いながら]「私たちは駆け落ちしたのよ!」と付け加えた。 [オマール、誇らしげに] 「それで、二次会の席を取ってくれたんです。」 出力: 笑い声のリズムに合わせて波が打ち寄せ、ビートに合わせて彼女のベールがはためきます。 私たちの結婚のお知らせとして投稿されました。母はミシガン州で泣き、友人たちはハートの絵文字をスパムしました。 私たちはビーチサンダルでラブストーリーを撮影しました。 クリング 2.6 はこの結婚の 3 人目であり、私たちは興奮しています。
ドミトリ、45 歳、映画教師
私の12歳の子供はSF短編を望んでいた。 私たちはこう書きました:「ネオンガレージラボ、[お父さん、興奮して]「ワープドライブを開始します!」 [SFX: 轟音エンジン]。 Kling 2.6 は、レンズ フレアの傑作をレンダリングしました。5.1 では、顔が光り、声がロボットのようで、排気音がヒューヒュー音を立てます。 私たちはそれをリビングルームの壁に初公開しました。 どこにでもあるポップコーン。」
Kling 2.6 は、世界初のネイティブ オーディオビデオ拡散モデルです。 1 行入力するか、1 つの画像をアップロードすると、口パクのスピーチ、歌、環境音、画面上の動きがロックされた 5 ~ 10 秒のブロードキャスト対応クリップが返されます。編集スイート、フォーリー セッション、再録音は必要ありません。
すべての音素、口の形、マイクロジェスチャーは、サウンドトラックと同じ潜在空間で予測されます。 モデルはフレームごとの「オーディオビジュアルハッシュ」をスタンプするため、クリップの途中で言語を切り替えたり、音声を交換したりしても、リズム、顔の感情、カメラの動きがドリフトすることはありません。
はい。
ミニ脚本の構文を使用します:
M/F “Line”。
感情スピードピッチ「カメラ押し込み15%」。
Kling 2.6 は、入力された順序と句読点を読み取り、それをパフォーマンスに直接変換します。キーフレームや迅速なエンジニアリング ハックは必要ありません。
絶対に。 各スピーカーまたは歌詞ラインに [CN] または [EN] のラベルを付けると、モデルは音素セットを自動的に切り替え、唇の形状、アクセントカラー、韻体系をそのまま維持します。手動吹き替えを行わずに、クロスマーケット広告や中国語と英語のデュエットに最適です。
台本のように書いてください:
アレックス、怒っています「どうしてですか!」
Sam,calm 「私は真実を話しました。」
楽しいポップを謳う「歌詞」
オブジェクト:ドア アクション:スラム SFX:バン
Kling 2.6 は、セリフ、ボーカル、スポット エフェクトを 1 回のパスでレンダリングし、各ソースは分離されていますがフェーズ ロックされており、手動でミキシングする必要はありません。
100%。 すべての Kling 2.6 レンダリングには、広告、クライアントへの提案、ストリーミング ドキュメント、再販、NFT など、追加料金や帰属表示の必要がない、世界規模のロイヤルティ フリー ライセンスが付属しています。
