Waiting for your creations!
KLING 2.6은 기본 오디오-비디오 모델입니다. 한 번의 클릭으로 영상과 립싱크 내레이션, 대화, 노래, 주변 소리가 결합된 5~10초 길이의 클립이 생성되며, 후반 작업이 필요하지 않습니다. 텍스트-비디오 및 이미지-비디오 경로, 중국어-영어 이중 언어 지원, 크레딧 기반 가격 모델을 통해 비디오 제작을 몇 시간에서 몇 초로 단축합니다.
On the beach, the waves crash against the shore. [Young Caucasian male] wearing a backward baseball cap, holding a camera and taking a selfie, with a smile at the corner of his mouth. [Young Caucasian male, sunny voice] says: "The weather is amazing today! All my worries feel totally gone. I've been needing a day like this—sun, breeze, just the sound of the waves." The camera is in vlog close-up style.
Visual: In a tidy living room, a white robotic vacuum sits in the center, with no clutter around it. Dialog: [Narrator, soft female voice] accompanied by the gentle sound of vacuuming: "Are you still troubled by dust in hard-to-reach corners? This robotic vacuum features edge-to-edge cleaning, leaving no gaps behind—making your life easier and effortless!" The camera closely follows the vacuum's path as it cleans.
In a bright rehearsal room, sunlight streams through the window, and a standing microphone is placed in the center of the room. [Campus band female lead singer] stands in front of the microphone with her eyes closed, while the other members stand around her. [Campus band female lead singer, full voice] leads: "I will try to fix you, with all my heart and soul..." The background is an a cappella harmony, and the camera slowly circles around the band members.
Visual: In front of an outdoor shopping mall, a crowd gathers, cheering. Dialog: [African-American male reporter] stands next to the crowd, holding a microphone, his body slightly turned. [African-American male reporter, steady voice] says: "Now we can see the atmosphere here is absolutely electric. Let's go check it out together! There's so much happening all at once." Background: Cheerful crowd noises and event BGM, with occasional close-ups of the event.
Visual: On a comedy stage, the spotlight is focused on the center, while the audience remains in the shadows. Dialog: [Stand-up comedian] holds a microphone on stage, slightly swaying his body. [Stand-up comedian, humorous male voice]: "My gym trainer said the first step is the hardest... Lies! The first step is easy. It's the 5,000th step that's trying to murder you!" After finishing, the comedian shrugs and raises his hands. Background: Laughter and applause from the audience, with the camera focused on the comedian's face.
A scene in Antarctica with towering ice formations, the overall tone being a cold, white, frigid color palette. The glacier cracks with a loud noise, followed by the sound of ice shattering, as the engines of the research team's snowmobiles roar. The camera follows the retreating research team and the collapsing ice towers.
In a sports news studio, the screen behind the sports anchor is showing a basketball game replay.[Sports anchor] sits behind the news desk, tapping his fingers lightly on the table. [Sports anchor, clear and strong voice] says: "Look at this clutch play! He stepped up when it mattered most, hitting the shot that decided the championship! This game-winning shot sealed the victory outright." Background: Cheers from the live game, with the camera focusing on the sports anchor's face.
On a street stage, the audience stands around. [Young rapper] wears a silver chain and a black hoodie, swaying his body to the beat. [Young rapper, dynamic male voice] raps: "Yo, pavement to stage, flow lit, crowd goin’ wild! Mic in my grip, dreams unchained, let the rhythm ride! Raw vibe, sharp rhymes, keep the energy high—this is how we fly, no need to deny! Grind hard, spit fire, make the moment mine, street-born rhythm, let times shine!" The camera focuses on the young Caucasian rapper's movements.
In a cinematic rainy-day café, rain splashes against the window, with a cool, blue-green tone overall. [Blonde French woman] walks in and sits down, her hair slightly damp, gazing directly at the camera. [Blonde French woman, low voice]: "You don't remember the moment, you just remember the feeling." The camera then focuses on a bottle of golden perfume that appears in the center, zooming in on the blonde French woman's face.
솔로 토크쇼
다큐멘터리 삽화, 전자 상거래 설명, 하이라이트 릴 등 프레임을 고정하고 모델이 내레이션, 분위기 및 마이크로 사운드 디자인을 조정하도록 합니다.

음성 해설 스토리텔링
다큐멘터리 삽화, 전자 상거래 설명, 하이라이트 릴 등 프레임을 고정하고 모델이 내레이션, 분위기 및 마이크로 사운드 디자인을 조정하도록 합니다.

다중 문자 대화
인터뷰, 스케치, 시트콤 비트 등 누구든지 말하는 사람이 올바른 얼굴, 목소리 및 타이밍을 얻습니다. 혼선이나 음성 유출 없이 역할을 전환할 수 있습니다.

음악 공연
다큐멘터리 삽화, 전자 상거래 설명, 하이라이트 릴 등 프레임을 고정하고 모델이 내레이션, 분위기 및 마이크로 사운드 디자인을 조정하도록 합니다.

매우 창의적인 장면
ASMR 속삭임, 화려한 광고, 아트하우스 단편 등 불가능한 시각적 요소, 분위기에 맞는 SFX 및 마이크로 내러티브를 동일한 프롬프트에 넣고 초현실적인 것이 현실이 되는 것을 지켜보세요.




말하는 사람이나 음악 중심의 동영상을 만들 때 Kling 2.6에서 최상의 성능을 얻으려면 프롬프트를 미니어처 시나리오처럼 처리하십시오. 즉, 우리가 어디에 있는지, 누가 있는지, 그들이 무엇을 하는지, 어떻게 소리를 내는지, 어떻게 촬영할지를 엔진에 알려줍니다.
아래에 표시된 순서와 구두점을 따르십시오. Kling 2.6은 정확히 이 구문에 대해 훈련되었습니다.
장면(장소
Generate perfect audio. You can design your prompt with reference to the following solutions.
Jessica, 27세, 오스틴 마이크로 인플루언서
나는 '햇빛이 내리쬐는 루프탑 브런치'를 입력했다. [F] “미모사를 먹기엔 너무 이른 걸까?” 장난스럽고 빠른 높이' 그리고 Kling 2.6은 내 아바타가 안경을 찰칵 소리를 내며 탄산 팝 소리를 내는 릴을 내뱉었습니다. 입술은 모든 음절에 잠겨 있습니다. 오전 9시에 게시되었으며 점심까지 조회수 120,000회를 기록했습니다. 내 스폰서 DM이 '더 많이 주세요. 말 그대로 떨립니다.
마커스(34세), 인디 랩퍼, 베를린
바에 "속도가 너무 빠르고, 운율이 너무 날카로워" 트랩이 자신감을 갖고 지저분한 U-Bahn 배경을 추가했습니다. Kling 2.6은 내 가상의 자아가 덜거덕거리는 마차 안에서 침을 뱉고 하이햇이 기둥을 덜거덕거리는 장면을 담은 클립을 돌려주었습니다. TikTok에 올렸습니다. 한 시간 안에 처음 10,000개 스트리밍이 가능하며 스튜디오도 엔지니어도 없습니다. 방금 내 소속사 담당자가 문자를 보냈습니다. 'MV 예산을 보류하겠습니다.
Luna, 22세, ASMRtist, 몬트리올
소나무 숲의 새들에게 물어보니
Ethan, 41세, SaaS 창립자, San Jose
EOD의 제품 데모가 필요했습니다. 입력: "밝은 로프트 사무실, [M] "온보딩 시간을 몇 분으로 단축" 자신감 있는 중간 보통"이 UI 모형에 포함되었습니다. Kling 2.6은 커서 이동, 음성 착지, 클릭할 때마다 미묘한 쉭쉭 소리 등의 워크스루 기능을 반환했습니다. 이사회는 그것을 좋아했습니다. CAC는 18% 하락했습니다.
클로이
Kling 2.6에게 해변에서 신혼여행 셀카를 주고 "[클로이, 낄낄거림]"우리는 웅변을 했습니다!"라고 덧붙였습니다. [오마르, 자랑스러워] "그리고 애프터 파티 자리도 마련해 줬어요." 결과: 파도는 웃음소리와 함께 리듬에 맞춰 부서지고, 그녀의 베일은 박자에 맞춰 펄럭입니다. 우리 결혼 발표로 게시됨 - 미시간에서 엄마가 울었고 친구들이 하트 이모티콘을 스팸으로 보냈습니다. 우리는 슬리퍼를 신고 러브 스토리를 촬영했습니다. 클링 2.6은 이 결혼의 세 번째 사람이고 우리는 매우 기쁩니다.
드미트리(45세), 영화 교사
내 12살짜리 아이는 SF 단편영화를 원했습니다. 우리는 이렇게 썼습니다: “네온 차고 연구실, [아빠, 신난다]” “워프 드라이브 시작!” [SFX: 윙윙거리는 엔진]. Kling 2.6은 렌즈 플레어 걸작을 렌더링했습니다. 5.1에서는 얼굴이 빛나고, 목소리가 로봇처럼 들리고, 배기음이 쉭쉭 소리를 냈습니다. 우리는 그것을 거실 벽에 초연했습니다. 팝콘은 어디에나 있어요.”
Kling 2.6은 세계 최초의 기본 오디오-비디오 확산 모델입니다. 한 줄을 입력하거나 이미지 한 개를 업로드하면 립싱크된 음성, 노래, 주변 소리 및 화면 동작이 함께 고정된 5~10초 분량의 방송용 클립이 반환됩니다. 편집실, 폴리 세션 또는 재녹음이 필요하지 않습니다.
모든 음소, 입 모양 및 미세한 제스처는 사운드트랙과 동일한 잠재 공간에서 예측됩니다. 모델은 프레임별로 "시각적 해시"를 스탬프 처리하므로 클립 중간에 언어를 바꾸거나 음성을 바꾸더라도 케이던스, 얼굴 감정 및 카메라 움직임이 표류하지 않습니다.
예.
미니 시나리오 구문을 사용하세요:
M/F “Line.”
감정 속도 피치 "카메라 푸시인 15%."
Kling 2.6은 사용자가 입력하는 순서와 구두점을 읽고 이를 곧바로 성능으로 변환합니다. 키프레임도 없고 즉각적인 엔지니어링 해킹도 없습니다.
전적으로. 각 화자 또는 가사 대사에 [CN] 또는 [EN] 라벨을 붙이면 모델이 음소 세트를 자동으로 전환하여 입술 모양, 악센트 색상 및 운율 체계를 그대로 유지합니다. 수동 더빙 없이 크로스 마켓 광고 또는 중국어-영어 듀엣에 적합합니다.
스크립트처럼 작성하세요.
Alex,화가 나서 “어떻게 그럴 수가 있어!”
Sam,calm “진실을 말했습니다.”
즐거운 팝송을 울리는 “가사”
Object:door Action:slam SFX:bang
Kling 2.6은 단일 패스로 대화, 보컬 및 스팟 효과를 렌더링하며, 각 소스는 분리되었지만 위상 고정되어 있어 수동 믹싱이 필요하지 않습니다.
100%. 모든 Kling 2.6 렌더링에는 광고, 클라이언트 프레젠테이션, 스트리밍 문서, 재판매, NFT, 추가 비용 없음, 저작자 표시가 필요하지 않은 전 세계 로열티 프리 라이선스가 함께 제공됩니다.
