
分享一個故事,也是12月份我陸陸續(xù)續(xù)用業(yè)余時間研究的一個AI視頻生成案例。
故事是這樣的,好友超哥一個月前問我:
有沒有辦法用AI做一個幾分鐘長度的雙人對話交流視頻,幫助宣傳他的企業(yè),這樣他就節(jié)省了大量拍攝和找演員的時間,可以低成本做推廣了。
這個場景同樣可運用在訪談類節(jié)目、相聲節(jié)目等場景。
但是他試過Sora2,生成15秒的雙人對話是沒啥問題,可是就是因為時長的限制,第二次想要同樣保持同樣的人物一致性、場景一致性就容易出問題。
超哥說:“如果把這個問題克服了,那解決的問題就太多了。這個社會上很多問題都能得到迎刃而解。”
我根據(jù)我的認知,估摸著應(yīng)該沒啥問題,也沒多想,一口就答應(yīng)超哥做個效果出來。
可是在實操過程中,卻發(fā)現(xiàn)現(xiàn)有的各大主流工具上,做單人視頻都挺OK,一旦要雙人穩(wěn)定地不切鏡頭,交替說話的這種,都認栽了。
這就有點愧對超哥的信任了,正在一籌莫展的時候,無意間看到了一款A(yù)I工具,竟然可以完美地解決這個問題。
比如可以絲滑地做出訪談類節(jié)目,大幅減少企業(yè)主的營銷費用:

視頻里提到的陜西恒信檢測就是超哥的公司,非常Nice的老板。
還比如做這種相聲節(jié)目場景,只要有搞笑相聲劇本,你自己就可以將相聲藝術(shù)發(fā)揚光大:
我所有的擔心點,這個工具都幫我解決好了。
接下來我無償分享下面這個教程給你,也希望你用好這個工具,做出有創(chuàng)意的節(jié)目,且行好事。
登錄網(wǎng)址?https://x2v.light-ai.top/
目前都是可以免費使用的。
你也看到了還有很有其他生成視頻、生成圖片的功能,咱們先按下不表。
我們先選擇數(shù)字人模式。

左邊圖片區(qū)上傳圖片,注意,如果是希望做雙人視頻,就一定要上傳一張帶有兩個人的圖片。

然后再選擇“多角色模式”,并添加角色。

選擇角色人物所在的區(qū)域,一次圈住一個人。兩個人就添加兩次。
接下來是配音,支持文本轉(zhuǎn)音頻、雙人播客、上傳音頻、直接錄音等方式。
文本轉(zhuǎn)音頻我看了下,比較適合單人配音,多人還是不太方便。
不過雙人播客這個就很適合了,只要把你的口播對話腳本粘貼到下面的文字框中,再生成播客就可以了。
不過,目前根據(jù)音色判斷,他們也是調(diào)用了豆包的AI播客api,只支持固定男女音色,所以如果你想要兩位男士的聲音,只能移步到扣子空間的播客功能中,有兩種雙人音色可選。

坐等生成完成,就可以下載音頻到本地。

返回主頁,回過來再上傳這個音頻到剛才界面上。上傳之后要等個幾分鐘,這里會進行多角色模式的自動音頻分割,我發(fā)現(xiàn)如果雙人是一男一女,分割聲音比較容易。如果兩個男聲差別不太大的情況下,有可能把A的部分聲音分給了B。

分割好了之后,兩段音色播放時就可以聽出來,每段只保留了一個人聲,要注意聽一下,如果女角色播的是男聲,要自己拖動一下音色塊,與另一個對調(diào)下。

這些做好之后,再寫一個提示詞,確定你想要的討論風格:

最后點擊生成視頻,等待幾分鐘就出來了。
在找到這個工具之前,我也試過了不少其他工具。包括Sora2。
Sora2雖然支持創(chuàng)建角色功能,可以保持人物的一致性,但是場景無法保證一致,再加上一次只能生成15秒,所以多個視頻組合起來就露餡了。

也是過號稱專攻數(shù)字人視頻生成很厲害的gaga.art,但是看到女主播嘴巴都不咋動,我就放棄了。

甚至還有擅長場景、人物一致性都包圓的Vidu Q2,看著場景圖片和人物圖片都可以上傳,我原本還是挺期待的:

但是結(jié)果實在拉胯,場景、人物雖然可以保證不錯,但是口唇同步咋就不做好呢?
不過好在,我們還有LightX2V這款免費工具。
AI的意義,從來不是取代人類,而是讓那些被遺忘的聲音被聽見,讓那些被忽略的故事被看見。
當小企業(yè)主不必為營銷費用發(fā)愁,當遠方的親人能跨越時空對話,當瀕危的文化在數(shù)字世界重生。
我才真正理解,為什么超哥說"這個社會上很多問題都能迎刃而解"。
愿我們創(chuàng)造的技術(shù),
永遠服務(wù)于人們心中最柔軟的渴望,
被理解,被記住,被深愛。
如果你對我的系列文章感興趣,歡迎點贊和關(guān)注~感謝支持!?( ′???` )比心。