短視頻查重機(jī)制及去重方法

2020年,各大短視頻很?chē)?yán)厲的一年,如3月份開(kāi)始,無(wú)論是抖音里的影視號(hào)大批量的提醒搬運(yùn)或者封號(hào),還是從油管搬運(yùn)視頻過(guò)來(lái),不經(jīng)過(guò)視頻去重處理,都會(huì)收到提醒。

很多人說(shuō)如今只能原創(chuàng)了,姑且先不說(shuō)是否大家都有精力原創(chuàng),就是為什么別人能順利的搬運(yùn)呢?這里還是存在技術(shù)因素的。我可以明確的說(shuō),不是靠軟件,而是深度“洗視頻”技術(shù)。

首先說(shuō)明一點(diǎn),網(wǎng)上說(shuō)的改md5,修改幀率,加濾鏡等操作,一點(diǎn)用也沒(méi)有,大家不要被騙了。
md5的檢測(cè),可以說(shuō)的最基礎(chǔ)的一項(xiàng)檢查了,一個(gè)視頻幾十兆,就算是改了一個(gè)字節(jié)的數(shù)據(jù),md5就完全不同,現(xiàn)在平臺(tái)的視頻的重復(fù)檢測(cè)都是多個(gè)維度的檢查,光是改md5沒(méi)用,對(duì)視頻做任何的操作,md5都會(huì)發(fā)生改變,根本沒(méi)必要單獨(dú)拎出來(lái)說(shuō)這一點(diǎn)。再說(shuō)幀率,一般視頻幀率在30到60之間,改這個(gè)意義不是很大,改幀率的最大作用的有些平臺(tái)需要指定60fps, 如果低于這個(gè)數(shù)就沒(méi)法發(fā)布,那么就需要修改幀率。再說(shuō)濾鏡,無(wú)非就是修改了色值,效果跟改md5差不多,如果抽幀檢測(cè)加不加濾鏡效果是一樣的。如果只改這幾項(xiàng)肯定是沒(méi)用的

平臺(tái)查重機(jī)制

下面說(shuō)一說(shuō)平臺(tái)是怎么檢測(cè)視頻重復(fù)的。知道了平臺(tái)檢測(cè)的機(jī)制也就能知道怎么做到去重。
平臺(tái)應(yīng)該會(huì)先檢查md5, 因?yàn)檫@個(gè)檢查是最快的。

然后平臺(tái)會(huì)從視頻的標(biāo)題,描述,標(biāo)簽,封面,時(shí)長(zhǎng),分辨率,bgm等信息先進(jìn)行檢查,篩選出一些可能重復(fù)的視頻,然后重點(diǎn)檢測(cè)。這些屬性的重復(fù)檢測(cè)都是很簡(jiǎn)單的。

然后你要知道,以目前的技術(shù),視頻沒(méi)法直接對(duì)比是否一樣或者很像,除非是人工檢查,但是可以對(duì)比圖片的相似度,而且簡(jiǎn)單快速,所以比較兩個(gè)視頻的相似度其實(shí)就是圖片的對(duì)比。
平臺(tái)會(huì)把視頻的片頭幾秒抽出幾幀,然后片尾幾秒抽出幾幀,然后中間抽出若干幀進(jìn)行對(duì)比。如果畫(huà)面改動(dòng)很小,那么圖片的對(duì)比基本也是一致的。這個(gè)我這里大概說(shuō)一下原理,實(shí)際的檢測(cè)肯定更為復(fù)雜。

好了,現(xiàn)在知道了檢測(cè)的原理,那么要達(dá)到去重也就很簡(jiǎn)單了,下面詳細(xì)說(shuō)一說(shuō)如何去重,然后舉幾個(gè)例子。不同類(lèi)型的視頻去重方式也略有不同

第一個(gè)維度-視頻外在信息

視頻信息大致包括以下幾點(diǎn)

  • 標(biāo)題 很關(guān)鍵
  • 描述 很關(guān)鍵
  • 標(biāo)簽 關(guān)鍵
  • 封面 很關(guān)鍵

以上3個(gè)很關(guān)鍵的都修改了,這一維度的信息修改就算是過(guò)關(guān)了

第二個(gè)維度-視頻自身信息

以下幾點(diǎn)不是每一項(xiàng)都必須,后面會(huì)舉例說(shuō)明

  1. 尋找素材很關(guān)鍵,盡量不要找已經(jīng)是很火的素材。
  2. 如果原視頻有片頭片尾和水印,肯定要去除
  3. 通過(guò)添加片頭片尾的形式(或者其他方式),跟原視頻的長(zhǎng)度不要相同
  4. 添加自己的文字或logo
  5. 修改分辨率
  6. 改變畫(huà)面
  7. 修改bgm

上面7點(diǎn)是比較重要的,其他不是很重要的這里就不列舉了。
不管是什么類(lèi)型的視頻,第一點(diǎn)和第二點(diǎn)都要保證。

例子

一般的視頻搬運(yùn),做到1,2,4,6,7就足夠了,比如下面這個(gè)例子

原視頻


20200527121809

修改后的視頻


vlcsnap-2020-05-27-12h17m33s393

這種是完全改變了畫(huà)面的,兩張圖片的相似度不到0.1 ,避過(guò)平臺(tái)的檢測(cè)完全沒(méi)問(wèn)題。

包括下面這種 (左邊是插入黑色背景,右邊是模糊拓邊,下面是插入圖片)


11

image

改變畫(huà)面最常用的方法就是通過(guò)插入背景顏色或者是背景圖片,或者是模糊拓邊的效果,實(shí)現(xiàn)橫豎屏的切換。

再說(shuō)一下電影解說(shuō)類(lèi)(或者是其他解說(shuō))的視頻,這種屬于二剪,因?yàn)榧恿俗约旱淖帜缓椭v解,這種平臺(tái)也是默許為原創(chuàng)類(lèi)型的,這跟影視混剪是完全不一樣的,影視混剪加個(gè)bgm還是屬于搬運(yùn)。
如果你自己找素材制作解說(shuō)類(lèi)(我的原創(chuàng)生成器可以一鍵制作電影解說(shuō)),那肯定是沒(méi)問(wèn)題的。
如果用了別人的解說(shuō)視頻,重新配音加字幕,那么有幾點(diǎn)需要注意,跟原視頻長(zhǎng)度不能一樣,長(zhǎng)度不同的目的是為了同一個(gè)時(shí)刻的畫(huà)面不同,這樣抽幀也不容易檢測(cè)。一定要加自己的片頭片尾。

再說(shuō)一說(shuō)抖音帶貨視頻,分割成多段后隨機(jī)合并,然后再加上不同的bgm,基本上就沒(méi)啥問(wèn)題了。

如果要做混剪類(lèi)的,影視都是有版權(quán)的,所以檢測(cè)肯定是比較嚴(yán)格,只是簡(jiǎn)單的混剪是不行的,那就加上字幕和配音就沒(méi)啥問(wèn)題了,相當(dāng)于?解說(shuō)類(lèi)的了。

最簡(jiǎn)單的原創(chuàng)應(yīng)該是圖片合成視頻了,然后再加個(gè)bgm。這肯定屬于原創(chuàng),除非有人在你之前合成過(guò)一樣的視頻。

我上面說(shuō)的幾種都是可以批量制作的,vlog這種就不說(shuō)了,沒(méi)法批量。做搬運(yùn)也要與時(shí)俱進(jìn),最簡(jiǎn)單的就是學(xué)習(xí)別人是怎么做的。

想要將視頻改成什么什么效果可以找我,比如上面的樣式,或者是其他的樣式都可以,我們所有的操作都是批量,一鍵生成成品。

文章字?jǐn)?shù)也差不多了,比較核心的上面也說(shuō)的差不多了,更具體的細(xì)節(jié)這里就不說(shuō)了。后面就需要自己去領(lǐng)悟,學(xué)習(xí)和發(fā)掘了。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容