注意,這里講的是所有視頻平臺(tái)的原理,,不僅僅限于抖音,抖音可能使用了其中幾種,不是全部)
A、初級(jí)的檢測(cè):MD5檢測(cè)機(jī)制
所有的文件都有自己的MD5,,互相不重復(fù),一個(gè)視頻初次上傳到抖音(其他平臺(tái)也一樣的),,系統(tǒng)會(huì)自動(dòng)讀取這個(gè)視頻的MD5值,,錄入自己的數(shù)據(jù)庫,。
一個(gè)視頻(如果不能確定是不是第一次)上傳到抖音時(shí),,系統(tǒng)會(huì)讀取這個(gè)視頻的MD5值和數(shù)據(jù)庫中已有的條目比對(duì)。如果發(fā)現(xiàn)了一致的MD5,,判定后面這個(gè)視頻是抄襲,,沒有一致的結(jié)果,接著進(jìn)行下面的判定,。
B,、進(jìn)階檢測(cè):關(guān)鍵幀抽取比對(duì)
所有的視頻都是一張一張的圖片快速播放形成的,每一張圖都稱一幀,。一個(gè)視頻初次上傳到某個(gè)平臺(tái)系統(tǒng)會(huì)自動(dòng)讀取這個(gè)視頻的某些時(shí)間幀(即第幾秒的畫面),。
然后將該畫面經(jīng)過算法處理,拿到一個(gè)該畫面的MD5值(或者類似的值)將此值與當(dāng)前時(shí)間對(duì)應(yīng)的關(guān)系存入數(shù)據(jù)庫,。
?。ɡ纾涸撘曨l第3秒是一只狗,第6秒是這只狗和他的主人)一個(gè)視頻(如果不能確定是不是第一次)上傳到平臺(tái)時(shí),,系統(tǒng)會(huì)讀取這個(gè)視頻的時(shí)間幀,,和數(shù)據(jù)庫內(nèi)已有數(shù)據(jù)進(jìn)行對(duì)比如果發(fā)現(xiàn)了一致的時(shí)間幀,判定后面這個(gè)視頻是抄襲,;
沒有一致的結(jié)果,,接著進(jìn)行下面的判定。
C,、骨灰級(jí)檢測(cè):人工智能算法
在上面的檢測(cè)方法的基礎(chǔ)上,,進(jìn)一步分析某些時(shí)間幀的特征,,比如把AB兩個(gè)視頻的第9秒這一幀取出來對(duì)比,兩個(gè)圖按照一樣的方式平均分割成9塊,,其中8塊都是相同或者相似的內(nèi)容,,只有一塊不同,這塊很可能是個(gè)水??;
接著比對(duì)多個(gè)時(shí)間幀,如果都是如此,,判定這兩個(gè)視頻為相似,,平臺(tái)算法設(shè)定相似度超過xx即為抄襲。
這里只是舉了一個(gè)人工智能算法里低級(jí)的算法,,更復(fù)雜的一兩句說不清,,也沒必要知道。
還想了解更多關(guān)于抖音短視頻的朋友可以添加我的微信,,我會(huì)把我這幾年做抖音的經(jīng)驗(yàn)分享給你,。
D,、其他檢測(cè)方法:人肉舉報(bào)
抖音里就有這個(gè)功能,,可以舉報(bào)當(dāng)前視頻是抄襲,平臺(tái)算法設(shè)定超過XX人舉報(bào)時(shí),,會(huì)把這個(gè)視頻提交到人工審核組進(jìn)一步判定,。
如何來做偽原創(chuàng)內(nèi)容呢?
A,、手段:軟件改MD5即可,。
除此以外,一個(gè)視頻加加水印去水印加濾鏡打馬賽克鏡像反轉(zhuǎn)加字幕添加幀刪除幀等都會(huì)改變?cè)瓉淼模虳5,,修改視頻文件名不會(huì)影響MD5,。
B手段:改變時(shí)間幀。
比如源視頻15秒長(zhǎng)度,,前加1秒內(nèi)容,,或者減一秒內(nèi)容,視頻尾部再適當(dāng)加減1秒,,重新合成15秒的視頻,。
如果是長(zhǎng)視頻平臺(tái),比如西瓜視頻,,常用的方法有:多個(gè)視頻拼接,,加自己的片頭和片尾還有轉(zhuǎn)場(chǎng)等等。
根據(jù)我們的測(cè)試經(jīng)驗(yàn),快手,,抖音,,美拍等短視頻產(chǎn)品使用的是A方法,或許會(huì)升級(jí)到AB,,西瓜視頻搜狐視頻等長(zhǎng)視頻平臺(tái)使用的是AB的方法,。
也許你要問,這個(gè)技術(shù)很難很難,,開發(fā)一套非常貴,,一般的公司用不起,受奇藝優(yōu)酷等平臺(tái)在用,,也只是比較低端的技術(shù),,的人工智能算法,用在我大天朝的互聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)里,,主要作用是掃黃,。
手段其實(shí)不那么可怕,一是多平臺(tái)之間互相搬運(yùn),,被舉報(bào)的概率很低,;二是不要搬運(yùn)太出名的視頻,你搬一個(gè)陳翔六點(diǎn)半,,或者papi醬,,非要說自己拍的,你看大家懟不懟你,。
看到這里,,你可能也明白了,,單純的頻改md5有一些用,,但還是很容易被平臺(tái)判斷是搬運(yùn)的風(fēng)險(xiǎn),所以說還要多做幾重工作,,當(dāng)然這又是另一個(gè)問題啦,!