小網(wǎng)站優(yōu)質(zhì)內(nèi)容被高權(quán)重網(wǎng)站采集,導(dǎo)致小網(wǎng)站頁面沒有收錄也沒有排名,向搜索引擎反饋也沒有實(shí)質(zhì)性的效果,這是目前整個(gè)行業(yè)很常見的一個(gè)問題,因?yàn)闊o法證明這些內(nèi)容是自己原創(chuàng)的,而被迫做了“活雷鋒”,的苦惱,武榮網(wǎng)絡(luò)(0595wr.cn)教大家如何從技術(shù)層面防止網(wǎng)站內(nèi)容被采集,但也不能完全杜絕被采集。
一、優(yōu)化層面
1、在更新網(wǎng)站內(nèi)容時(shí),添加一些能代表自己的內(nèi)容,例如“XXX網(wǎng)提示” “XXX提醒”,還有就是將品牌詞變換下,例如“武榮網(wǎng)絡(luò)”可變換成“0595wr.cn”等,別人采集你的內(nèi)容在沒有及時(shí)修改的情況下,你就可以把這些作為證據(jù)向搜索引擎進(jìn)行反饋,反饋?zhàn)约旱脑瓌?chuàng)內(nèi)容被別人采集抄襲了。
沒有實(shí)質(zhì)證據(jù)的情況下,搜索引擎也不好怎么處理,你說你是原創(chuàng),但別人也可以說是他是原創(chuàng),如果你說更新時(shí)間可以證明,但內(nèi)容更新時(shí)間是可以修改的,所以這個(gè)是不能作為證據(jù)的。
2、還有一個(gè)方法是給內(nèi)容插圖加入水印,增加別人采集抄襲的時(shí)間成本。
二、技術(shù)層面
一般網(wǎng)站都會(huì)設(shè)置最新內(nèi)容更新欄目,這樣采集者采集的內(nèi)容都是最新而且還是沒有收錄的內(nèi)容,所以我們需要考慮不讓最新內(nèi)容被采集到,等最新內(nèi)容被搜索引擎收錄后,再更新出來,這樣別人采集的意義就不到了,設(shè)置方法如下所示:
1、首頁延時(shí)更新,不要將首頁設(shè)置成實(shí)時(shí)更新或固定時(shí)間段更新,我們網(wǎng)站把搜索蜘蛛養(yǎng)起來以后,首頁更新頻率就不用那么快了,例如新浪、網(wǎng)易那些大權(quán)重平臺(tái)網(wǎng)站首頁長時(shí)間都是不更新的。
2、延時(shí)更新,并不代表不更新,只要我們將最新內(nèi)容鏈接地址做成sitemap主動(dòng)推送經(jīng)搜索引擎,就不需要考慮搜索引擎不會(huì)不來抓取我們網(wǎng)站了。
3、限制欄目分頁數(shù),一般5~10頁足夠了,沒有人會(huì)有這個(gè)時(shí)間去翻你網(wǎng)站幾十頁后面的內(nèi)容,正常用戶進(jìn)入你網(wǎng)站都是有需求。
4、限制用戶列表頁內(nèi)容展示量。
5、列表頁內(nèi)容鏈接盡可能設(shè)置成無規(guī)則排序,如果你的網(wǎng)站列表頁內(nèi)容是按照有規(guī)律遞增進(jìn)行排序的,采集者不需要找到你網(wǎng)站最新內(nèi)容入口就可以采集到你網(wǎng)站的最新內(nèi)容,可以設(shè)置成百度最近一周收錄排序到網(wǎng)站最新內(nèi)容列表里。
如果你的站是新站,不建議使用上方法,等搜索蜘蛛抓穩(wěn)定了,就可以使用以上方法了。
注意:動(dòng)態(tài)程序網(wǎng)站也可以設(shè)置調(diào)用前幾天更新的內(nèi)容,但前提必須提前做好sitemap文件和api推送。
以上就是網(wǎng)站內(nèi)容避免被采集的一些技術(shù)方面的知識(shí)點(diǎn),各位小伙伴看完覺得有收獲的,可以給我點(diǎn)個(gè)關(guān)注!