V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
LxnChan
V2EX  ›  问与答

如何防止 blog 内容被采集站采集

  •  
  •   LxnChan · 69 天前 · 1278 次点击
    这是一个创建于 69 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在 blog 被 v 友赋予“博客禁止右键的人”的称号 89 天之后(指路:在 Cloudflare Workers 上部署 Hexo 网站),终于我的 blog 也被采集站采集了。

    怎么说呢,五味杂陈,一方面又开心——内容有被更多的人看到,另一方面又很难过——不是从我站上面得到的(而且他也没有标明出处)。

    所以想问问大家有没有什么好的办法防采集,博客是 Hexo 渲染的。


    啊,差点忘了说,我的文章地址是 https://lxnchan.cn/mi-r4ag-openwrt.html ,采集站地址是 https://www.luyouwang.net/9751.html

    7 条回复    2022-09-27 09:51:17 +08:00
    dem0ns
        1
    dem0ns  
       69 天前
    根据他的采集特征,反向塞垃圾信息广告啥的
    HugoChao
        2
    HugoChao  
       68 天前
    好像真不能右键,但复制和开控制台都没影响
    LongLights
        3
    LongLights  
       68 天前 via iPhone   ❤️ 1
    我以前个人站被采集 那个 b 甚至没做图片本地化 全烧的我 cdn 钱,然后我一怒之下把图片 refer 防盗链全改成了“本文抄袭于 xxx”然后那个采集站有差不多一个星期整个网站映入眼帘的都是“本文抄袭于 xxx”,然后我被 d 的换了两千块一个月的高防….
    arch9999
        4
    arch9999  
       68 天前 via iPhone
    在文章中加入随机水印,就当他们帮做引流了,这些🐶真的难防,我一个没被百度收录的他们都搞。
    eason1874
        5
    eason1874  
       68 天前
    @LongLights #3 我也被采集站浪费过大概两百元 CDN 费用,后来设置外链白名单了,没被报复。没想过反抗,不敢惹这些流氓,ddos 成本低,防御成本又高,为了让网站继续赚钱只能苟活于世 😅
    NewYear
        6
    NewYear  
       68 天前
    写文的时候多塞一些你网站特有的名词,比如作者名字,博客名字,英文名,相关词。
    这样会扩大你的知名度(名号)

    博客不是记笔记,适当保护自己,静态网站基本不要想什么防采集,没什么意义。
    对了,早几年有人用 css 文字嵌入到文中,或者部分词替换成图片,理论上可以一定程度防采集。

    但是都很麻烦,不如按最前面的方法
    Alliot
        7
    Alliot  
       68 天前   ❤️ 1
    文中加入自己的名字作为主语,适当嵌入自己的 URL ,采集站存在多年了,没有破解的好方法。
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2481 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 16:04 · PVG 00:04 · LAX 08:04 · JFK 11:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.