防止个人信息泄漏:对付爬虫的方法
一句话:用机器都不懂但人能读懂的“文字”。比如数字的话,可以使用编号、中文大写、或者符号的方法等等。 比如我的电话是:①⑤⑨②①⑤X马赛克X。 如果是电子邮件地址的话,可以用全角字符代替半角,或者交叉使用:比如我的电子邮件是flychina2008@gmail.com。这是最不影响阅读体验的“加密”方法,这样的话现在的爬虫就读不出来了。 不过因为现在的垃圾爬虫老外开发的多,如果这种方法流行了,或者有中国人参与进来,这个方法就要失效了(全角字符和半角字符有对应关系,所以可以通过“解码”将字符解读成真正的邮件地址)。 下面给一些元素,偷懒的话可以直接复制下来以后使用: ①②③④⑤⑥⑦⑧⑨⑩{{ double-space-with-newline }}⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇{{ double-space-with-newline }}⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛{{ double-space-with-newline }}1234567890 上面的一些还好,起码是个人都能瞧懂的,下面的是有中国特色的:{{ double-space-with-newline }}⊙㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩{{ double-space-with-newline }}一二三四五六七八九十〇{{ double-space-with-newline }}壹贰仨肆伍陆柒捌玖拾零