字符串拼接反爬原理
为了加大JS的阅读难度和调试难度,字符串拼接构成可执行的JS方法(document,avigator,window)是比较常见的策略。比如常用的全局搜索变量名在这种情况下就会失效,同时很多新手会觉得很难而放弃爬取(眼睛都会看花)。
下面简单看看老朋友之家的反爬:
1.自定义字体(破解思路可以看看我前面的文章)。ttf之类的文件本质就是矢量图,矢量图的形状让我们人眼识别出某个字的字形,从而达到反爬的效果。解决办法:一笔一划自有其规则,抽象出规则即可;懂算法的可以用K近邻算法解决.其实本质就是字形看起来差不多。
2.js混淆。每一个段落都带有一段JS,执行JS渲染出合理的效果(注意是通过CSS样式渲染)。注意其中随机的变量名,只要耐心拼接就会发现最后拼接:document之类的可执行JS方法。这部分很简单,只要耐心即可。只要JS能执行,你就可以读出