安居客[58租房]爬虫--解决ttf字体反爬解决安居客ttf字体反爬虫最终代码如下
解决安居客ttf字体反爬虫解决思路在爬取安居客房源的过程中发现爬取下来的的数字是&#xxxxx的乱码,而不是正常的数字,因为从前没有接触过此类型的反爬,所以在这里写下我解决这个反爬的思路。在这里可以发现所有的乱码的字体都有strongbox这个属性,于是去搜索strongbox。可以发现第一条非常的可疑,点开可以发现是这样的一条js代码。<script>!function(w, d) {if (!w.ActiveXObject || d.documen