我是靠谱客的博主 老迟到芒果,最近开发中收集的这篇文章主要介绍html 时光网播放视频,mtime时光网电影资料库采集规则,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

经过分析发现,时光网的这个筛选结果页面html中,是用

在筛选结果页面通过抓去HTML代码发现电影URL的常规方法在这里不管用,当然筛选结果页的翻页也不管用,因此需要用抓包工具把筛选结果的内部列表页URL找出来。如下:http://service.channel.mtime.com/service/search.mcs?Ajax_CallBack=true&Ajax_CallBackType=Mtime.Channel.Pages.SearchService&Ajax_CallBackMethod=SearchMovieByCategory&Ajax_CrossDomain=1&Ajax_RequestUrl=http%3A%2F%2Fmovie.mtime.com%2Fmovie%2Fsearch%2Fsection%2F%3Ftype%3D201%23pageIndex%32%26year%3D2011%26type%3D201&t=201210271753315856&Ajax_CallBackArgument0=&Ajax_CallBackArgument1=0&Ajax_CallBackArgument2=138&Ajax_CallBackArgument3=&Ajax_CallBackArgument4=0&Ajax_CallBackArgument5=0&Ajax_CallBackArgument6=0&Ajax_CallBackArgument7=0&Ajax_CallBackArgument8=&Ajax_CallBackArgument9=&Ajax_CallBackArgument10=&Ajax_CallBackArgument11=0&Ajax_CallBackArgument12=0&Ajax_CallBackArgument13=0&Ajax_CallBackArgument14=1&Ajax_CallBackArgument15=0&Ajax_CallBackArgument16=1&Ajax_CallBackArgument17=4&Ajax_CallBackArgument18=10&Ajax_CallBackArgument19=0

注意以上url中加红加粗的参数:

Ajax_CallBackArgument2=国家/地区ID

Ajax_CallBackArgument3=类型ID

Ajax_CallBackArgument9=年代ID,如果不过滤就为空

Ajax_CallBackArgument10=年代ID,如果不过滤就为空 (你没看错,10和9都是指年代,一样的id)

Ajax_CallBackArgument18=页码,

用火车头的批量/多页模式添加采集地址,Ajax_CallBackArgument18=(*),如下图:

6d01cc10ad9bc14ffc1a6ce0d3d252d7.png

在“采集网址规则”时,选择手动:

498620ec99d2726aefee14b099294bb3.png

最后注意控制下采集网址的线程和频率,在你采集了几十个列表后,mtime时光网会让你输入验证码,很烦,目前我没想到用什么方法来避免这个验证码。

最后

以上就是老迟到芒果为你收集整理的html 时光网播放视频,mtime时光网电影资料库采集规则的全部内容,希望文章能够帮你解决html 时光网播放视频,mtime时光网电影资料库采集规则所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(35)

评论列表共有 0 条评论

立即
投稿
返回
顶部