Python打造漏洞扫描器 5 CMS识别(web指纹识别)扫描器开发

356 阅读 0 评论 235 点赞

我是靠谱客的博主愉快河马，这篇文章主要介绍Python打造漏洞扫描器 5 CMS识别(web指纹识别)扫描器开发，现在分享给大家，希望可以做个参考。

CMS识别(web指纹识别)扫描器开发

一、实验介绍

1.1 实验内容

在网站渗透的过程中，我们可以对网站进行扫描识别出使用的程序。今天我们就来做这个WEB指纹识别工具。

此处输入图片的描述

1.2 实验知识点

web指纹收集
指纹分析
md5校验
关键词校验

1.3 实验环境

Python2.7
Xfce终端
Sublime

1.4 适合人群

本课程难度为一般，属于初级级别课程，适合具有Python基础的用户，熟悉python基础知识加深巩固。

1.5 代码获取

你可以通过下面命令将代码下载到实验楼环境中，作为参照对比进行学习。

$ wget http://labfile.oss.aliyuncs.com/courses/761/shiyanlouscan5.zip
$ unzip shiyanlouscan5.zip

二、实验原理

CMS识别原理

CMS英文全称是：Content Management System 中文名称是：网站内容管理系统

CMS识别原理就是得到一些CMS的一些固有特征，通过得到这个特征来判断CMS的类别。
这里我们使用MD5识别和正则表达式识别的方式，就是用特定的文件路径访问网站，获得这个文件的MD5或者用正则表达式匹配某个关键词，如果匹配成功就说明这个是这个CMS。
所以，这个识别的成功率是根据我们的字典来的，这里，作者给大家提供了作者精心收集的1400+国内外网络常见指纹，拥有这些指纹，相信识别主流网站程序已经没有问题。怎么了？激动了吗，来看看我们怎么编写的。

三、实验步骤

3.1 指纹格式

这里截取一些web指纹作为参考：

{
"url": "/install/",
"re": "aspcms",
"name": "AspCMS",
"md5": ""
},
{
"url": "/about/_notes/dwsync.xml",
"re": "aspcms",
"name": "AspCMS",
"md5": ""
},
{
"url": "/admin/_Style/_notes/dwsync.xml",
"re": "aspcms",
"name": "AspCMS",
"md5": ""
},
{
"url": "/apply/_notes/dwsync.xml",
"re": "aspcms",
"name": "AspCMS",
"md5": ""
},
{
"url": "/tpl/green/common/images/notebg.jpg",
"re": "",
"name": "自动发卡平台",
"md5": "690f337298c331f217c0407cc11620e9"
},
{
"url": "/images/download.png",
"re": "",
"name": "全程oa",
"md5": "9921660baaf9e0b3b747266eb5af880f"
},
{
"url": "/kindeditor/license.txt",
"re": "",
"name": "T-Site建站系统",
"md5": "b0d181292c99cf9bb2ae9166dd3a0239"
},
{
"url": "/public/ico/favicon.png",
"re": "",
"name": "悟空CRM",
"md5": "834089ffa1cd3a27b920a335d7c067d7"
},
{
"url": "/public/js/php/file_manager_json.php",
"re": "",
"name": "悟空CRM",
"md5": "c64fd0278d72826eb9041773efa1f587"
},
{
"url": "/plugins/weathermap/images/exclamation.png",
"re": "",
"name": "CactiEZ插件",
"md5": "2e25cb083312b0eabfa378a89b07cd03"
}

可以看到，我们提供的是json格式，好处是可以方便以后再其他语言上的复用。

3.2 指纹文件

我们在data目录下存放了data.json文件格式的web指纹，总共有1400+的国内常见指纹，大家可以在终端上输入。

wget http://labfile.oss.aliyuncs.com/courses/761/shiyanlouscan5.zip
unzip shiyanlouscan5

获取源码后进入源码目录，然后再data/data.json文件就是我们的web指纹识别文件。

3.3 记录

思路虽然简单，但实现起来还是有很多问题的，比如效率问题，1000+指纹说明需要访问1000+的网页，单步的话速度太慢了，所以我们会使用线程，等用多了也会发现线程也太慢了，所以我们可以用协程，不过这个得等到后面扫描器升级的时候再说到，我们现在只是做出雏形，不需要太过于专注于效率，所以我就使用多线程来完成这个过程了。

3.4 代码编写

新建文件lib/core/webcms.py，代码如下：

#!/usr/bin/env python
# __author__= 'w8ay'
import json,os,sys,hashlib,threading,Queue
from lib.core import Download
class webcms(object):
workQueue = Queue.Queue()
URL = ""
threadNum = 0
NotFound = True
Downloader = Download.Downloader()
result = ""
def __init__(self,url,threadNum = 10):
self.URL = url
self.threadNum = threadNum
filename = os.path.join(sys.path[0], "data", "data.json")
fp = open(filename)
webdata = json.load(fp,encoding="utf-8")
for i in webdata:
self.workQueue.put(i)
fp.close()
def getmd5(self, body):
m2 = hashlib.md5()
m2.update(body)
return m2.hexdigest()
def th_whatweb(self):
if(self.workQueue.empty()):
self.NotFound = False
return False
if(self.NotFound is False):
return False
cms = self.workQueue.get()
_url = self.URL + cms["url"]
html = self.Downloader.get(_url)
print "[whatweb log]:checking %s"%_url
if(html is None):
return False
if cms["re"]:
if(html.find(cms["re"])!=-1):
self.result = cms["name"]
self.NotFound = False
return True
else:
md5 = self.getmd5(html)
if(md5==cms["md5"]):
self.result = cms["name"]
self.NotFound = False
return True
def run(self):
while(self.NotFound):
th = []
for i in range(self.threadNum):
t = threading.Thread(target=self.th_whatweb)
t.start()
th.append(t)
for t in th:
t.join()
if(self.result):
print "[webcms]:%s cms is %s"%(self.URL,self.result)
else:
print "[webcms]:%s cms NOTFound!"%self.URL

首先我们要读取cms指纹列表到队列中：

filename = os.path.join(sys.path[0], "data", "data.json")
fp = open(filename)
webdata = json.load(fp,encoding="utf-8")
for i in webdata:
self.workQueue.put(i)
fp.close()

然后run方法就是创建线程用的：

 def run(self):
while(self.NotFound):
th = []
for i in range(self.threadNum):
t = threading.Thread(target=self.th_whatweb)
t.start()
th.append(t)
for t in th:
t.join()
if(self.result):
print "[webcms]:%s cms is %s"%(self.URL,self.result)
else:
print "[webcms]:%s cms NOTFound!"%self.URL

线程调用的是th_whatweb方法：

def th_whatweb(self):
if(self.workQueue.empty()):
self.NotFound = False
return False
if(self.NotFound is False):
return False
cms = self.workQueue.get()
_url = self.URL + cms["url"]
html = self.Downloader.get(_url)
print "[whatweb log]:checking %s"%_url
if(html is None):
return False
if cms["re"]:
if(html.find(cms["re"])!=-1):
self.result = cms["name"]
self.NotFound = False
return True
else:
md5 = self.getmd5(html)
if(md5==cms["md5"]):
self.result = cms["name"]
self.NotFound = False
return True

当然了，线程我们需要考虑下情况进行退出。

if(self.workQueue.empty()):
self.NotFound = False
return False
if(self.NotFound is False):
return False

然后后面的代码就是下载网页源码，然后进行分析了。

如何调用呢？

from lib.core import webcms
if __name__ == "__main__":
webcms = webcms.webcms("http://blog.yesfree.pw/")
webcms.run()

得到了CMS名称会自动打印出来。

3.5 调用

重写下主文件w8ay.py即可：

#!/usr/bin/env python
#-*- coding:utf-8 -*-
'''
Name:w8ayScan
Author:w8ay
Copyright (c) 2017
'''
import sys
from lib.core.Spider import SpiderMain
from lib.core import webcms
reload(sys)
sys.setdefaultencoding('utf-8')
def main():
root = "https://www.shiyanlou.com/"
threadNum = 10
#webcms
ww = webcms.webcms(root,threadNum)
ww.run()
#spider
w8 = SpiderMain(root,threadNum)
w8.craw()
if __name__ == '__main__':
main()

当然，如果我们要测试cms识别的话可以把root = "https://www.shiyanlou.com/"改成root = "https://blog.yesfree.pw/"。

因为实验楼是探测不到使用了什么程序的，可以探测下我的博客是什么程序？

此处输入图片的描述

因为我们是在开发扫描器，所以我们尽可能多的把信息输出方便以后的调试，下面是正在测试的webcms的时候进行访问的地址：

此处输入图片的描述

最后我们看到我的博客程序被成功识别了出来：

此处输入图片的描述

最后

以上就是愉快河马最近收集整理的关于Python打造漏洞扫描器 5 CMS识别(web指纹识别)扫描器开发的全部内容，更多相关Python打造漏洞扫描器内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：实验楼课程
浏览次数：356 次浏览
发布日期：2023-09-22 03:25:26

Python打造漏洞扫描器 5 CMS识别(web指纹识别)扫描器开发

CMS识别(web指纹识别)扫描器开发

一、实验介绍

1.1 实验内容

1.2 实验知识点

1.3 实验环境

1.4 适合人群

1.5 代码获取

二、实验原理

CMS识别原理

三、实验步骤

3.1 指纹格式

3.2 指纹文件

3.3 记录

3.4 代码编写

3.5 调用

最后

评论列表共有 0 条评论

发表评论取消回复

Python打造漏洞扫描器 5 CMS识别(web指纹识别)扫描器开发

CMS识别(web指纹识别)扫描器开发

一、实验介绍

1.1 实验内容

1.2 实验知识点

1.3 实验环境

1.4 适合人群

1.5 代码获取

二、实验原理

CMS识别原理

三、实验步骤

3.1 指纹格式

3.2 指纹文件

3.3 记录

3.4 代码编写

3.5 调用

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复