我是靠谱客的博主 雪白小白菜,最近开发中收集的这篇文章主要介绍气象数据爬取(全国温室数据系统)爬虫及逻辑回归,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

明确爬虫需求

爬取网站:全国温室数据系统

爬取字段:平均气温 相对湿度 风速 日照时数

已知字段:代谢率h 吸收情况a 高度角cos∂ 单位照射R

计算字段:温湿指数 风寒指数 着衣指数 综合指数

甘肃省2000-2019年夏季6.7.8月的数据 利用气温,风速,日照时数,相对湿度对温湿指数,风寒指数,着衣指数,旅游气候舒适度进行计算。

diqu={"马鬃山":"52323","鼎新":"52446","敦煌":"52418","玉门镇":"52436","张掖":"52652","永昌":"52674","民勤":"52681","环县":"53821","平凉":"53915"}
# coding=gbk
import requests
import os


# Getfile类的代码引用自https://blog.51cto.com/eddy72/2106091?cid=732015
class Getfile:  # 下载文件
    def __init__(self, url):
        self.url = url
        self.header_flag = False  # 当为True时,设置header,断点续传

    def downfile(self, filename):
        self.headers = {}
        self.mode = 'wb'
        if os.path.exists(filename) and self.header_flag:
            self.headers = {'Range': 'bytes=%d-' % os.path.getsize(filename)}
            self.mode = 'ab'
        self.r = requests.get(self.url, stream=True, headers=self.headers)
        with open(filename, self.mode) as code:
            for chunk in self.r.iter_content(chunk_size=1024):  # 边下载边存硬盘
                code.write(chunk)

def single_download(paras):
    # 确认访问地址
    url2 = "http://data.sheshiyuanyi.com/WeatherData/php/downloadWeatherData.php"
    # 请求头
    header = {
        "User-Agent": "Mozilla / 5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 78.0.3904.108Safari / 537.36"
    }

    requests.get(url2, headers=header, params=paras)
    filename = "{0}_{1}_{2}_{3}.xlsx".format(paras["staNum"], paras["subIndex"], paras["year"], paras["month"])
    down_url = "http://data.sheshiyuanyi.com/WeatherData/datafile/{0}".format(filename)
    temp = Getfile(url=down_url)
    temp.downfile(filename)

#根据网站结构

if __name__ == "__main__":
    # 确定请求参数
    in_paras = {"action": "one",
                "staNum": "52943",
                "index": "air_temperature",
                "subIndex": "max_tem",
                "year": 2005,
                "month": 0}
    single_download(paras=in_paras)
    print("Completed: {0}_{1}_{2}_{3}.xlsx".format(in_paras["staNum"], in_paras["subIndex"], in_paras["year"], in_paras["month"]))

数据分布

最后

以上就是雪白小白菜为你收集整理的气象数据爬取(全国温室数据系统)爬虫及逻辑回归的全部内容,希望文章能够帮你解决气象数据爬取(全国温室数据系统)爬虫及逻辑回归所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部