我是靠谱客的博主 震动龙猫,最近开发中收集的这篇文章主要介绍python怎么导入数据文件_python数据分析——pandas导入数据合集,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

导入pandas库

import pandas as pd

1.导入csvtxt文件数据

pd.read_csv()

常用参数:

filepath_or_buffer:文件路径(必填,其他参数按需求填写)

sep:指定分隔符,默认逗号','。

header:指定第几行作为表头。默认为0(即第1行作为表头),若没有表头,需设置header=None,可以是int或list。

names:指定列的名称,用list表示,默认None。

index_col:指定行索引,可以是一列或多列,默认None。

usecols:需要读取的列,可以使用列序列也可以使用列名,默认None。

prefix:给列名添加前缀。如prefix=x,会出来X0,X1,....,默认None。

skiprows:需要忽略的行数(从文件开始处算起),或需要跳过的行号列表(从0开始),默认None。

skipfooter:需要忽略的行数(从最后一行开始算)

nrows:需要读取的行数(从文件头开始算起),默认None。

encoding:编码方式,乱码时使用,默认None。

例1:导入文件data.csv中数据:

242dd42a2834349bbd78276946219ecb37d3be35.png?token=c60f51724d95999937c06a4105c2e13d&s=c496ec32091fd5ce0c7c84da0000c0b1

例2:导入文件data.txt中数据:

562c11dfa9ec8a13daec359078c81a8aa1ecc019.png?token=bdffe9c0f494e849a6fd83c8ee9b1280&s=4c98ac1a030a454d4a6504da0000c0b1

2.导入excel数据

pd.read_excel()

常用参数:

io:excel文件路径(必填,其他参数按需求填写)

sheet_name:需要导入数据的工作表表名,可以是intstringlist,None导入所有工作表数据,默认0。

参数header、names、index_col、usecols、skiprows、nrows、skip_footer、encoding的用法与pd.read_csv相同。

例:导入文件data.xlsx中数据:

9c16fdfaaf51f3de4e34f1281b257b1a382979cd.png?token=5b685432f2547af7ea0970e241b6e2d5&s=6498ec33499fc0ce505948da000050b3

3.导入mysql数据

方法一:使用pymysql

import pymysql

conn=pymysql.connect(host="服务器地址",port=端口,user="用户名",passwd="密码",db="数据库名")

sql="select * from 表名;"

df=pd.read_sql(sql,conn)

例:导入数据库test下cities表中数据

0bd162d9f2d3572c51ee64ba05d8e82263d0c39d.png?token=b9f460a782c513ff24131c3438d7fdef&s=04986c32131b706d5a7da4da000010b3

方法二:使用sqlalchemy

from sqlalchemy import create_engine

engine=create_engine('mysql+pymysql://用户名:密码@服务器地址:端口/数据库名')

sql='select * from 表名;'

df=pd.read_sql(sql,engine)

例:导入数据库test下cities表中数据

838ba61ea8d3fd1fc98b8647bf85ae1a94ca5f19.png?token=5a2e2985ee6c3a908383a23faf0b30ed&s=209a7c32191a404d5a5920da0000c0b2

4.导入html表格数据

pd.read_html()#爬取table型网页数据,返回dataframe组成的list

常用参数:

io:目标网址

match:要匹配的正则表达式,默认'.+'。

flavor:解析器,默认None。

header:指定表头,默认None。

skiprows:跳过的行默认None。

attrs:属性,比如 attrs = {‘id’: ‘table’}。

parse_dates:解析日期,默认False。

encoding:编码方式,乱码时使用,默认None。

例:爬取财富中文网中2019年财富世界500强排行榜

03087bf40ad162d91f4249009e1422e98b13cd4b.png?token=c406a06550d777b0c7c509ee156798e5&s=14b87c3209efd0ce52ddf5cb0000a0b1

最后

以上就是震动龙猫为你收集整理的python怎么导入数据文件_python数据分析——pandas导入数据合集的全部内容,希望文章能够帮你解决python怎么导入数据文件_python数据分析——pandas导入数据合集所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(98)

评论列表共有 0 条评论

立即
投稿
返回
顶部