Pandas数据读取
Pandas需要先读取表格类型的数据,然后进行分析。
数据类型 | 说明 | Pandas读取方法 |
---|---|---|
csv、tsv、txt | 用逗号分隔、tab分割的纯文本文件 | pd.read_csv |
excel | xls或者xlsx文件 | pd.read_excel |
mysql | 关系型数据库表 | pd.read_sql |
读取纯文本文件(csv)
复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16# 读取csv,使用默认的标题行、逗号分隔符 fpath = "E:DatamysqlData\basedata_logs.csv" # 使用pd.read_csv读取数据 ratings = pd.read_csv(fpath) # 查看前几行数据 # print(ratings.head()) # 查看数据的形状(行数,列数) # print(ratings.shape) # 查看列名列表 # print(ratings.columns) # 查看索引列 # RangeIndex(start=0, stop=2843, step=1) # print(ratings.index) # 查看每列的数据类型 print(ratings.dtypes)
读取txt文件
复制代码
1
2
3
4
5
6
7
8
9
10# 读取txt文件,自己制定分隔符、列名 fpath = "E:DatamysqlData\basedata_logs.txt" base_logs = pd.read_csv( fpath, sep=",", header=None, names=['operation', 'operate_time', 'operate_id', 'operate_params'] ) print(base_logs.head())
读取excel文件
复制代码
1
2
3
4
5
6# 读取excel文件 Use pip or conda to install openpyxl. # 需要引入openyxl库 fpath = "E:DatamysqlData\basedata.xlsx" basedata = pd.read_excel(fpath) print(basedata.head())
读取mysql
复制代码
1
2
3
4
5
6
7
8
9
10
11
12# 读取mysql数据库 conn = pymysql.connect( host="localhost", user="root", password="root", database="wht", charset="utf8" ) mysql_page = pd.read_sql("select * from basedata limit 5", con=conn) print(mysql_page) conn.close()
最后
以上就是大胆画笔最近收集整理的关于Pandas数据读取的全部内容,更多相关Pandas数据读取内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复