概述
久违了的Python系列回来啦~
Py4e也会更新,从实用性的角度出发,最近会先写一些和数据分析相关的笔记。
首先是Python数据处理系列,这篇文章的内容是数据的读取与存储。
# 导入numpy及pandas库
import numpy as np
import pandas as pd
1. 查看数据
!type 地址
# 这里注意!与type之间没有空格,而type后面有;这里的地址是不加引号的
!type C:UsersCarolineDesktop数据ch4ex1.csv
# 如果要读取的文件和jupyter的ipynb文件放在同一个文件夹,直接写文件名也可以
!type myout2.csv
2. 读取数据
法一:df=pd.read_csv/json/excel(‘地址’)
法二:df=pd.read_table(‘地址’, sep=’分隔符’)关于地址的写法
系统复制的地址用分隔的,而在python中有转义的含义,要把反斜杠换为正斜杠/或者在地址前面添加r防止地址被识别为转义符
这个点在用load data infile命令向mysql导入csv文件的时候也提到过https://zhuanlan.zhihu.com/p/143654235zhuanlan.zhihu.com
法一:df=pd.read_csv/json/excel(‘地址’)
法二:df=pd.read_table(‘地址’, sep=‘分隔符’)
这两种方法的区别就是法二pd.read_table()默认分隔符是制表符't',法一如df.pd.read_csv默认分隔符为','。
当文件的分隔符比较妖孽的时候,比如是?或者好几个空格之类的,两种方法都可以用sep='分隔符'来修改分割符。
#读取json文件
df1=pd.read_json(r'C:UsersCarolineDesktop数据trial.json')
#csv文件分隔符为','的两种方法
df2=pd.read_csv(r'C:UsersCarolineDesktop数据ch4ex1.csv')
df2=pd.read_table(r'C:UsersCarolineDesktop数据ch4ex1.csv',sep=',')
#txt文件分隔符为'?'的情况
df3=pd.read_table(r'C:UsersCarolineDesktop数据ch4ex6.txt',sep='?')
#分隔符是好几个空格的情况
df4=pd.read_csv(r'C:UsersCarolineDesktop数据ch4ex7.txt',sep='s+') #法一
df4=pd.read_table(r'C:UsersCarolineDesktop数据ch4ex7.txt',sep='s+') #法二包含多个sheet的excel文件读取
包含多个sheet的excel文件,默认是读第一张sheet。可以通过sheet_name参数来选择读取的sheet,支持数字索引(也是从0开始)和sheet名两种写法。
# 读取excel文件里面的第二张sheet‘客户表’
df5=pd.read_excel('C:/Users/Caroline/Desktop/trial.xlsx',sheet_name=1)
df5=pd.read_excel('C:/Users/Caroline/Desktop/trial.xlsx',sheet_name='客户表')其他参数:跟在文件地址后面直接加在括号里面就可以。这里选取了几个最常用的列出来,不再赘述,实际使用过程中有其他需要再搜索就好。
3. 存储数据
默认路径是存在jupyter代码所在的文件夹
df.to_csv/json/excel('命名')
# excel需要指定sheet名
df.to_excel('excel文件名’, sheet_name='sheet名')
# 不要索引
index=False
4. Python数据库处理(以Mysql为例)
【pymysql库的安装】
Python使用pymysql库连接mysql,但是anaconda本身自带的100多个库里面并不包含pymysql,需要单独安装:
# 打开Anaconda Prompt(anaconda 3)
conda install pymysql
# 按照提示安装pymysql包
# 安装结束后查看是否成功:
python
import pymysql
# 出现“>>>”即证明安装成功(以下为成功状态)
#导入numpy,pandas,pymysql库
import numpy as np
import pandas as pd
import pymysql
【python连接数据库】
# 创建连接变量conn,记得启动mysql啊
conn=pymysql.connect(
host='localhost', #数据库地址
user='root', #用户名
password='密码',
db='数据库名',
port=端口号,
charset='utf8')
以上参数不知道的话,可以打开Mysql命令行查询
-- db即数据库名,也就是Mysql里database/schema的名字-- 查看port 端口号show variables like '%port%'
-- 查看charset字符集的编码方式show variables like '%collation%';
【python读取mysql数据】
df=pd.read_sql('sql语句 ',连接变量名)
# 以读取sql面试50题里面的sc表为例
df=pd.read_sql('select * from sc',conn)
创建sc表的代码在下面这个帖子的最后:https://zhuanlan.zhihu.com/p/113173133zhuanlan.zhihu.com
【python向mysql存储数据】
df.to_sql(name='表名',con='mysql+pymysql://用户名:密码@数据库地址:端口号/数据库名?charset=utf8', if_exists='replace', index=False)
# 将DataFrame命名为sc3存在mysql数据库exercise中
df.to_sql(name='sc3',con='mysql+pymysql://root:1234@localhost:3306/exercise?charset=utf8', if_exists='replace', index=False)
进入mysql命令行查看,sc3表已经储存在exercise数据库中了
上面主要是提供学习的思路框架,用Python进行数据的读取和存储并不限于以上情况,可以根据实际工作需要,使用上面的框架进行搜索。
最后
以上就是无辜花生为你收集整理的python怎么存数据_【Python】【数据处理】1 如何用python读取及存储数据的全部内容,希望文章能够帮你解决python怎么存数据_【Python】【数据处理】1 如何用python读取及存储数据所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复