概述
数据分析学习笔记-第一记
第一次尝试边学习边写笔记,重新学习数据分析,记录一些自己的小困难解决;
前期准备
新手难免碰到各种有些小尴尬的问题,以下为准备工作的流程和期间遇到的小困难;
- 安装python: 主要是要去官网下载python,配置环境(这次没有重新搞,所以就不赘述);
- **安装numpy和pandas:**主要在终端输入
pip install numpy
如果显示已存在,需要更新,可以使用代码
python -m pip install -upgrade pip
如果发现经常运行了一些,就失败timedout之类,可以使用清华镜像
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy
如果利用清华镜像更新numpy,可以用
python -m pip install -upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple
- **安装jupyter:**新手可以安装anaconda,在Home页install jupyter notebook;
以上基本就是准备工作,下面就开始学习;
学习的内容主要包括如下几块
- 数据加载,pandas基础,探索性数据分析
- 数据清洗及特征处理
- 数据重构
- 数据可视化
- 模型搭建与模型评估
数据加载
载入数据
- 导入numpy和pandas
import numpy as np
import pandas as np
这里没有出现问题,如果有问题应该是python环境下安装numpy和pandas 两个库出现了问题;
- 载入数据
有两种方式:使用相对路径和绝对路径进入载入;
df = np.read_csv(‘train.csv’)
or
df = np.read_csv("/users/iii/train.csv)
这里出现过两个错误:
第一个:invalid syntax; 原因是没有np.read_csv()中的文件名未加引号;
第二个:“train.csv” does not exist; 这个错误主要是没有将数据文件放置到jupyter的运行目录下;所以,我先找到了jupyter的运行目录,使用如下方法:
ipmort os
os.getcwd()
找到目录,然后把数据文件放置这个目录下,然后就成功了;
小结
真的是这些小挫折花费了好久,虽然学的不多,但是后续还是可以继续了;
-
留两个后续的小尾巴给自己:
-
如何更改jupyter的运行目录,目前是放在/users下面这样肯定不可以,后续看看修改;
-
为什么使用pycharm打开的时候加载numpy和pandas就失败了呢?后续还要再配置下;
最后
以上就是洁净草莓为你收集整理的数据分析学习笔记数据分析学习笔记-第一记的全部内容,希望文章能够帮你解决数据分析学习笔记数据分析学习笔记-第一记所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复