概述
为什么不是普通线性回归?
使用普通线性回归技术,我们必须确保回归技术对于研究问题的适用性,才能相信回归结果是可靠的。识别回归技术的适用性,我们需要对回归分析进行诊断,诊断内容是线性回归最基本的六个假设是否成立,即
误差项是一个期望为0的随机变量;
对于解释变量的所有观测值,随机误差项有相同的方差;
随机误差项彼此不相关;
解释变量是确定性变量,不是随机变量,与随机误差项彼此之间相互独立;
解释变量之间不存在精确的(完全的)线性关系,即解释变量的样本观测值矩阵是满秩矩阵;
随机误差项服从正态分布。
那么,当我们遇到被解释变量为分类变量这一特殊的情境时,如果能够使用普通线性回归技术,就必须要满足以上所提到的六个基本假设,我们来进行一个简单的模拟。
我使用一个火箭发射成功与否的数据集来进行接下来的测试,首先我们读取数据集。
import numpy as np
import pandas as pd
data = pd.read_csv("challenger.csv")
data.drop(columns=['Unnamed: 0'], inplace=True)
数据集如下:
num_at_riskdistresslaunch_templeak_check_pressureorder
06170502
16069503
26068504
36067505
46072506
560731
最后
以上就是靓丽钢笔为你收集整理的python 分类变量回归_分类变量回归——Probit和Logit(附代码)的全部内容,希望文章能够帮你解决python 分类变量回归_分类变量回归——Probit和Logit(附代码)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复