概述
-
辛普森悖论是指什么现象?
当人们尝试探究两种变量(比如新生录取率与性别)是否具有相关性时,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。
上表中,商学院女生录取率为49%<男生录取率75%,法学院女生录取率5%<男生录取率10%,但总体录取率女生42%>男生21%。因为实际上女生总体录取率的 42 % = 49 % ∗ 100 120 + 5 % ∗ 20 120 42%=49%*frac{100}{120}+5%*frac{20}{120} 42%=49%∗120100+5%∗12020,男生总体录取率的 21 % = 75 % ∗ 20 120 + 10 % ∗ 100 120 21%=75%*frac{20}{120}+10%*frac{100}{120} 21%=75%∗12020+10%∗120100,并不是简单的平均。显然,男生总体录取率应落在75%和10%之间,女生总体录取率应落在49%和5%之间,虽然75%大于49%,10%大于5%,二者的加权平均是可能存在大于、等于、小于的情况的。
-
面试场景题:
(1)一些学校里各个院系的女生比例都比男生高,能不能说这个学校的女生人数比男生多?我认为可以。因为每个院都只能分成男生和女生,这样每个院中女生比例一定是>50%的,而男生比例一定是<50%的,且二者和为1(这是与辛普森悖论不同之处,辛普森悖论没有这样的条件,录取率是任意的)。假设院①女生占60%,则男生占40%;院②女生占51%,则男生占49%,那么总体女生比例一定落在51%和60%之间,总体男生比例一定落在40%和49%之间,总体女生比例一定大于男生。
(2)国家出台某政策,统计发现各个省人均收入均有所增加,但全国人均收入下降了。请问这种情况有可能发生吗?
我认为有可能。因为各省份人口数可能由于人口流动、出生率、死亡率发生变化。比如以下各省收入均下降10%,但各省人均收入在上升。
政策出台前 | 政策出台后 | |
---|---|---|
A省 | 100000/10 | 70000/6 |
B省 | 100/10 | 10090/12 |
C省 | 100/10 | 10090/12 |
全国 | 100200/30 | 90180/30 |
-
辛普森悖论的回避方式是什么?
斟酌个别分组的权重,以一定的系数消除分组资料基数差异造成的影响,同时必须了解该情境是否存在其它潜在要因而综合考虑。
-
辛普森悖论的原因是什么?
各分组之间的成功率差别很大。多去做成功率高的事,就可以增大分组成功率占总体成功率的权重。
最后
以上就是明理河马为你收集整理的[基本功]辛普森悖论的全部内容,希望文章能够帮你解决[基本功]辛普森悖论所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复