概述
一、什么是 EDA?
探索性数据分析 (EDA) 是一种数据分析方法/哲学,它采用多种技术(主要是图形)。
1、最大限度地洞察数据集;
2、揭示底层结构;
3、提取重要变量;
4、检测异常值和异常;
5、测试基本假设;
6、开发简约模型;
7、确定最佳因子设置。
EDA 方法不是一套技术或函数或图形,而是一种关于如何进行数据分析的态度/哲学。
EDA 与统计图形不同,尽管这两个术语几乎可以互换使用。统计图形是一组技术——所有技术都基于图形并且都专注于一个数据表征方面。EDA 包含更广的涵义;EDA 是一种数据分析方法,它通过允许数据本身揭示其底层结构和模型的更直接的方法来推断关于数据遵循何种模型的通常假设。EDA 不仅仅是技术的集合。EDA 是一种关于我们如何剖析数据集的哲学;我们在寻找什么;它们的样子;以及我们如何更好解释其内在联系。确实,EDA 大量使用了我们称之为“统计图形”的技术集合,但它与统计图形本身并不完全相同。
大多数 EDA 技术本质上是图形化的,带有一些定量技术。之所以高度依赖图形,是因为EDA本质上的主要作用是开放的探索,而图形赋予了分析师无与伦比的探索能力,诱使数据揭示其结构秘密,并时刻准备着以获得对数据的一些新的,通常是意想不到的,洞察力。结合我们所有人都拥有的自然模式识别能力,图形当然提供了无与伦比的能力来实现这一点。
最后
以上就是甜甜大碗为你收集整理的机器学习笔记 - 探索性数据分析(EDA) 学习进阶一、什么是 EDA?二、探索性数据分析 vs 经典数据分析三、探索性数据分析 vs 汇总分析四、EDA 目标是什么?五、图形的作用六、不同问题应用不同工具的全部内容,希望文章能够帮你解决机器学习笔记 - 探索性数据分析(EDA) 学习进阶一、什么是 EDA?二、探索性数据分析 vs 经典数据分析三、探索性数据分析 vs 汇总分析四、EDA 目标是什么?五、图形的作用六、不同问题应用不同工具所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复