概述
文章目录
- 一、生成式模型
- 二、概率:量化随机
- 三、定义概率:事件和概率空间
- 四、条件概率:信息的价值
- 五、广告时间
一、生成式模型
这个系列将讨论人工智能领域非常重要、也十分被看好的一类模型:生成式模型(generative model)。因为这类模型不但能根据特征预测结果,还能“理解”数据是如何产生的,并以此为基础“创造”数据,这才是“真正意义上”的人工智能。而且正如费曼1所说的“What I cannot create, I do not understand(我不能创造的东西,我就不了解)”,生成式模型在某种意义上是真正理解了数据。
生成式模型会大量用到概率这个数学工具,特别是条件概率和贝叶斯定理。这篇文章将主要讨论这些数学知识。
二、概率:量化随机
概率是量化事物随机性或者可能性的数学工具,在很多领域都有广泛的应用。但遗憾的是,概率或者随机本身是数学里人类理解最差的分支。在通常情况下,可以将概率从直观上理解为事件发生的比例。如图1所示,向图中的方形框随机投掷小球,那么小球落入圆圈的概率就等于圆圈的面积除以方形框的面积。
概率对数据科学尤其重要,举两个常见的例子:在搭建模型时,带有一些随机性的模型和算法往往预测效果会好于完全确定性的模型和算法;在异常检测时,理解概率能帮助我们区分真正的异常和正常情况下的随机扰动。
本节将着重介绍数据科学中常用到的概率知识,帮助读者在之后的章节里更好地掌握与概率相关的模型。
三、定义概率:事件和概率空间
我们首先从掷骰子这个常见的例子中引出概率的定义。假设我们连续随机地掷两次骰子,并计算两次所得点数的和。记第一次掷骰子得到的点数为 X 1 X_1 X1,第二次的点数为 X 2 X_2 X2,两次点数之和为 X X = X 1 + X 2 XX = X_1 + X_2 XX=X1+X2。容易得到可能的取值为2~12。将 X X = i XX = i XX=i记为事件 E i E_i Ei。但其实上面列举的事件还可以划分为更加细小的随机样本,比如 X X = 3 XX = 3 XX=3对应的事件 E 3 E_3 E3可以分解为两个事件,一是第一次点数是1,第二次点数是2,记为(1,2);二是第一次点数是2,第二次点数是1,记为(2,1)。整个过程如图2所示。将事件 E i E_i Ei发生的概率记为 P ( E i ) P(E_i) P(Ei),则
(1) P ( E 3 ) = P ( ( 1 , 2 ) ∪ ( 2 , 1 ) ) = P ( ( 1 , 2 ) ) + P ( ( 2 , 1 ) ) = 1 / 18 P(E_3) = P((1, 2) cup (2, 1)) = P((1, 2)) + P((2, 1)) = 1 / 18 tag{1}
最后
以上就是迷你大叔为你收集整理的生成式模型(零):条件概率一、生成式模型二、概率:量化随机三、定义概率:事件和概率空间四、条件概率:信息的价值五、广告时间的全部内容,希望文章能够帮你解决生成式模型(零):条件概率一、生成式模型二、概率:量化随机三、定义概率:事件和概率空间四、条件概率:信息的价值五、广告时间所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复