机器学习与算法1.2 —— 概率论中的变量
让我深入的继续了解算法的基础吧
前言
牛了!朋友!你已经开始第二章节了!哦哦哦!在这里说个冷知识,一般而言人工智能包含内容为:传统机器学习,神经网络与深度学习
看起来是这样的!

让我们继续起飞!
预览:

1. 随机变量
随机变量(Random Variable)是一种数值变量,它将样本空间中的每个结果对应到一个数值上。在实际应用中,随机变量可以表示一个随机现象的数值结果,比如掷骰子的结果或股票价格的波动。
随机变量的符号表示
随机变量通常用大写字母表示,比如 X,而其取值(即某一特定试验结果对应的数值)用小写字母表示,如 X=x。随机变量的分布决定了每个可能的结果的概率。
2. 离散型随机变量
离散型随机变量(Discrete Random Variable)是指其取值是有限个或可数无穷多个的随机变量。每个可能的值都有一个确定的概率,并且这些概率之和为1。常见的离散型随机变量例子包括骰子点数、抛硬币结果等。
离散型随机变量的例子
- 掷骰子:假设 X 表示掷一个骰子的结果,那么 X 是一个离散型随机变量,其可能取值是 {1, 2, 3, 4, 5, 6}。
- 抛硬币:假设 Y 表示抛两次硬币出现正面的次数,Y 的可能取值为 {0, 1, 2}。
概率质量函数(PMF)
离散型随机变量的分布可以通过概率质量函数(Probability Mass Function,PMF)来表示。PMF 为每个可能取值分配一个概率。对于离散型随机变量 X,其 PMF 表示为 P(X=x),即 X 取值为 x 的概率。
例如,若随机变量 X 表示掷骰子的结果,则其 PMF 为:

3. 连续型随机变量
连续型随机变量(Continuous Random Variable)是指其取值为连续区间中的所有数,即可能取值是无限多个,无法一个个列出。常见的连续型随机变量包括测量数据,如人的身高、体重、温度等。
概率密度函数(PDF)
对于连续型随机变量 XXX,我们无法直接求出某一个具体值的概率(因为概率为0),因此用概率密度函数(Probability Density Function,PDF)来描述。PDF 表示随机变量在某个区间内取值的可能性大小。
例如,若 X 表示一根木棒的长度,且长度在 [0, 1] 米之间均匀分布,那么 X 的概率密度函数为:f(x)=1, (0≤x≤1)
我们可以通过积分计算在某一区间内的概率:

连续型随机变量的例子
- 正态分布(Normal Distribution):很多自然现象可以用正态分布描述,例如成年人的身高。其概率密度函数为:

- 其中 μ 是均值,σ^2 是方差。均匀分布(Uniform Distribution):如上一例中木棒的长度。
4. 中心极限定理
中心极限定理(Central Limit Theorem, CLT)是概率论中的一个重要定理。它说明了在一定条件下,任意分布的样本平均值的分布都会趋近于正态分布。即使每次抽样的结果分布不同,但当样本数量足够大时,这些结果的均值分布会趋近正态分布。
中心极限定理的公式
假设我们有一个来自总体的样本 {X1,X2,…,Xn},其均值为 μ,方差为 σ^2。若样本量 n 足够大,则样本均值的分布会接近正态分布,即

中心极限定理的重要性
- 中心极限定理使我们能够在不知道数据原始分布的情况下,估计均值的分布。
- 它广泛应用于统计推断,例如构建置信区间、假设检验等。
中心极限定理的例子
假设一个工厂生产的零件重量分布是未知的,但我们可以从中抽取100个零件测量重量,并计算平均重量。根据中心极限定理,当样本数量较大(比如大于30),我们可以假设这些平均重量的分布接近正态分布。(后续这部分内容会涉及统计学验证)这意味着我们可以使用正态分布来估计总体平均重量,即使我们不知道零件的真实分布。
小结
- 随机变量:用于描述随机现象的数值结果,可以是离散型或连续型。
- 离散型随机变量:取值为有限个或可数无穷多个,使用概率质量函数 (PMF) 来描述。
- 连续型随机变量:取值为连续区间,用概率密度函数 (PDF) 描述。
- 中心极限定理:样本量足够大时,样本均值的分布趋于正态分布,无论样本来自何种分布。