预计阅读时间：2分钟8秒

机器学习与算法1.2 —— 概率论中的变量

让我深入的继续了解算法的基础吧

前言

牛了！朋友！你已经开始第二章节了！哦哦哦！在这里说个冷知识，一般而言人工智能包含内容为：传统机器学习，神经网络与深度学习

看起来是这样的！

data/78df2c1f-e442-415d-a382-fa7925af0c4b/eb2f5ead-f0da-4cd3-b35a-6acdd0ab065dimage.png

让我们继续起飞！

Oh 别忘了这个，统计学可视化学习，点击这里

预览：

data/78df2c1f-e442-415d-a382-fa7925af0c4b/6ec3ad16-0a66-4bb4-a824-a9f918094deaimage.png

1. 随机变量

随机变量（Random Variable）是一种数值变量，它将样本空间中的每个结果对应到一个数值上。在实际应用中，随机变量可以表示一个随机现象的数值结果，比如掷骰子的结果或股票价格的波动。

随机变量的符号表示

随机变量通常用大写字母表示，比如 X，而其取值（即某一特定试验结果对应的数值）用小写字母表示，如 X=x。随机变量的分布决定了每个可能的结果的概率。

2. 离散型随机变量

离散型随机变量（Discrete Random Variable）是指其取值是有限个或可数无穷多个的随机变量。每个可能的值都有一个确定的概率，并且这些概率之和为1。常见的离散型随机变量例子包括骰子点数、抛硬币结果等。

离散型随机变量的例子

掷骰子：假设 X 表示掷一个骰子的结果，那么 X 是一个离散型随机变量，其可能取值是 {1, 2, 3, 4, 5, 6}。

抛硬币：假设 Y 表示抛两次硬币出现正面的次数，Y 的可能取值为 {0, 1, 2}。

概率质量函数（PMF）

离散型随机变量的分布可以通过概率质量函数（Probability Mass Function，PMF）来表示。PMF 为每个可能取值分配一个概率。对于离散型随机变量 X，其 PMF 表示为 P(X=x)，即 X 取值为 x 的概率。

例如，若随机变量 X 表示掷骰子的结果，则其 PMF 为：

data/78df2c1f-e442-415d-a382-fa7925af0c4b/30ea4057-4c2c-47dd-af19-9d786253fe33image.png

3. 连续型随机变量

连续型随机变量（Continuous Random Variable）是指其取值为连续区间中的所有数，即可能取值是无限多个，无法一个个列出。常见的连续型随机变量包括测量数据，如人的身高、体重、温度等。

概率密度函数（PDF）

对于连续型随机变量 XXX，我们无法直接求出某一个具体值的概率（因为概率为0），因此用概率密度函数（Probability Density Function，PDF）来描述。PDF 表示随机变量在某个区间内取值的可能性大小。

例如，若 X 表示一根木棒的长度，且长度在 [0, 1] 米之间均匀分布，那么 X 的概率密度函数为：f(x)=1, （0≤x≤1）

我们可以通过积分计算在某一区间内的概率：

data/78df2c1f-e442-415d-a382-fa7925af0c4b/235d86b5-2fb3-4daa-98b1-c9ddcd82a327image.png

连续型随机变量的例子

正态分布（Normal Distribution）：很多自然现象可以用正态分布描述，例如成年人的身高。其概率密度函数为：

data/78df2c1f-e442-415d-a382-fa7925af0c4b/2a08a7e2-2905-4c21-a945-f90912820d14image.png

其中 μ 是均值，σ^2 是方差。均匀分布（Uniform Distribution）：如上一例中木棒的长度。

4. 中心极限定理

中心极限定理（Central Limit Theorem, CLT）是概率论中的一个重要定理。它说明了在一定条件下，任意分布的样本平均值的分布都会趋近于正态分布。即使每次抽样的结果分布不同，但当样本数量足够大时，这些结果的均值分布会趋近正态分布。

中心极限定理的公式

假设我们有一个来自总体的样本 {X1,X2,…,Xn}，其均值为 μ，方差为 σ^2。若样本量 n 足够大，则样本均值的分布会接近正态分布，即

data/78df2c1f-e442-415d-a382-fa7925af0c4b/4402f64a-321f-49ac-bffd-19c5853c848aimage.png

中心极限定理的重要性

中心极限定理使我们能够在不知道数据原始分布的情况下，估计均值的分布。
它广泛应用于统计推断，例如构建置信区间、假设检验等。

中心极限定理的例子

假设一个工厂生产的零件重量分布是未知的，但我们可以从中抽取100个零件测量重量，并计算平均重量。根据中心极限定理，当样本数量较大（比如大于30），我们可以假设这些平均重量的分布接近正态分布。（后续这部分内容会涉及统计学验证）这意味着我们可以使用正态分布来估计总体平均重量，即使我们不知道零件的真实分布。

小结

随机变量：用于描述随机现象的数值结果，可以是离散型或连续型。
离散型随机变量：取值为有限个或可数无穷多个，使用概率质量函数 (PMF) 来描述。
连续型随机变量：取值为连续区间，用概率密度函数 (PDF) 描述。
中心极限定理：样本量足够大时，样本均值的分布趋于正态分布，无论样本来自何种分布。