橘智橘智
FakeOrange
预计阅读时间:2分钟16秒

机器学习与算法1.1 —— 数学与统计

想要深刻了解机器学习算法吗?从基础开始!

0
0

前言


当你已经初次尝试了所谓的机器学习,人工智能。相信你也如我曾经一样对他的便捷性与表现感到不可思议。如果你想更进一步的了解其中,而不仅仅这是使用,那请与我一起回顾算法基础,数学与统计。听起来可能会比较枯燥,但这确实是必不可少的重要一环。


“一切的惊叹,恐惧与不可思议,均来自于未知和混沌。“ —— 本人 (欸嘿~我皮一下~)


基础的内容十分简单,重要的并不是让你能熟背概念或者手搓证明公式。以上内容均是先贤为我们所作!心怀感激!


所以,我们的目标是在学习完成之后,可以用自己的逻辑通顺的串起概念即可!


如果抽象的逻辑是难以理解的,那么这里还有!动态交互演示!


那么我们开始起飞~


1. 基础概率论


概率论是一门研究随机现象规律性的数学学科。它通过对随机事件发生的可能性进行研究,为我们在不确定性中提供了数学上的支持。


概率的基本概念


在概率论中,我们关心的主要是事件发生的可能性,通常用以下几个关键概念描述:


  • 试验:是指可以在相同条件下重复进行,并且每次试验的结果不确定的实验。例如:抛硬币、掷骰子等。


  • 样本空间(Sample Space):试验中所有可能结果的集合,记作 S。例如,掷一个骰子可能的结果是 {1, 2, 3, 4, 5, 6},因此样本空间就是 {1, 2, 3, 4, 5, 6}。


  • 事件:样本空间的一个子集,代表我们关注的结果。比如“掷出一个偶数”是一个事件,对应的集合是 {2, 4, 6}。


概率的定义


事件 A 的概率 P(A)可以理解为事件发生的可能性。通常情况下,概率的值在 0 到 1 之间,其中 0 表示不可能发生,1 表示必然发生。常用的公式是:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/240c3b30-df8f-4f11-96d3-0212b964c664image.png

例如,掷一个六面骰子,事件“掷出一个偶数”的概率是:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/50ef1086-b269-4550-8c12-c3d7eba5e016image.png


2. 集合论基础


集合论是研究集合(即一组对象的集合)的数学学科。概率论的基础建立在集合论之上,因为我们常用集合来描述事件和样本空间。


集合的基本概念


  • 集合:一组不重复的对象组成的集合称为集合。集合用大括号表示,例如 {1, 2, 3}。


  • 子集:如果集合 A 的所有元素都在集合 B 中,我们称 AB 的子集,记作 A⊆B。


  • 空集:不包含任何元素的集合,记作 ∅。


集合的运算


集合运算是集合论的基础,包括以下几种常见运算:


  • 并集(Union):两个集合 AB 的并集 A∪B 包含所有属于 A B 的元素。例如:A={1,2},B={2,3},则 A∪B={1,2,3}。


  • 交集(Intersection):两个集合 A 和 B 的交集 A∩B包含属于 A 且属于 B 的元素。例如:A={1,2},B={2,3},则 A∩B={2}。


  • 补集(Complement):如果样本空间是 S,则集合 A 的补集 A^c 包含在 S 中但不在 A 中的所有元素。例如,样本空间 S={1,2,3},集合 A={1},则 A^c={2,3}。


3. 古典概型


古典概型是一种最简单的概率模型,假设样本空间中的每个基本事件发生的可能性相等


古典概型的基本公式

对于一个事件 AAA,在古典概型下,我们可以用如下公式计算它的概率:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/565805cb-4e88-4559-b19d-33c220e3f7ccimage.png


例如:

  • 掷硬币:样本空间 S={正面, 反面},事件“掷出正面”的概率为 P(正面)=1/2​。


  • 掷骰子:样本空间 S={1,2,3,4,5,6},事件“掷出一个 3”的概率为 P(3)=1/6。


4. 条件概率


条件概率描述的是在已知某个事件发生的条件下,另一个事件发生的概率。假设我们已经知道事件 B 发生了,那么事件 A 在这种情况下发生的概率记作 P(A∣B),即在 B 的条件下 A 的概率。


条件概率的公式


条件概率可以用以下公式表示:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/8abc6f4c-af9e-42e0-85dc-6978ba0ca116image.png


其中:

  • P(A∩B) 是事件 A 和事件 B 同时发生的概率


  • P(B)是事件 B 的概率。


示例

例如,在一副52张的扑克牌中,已知抽出的是红色牌的情况下,抽出红心(hearts)的概率是多少?


  • 事件 B:抽出的是红色牌,所以 P(B)=26/52=0.5。


  • 事件 A∩B:抽出的是红心且是红色牌的概率,共有13张红心,概率为 P(A∩B)=13/52=0.25。


  • 根据条件概率公式:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/38e74905-cd62-4351-9b17-c0e864dc6194image.png

这表示,在已知抽出的是红色牌的情况下,抽出红心的概率是0.5。


总结

OMG! 你迈出了一大步朋友!如果不懂的话,记得去看看交互式动态演绎~

基础概率论结合集合论的概念,描述了在随机试验中如何通过样本空间和事件来计算概率。古典概型为我们提供了简单的概率计算方法,而条件概率帮助我们在已知部分信息时进一步分析事件的可能性。

评论