密码学｜ 5.3 概率论

密码学 2年前 (2022) admin

412 0 0

5.3.1 概率论的基本概念

在本节中，我们将介绍一些（离散）概率论的基本思想。概率空间由两部分组成，第一种是由实验的所有可能结果组成的有限集；第二种是每个可能结果出现的概率。在数学术语中，概率空间是结果的有限集合，称为样本空间，以及函数

函数表示 事件发生的概率。特别的，的值应介于0和1之间。

例 5.18 考虑抛一枚硬币，会有两种结果：正面和反面。我们设集合。假设这枚硬币没被做过手脚，那么两种结果出现的概率应该是相等的，即。

例 5.19 考虑投两枚骰子，那么样本空间就会有 36 种数对

在例 5.19 中，每个结果出现的可能性是相等的。比如投出和投出具有相同的概率。因此对于任意的，我们有

不过在这个场景中，投出点数的顺序很重要。我们可以想象一个骰子是红色的，另一个是蓝色的，那么我们应该判定 “红色3和蓝色5” 与 “红色5和蓝色3” 是两个不同的结果。

例 5.20 假设现在我们有 100 个骰子，其中 21 是红的，剩下的是蓝的。如果我们随机不放回的挑选 10 个，那么挑出来的骰子中正好有三个是红色的概率为多少。

从 100 个骰子中选10个总共有种选法。同样的，从 21 个红色骰子中选 3 个共有中取法，从 79 个蓝色骰子中取另外 7 个蓝色骰子共有种选法。因此，取 3 个红色骰子和 7 个蓝色骰子共有种取法。那么再十次取骰子的结果中，出现正好 3 个红色骰子，7 个蓝色骰子的概率是

通常我们对计算复合事件的概率更感兴趣。这些样本空间的子集，可能包括多个结果。例如，在示例5.19中的两个骰子的投掷中，我们可能对至少一个骰子显示6的概率感兴趣。而这个复合事件是的子集，由包括数字 6 的所有结果组成，即集合

{(1, 6),(2, 6),(3, 6),(4, 6),(5, 6),(6, 6),(6, 1),(6, 2),(6, 3),(6, 4),(6, 5)}

假设我们知道每个特定结果的概率。那么，我们如何计算复合事件或由重复的独立实验组成的事件的概率呢？分析这一问题我们产生了事件独立性的概念，这一概念赋予了概率论许多复杂性和丰富性。

形式概率论是一种公理理论。当你研究欧几里得几何和抽象向量空间时，你可能已经看到过这样的理论。在公理理论中，我们从一小部分基本公理开始，并从中导出其他有趣的事实和公式。概率公理理论允许我们推导公式来计算复合事件的概率。在本书中，我们仅对该理论进行一些非正式介绍，但对于那些对概率论更严格的公理化处理感兴趣的读者，可阅读《A First Course in Probability》2.3 一节。

首先，我们从一些定义开始。

定义样本空间（结果集合）是一个有限集合，其中的每一个结果都有对应的概率。这里用到了我们的概率函数

其满足两个性质

性质（1）说明，每一个结果的概率都在 0 （从不发生）和 1（肯定发生）之间。性质（2）说明一定会有结果，所以包含了实验的所有可能结果。

定义事件是的一个子集。我们定义事件发生的概率为

特别的我们有。

定义如果，我们称两个事件是互斥（disjoint）的。

那么有。因此是所有事件和的集合。当不是互斥的时候，那么的概率就不是和的和了，因为这样和均包含的结果会被重复计数。因此，我们需要减去和中的共同结果，这给出了公式

$(5.16) P r (E \cup F) = P r (E) + P r (F) - P r (E \cap F)$

定义事件的补充是事件，包含了所有不在中的结果，即

补充事件的概率为

有时使用补充事件和能够更方便地计算出事件的概率。

例 5.21 我们继续用 例5.19，其中是由投两个骰子的所有可能结果组成。设为事件

我们可以将所有的情况记下

其中11个结果每个都有的概率，所以。

我们计算投不到一次 6 的概率

接着考虑事件：投的点数都不比 2 高。

注意到

和事件是互斥的。所以，投的点数包含 6，或者投的点数都不比 2 大的概率是

对于那些不互斥的事件，计算起来就会比较麻烦，因为我们要避免二次计数。我们考虑事件：投的点数相同。即

那么事件和事件都包含结果。所以只包含 16 个结果，而不是 17 个。因此这两个事件之一发生的概率是。我们也可以使用如下的公式进行计算

最后，我们设事件：两次投掷的点数之和大于等于4。

我们可以直接计算，但是计算其补充事件会更方便一些。因为只有三种结果才会使得投掷的点数小于 4，分别为

因此，所以

现在假设有事件，它们的交集是，即这两个事件都发生的概率为

正如下面这个例子所示，两个事件相交的概率不是单个事件概率的简单函数

例 5.22 假设我们要从一副牌中（不包含joker）不放回地抽出两张牌。设和为以下事件：

第一张抽出的牌是 K

第二张抽出的牌是 K

显然我们有，并且。因为我们不知道第一张抽出的牌是啥，所以事件和事件并没有什么区别。（如果不是很好理解，那么假设这副牌是发给52个人的。那么任何一个人得到 K 的概率都是，不管他们是收到的是第一张牌还是第二张牌。）然而，如果我们知道事件发生了，那么显然它会影响到事件。更准确的来说，如果事件发生了，那么在剩下的 51 张牌中就只剩 3 张 K 了，那么事件发生的概率就会变小。但是如果事件没有发生，那么剩下的 51 张牌中就还有 4 张 K，那么事件发生的概率就会变大。用数子去表示就是

因此，和都发生的概率，即连续抽出两个的概率，小于和的乘积，因为事件的发生会使得事件发生的可能性变小。正确的计算应该是

定义事件第二次抽出的卡牌是 A。

那么事件的发生会让事件的发生更容易。因为如果第一张卡牌是 , 那么剩余的卡牌中仍然会剩下 4 张。因此如果我们知道事件已经发生，那么事件发生的概率就从提升到了

然而，我们更改一下实验，现在是有放回的抽取卡牌，那么不管事件是否发生，它都不会影响到事件的发生，因此，在这样的实验中，事件和均发生的概率就是

在 例5.22 的讨论中我们知道到了两件事。首先，我们看到，有些时候一个事件的概率取决于是否发生了另一个事件；其次，我们进行了一些拓展，从而得出独立事件的数学定义

定义事件和是相互独立的，当

回顾一下，是和同时发生的概率。换句话说，如果和都发生的概率是它们各自发生概率的乘积，那么它们是独立的。

例 5.23 一枚硬币被投掷10次并记录结果。以下事件的概率是多少？

前五次都是正面朝上

前五次正面朝上，剩下的反面朝上

正好有五次正面朝上

假设这是一枚公平的硬币，任何一次投掷的结果都与其他投掷的结果无关，因此我们可以通过将这些投掷中任何一次得到正面的概率相乘来计算前五次投掷中都得到正面的概率。于是第一个问题的答案：

为了计算的概率，请注意，我们现在要求的概率是我们的投掷序列恰好是 正正正正正反反反反反。再次利用每次投掷的独立性，我们可以得到

的计算会稍微棘手些，因为它要求正好出现五个正面，但对它们出现的位置没有限制。如果我们要精确地指定五个正面和五个反面出现的位置，那么概率将是，就像一样。所以我们需要做的就是计算我们可以用多少种方法将五个正面和五个反面分布到十次投掷中，或者等效地，我们可以形成多少个不同的由五个正面与五个反面组成的序列。其实只是简单的从十个位置中选取五个给正面或者反面，那么总共会有种方法。因此，将满足的结果数除以结果总数，我们发现