HTTPS原理

概念

HTTPS = HTTP over TLS

握手

HTTP只需要TCP握手,2*RTT

HTTPS握手类型

  • 完全握手
    多2*RTT
    • 阶段一:
      Client => Server: 支持版本、密码套件
      Client <= Server: 密码套件、证书
    • 阶段二:
      Client => Server: 密钥交换、完成
      Client <= Server: 完成
  • 简化握手(TLS 1.2)
    1*RTT
    不需要阶段二
  • 0*RTT握手(TLS 1.3)

HTTPS握手原因

  • 身份认证(证书) => 防冒充
    确保正确的用户访问到正确的网站
    • 证书的作用
      • 确认身份
      • 校验签名
      • 传递公钥
  • 数据加密 => 防窃听
    第三方无法直接查看原始内容
  • 数据一致性 => 防篡改、防抵赖
    及时发现第三方对内容的篡改

Tip: 数字签名

  1. 签名过程:内容经过Hash运算得到摘要,将摘要用私钥加密作为签名
  2. 通过网络传输:将签名和文件一起发送
  3. 接收验证签名: 将内容进行Hash运算得到摘要,将签名用公钥解密也得到一份摘要,两份摘要进行比对
    使用Hash摘要的原因:
  4. 全文直接签名太耗费资源
  5. Hash摘要可以保证内容修改任意部分,摘要都会变化

传输

数据加密

  • 对称加密
    加解密用同一个密钥
  • 非对称加密
    密钥分为公钥和私钥
    可以用公钥加密私钥界面
    也可以私钥加密公钥解密

从性能上来说,对称加密比非对称加密快两个数量级

方案

  • 握手阶段使用非对称加密,协商传输密钥
  • 传输采用对称加密,速度快

访问速度

  • 网络耗时
    最坏情况下会增加7个RTT
  • 计算耗时
    客户端,50ms
    服务端,15ms

微机原理知识汇总

计算机组成

冯诺依曼计算机架构

  • 以运算器为核心、以存储程序原理为基础
  • 组成
    • 运算器
    • 控制器
    • 存储器
    • 输入设备
    • 输出设备
  • 采用二进制进行运算,数据与程序均以二进制形式存放在存储器中
  • 将计算任务分解为若干步骤,每个步骤用指令实现,指令序列即为程序
  • 在CPU的控制下自动进行运算
  • 特点
    • 程序存储,共享数据,顺序执行
    • 属于顺序处理机,适合确定的算法和数值数据的处理
  • 不足
    • 与存储器间大量数据交互,对总线要求高
    • 执行顺序由程序决定,对大型复杂任务较困难
    • 以运算器为核心,处理效率较低
    • 由PC(Program Count)控制执行顺序,难以实现真正的并行处理

微型计算机的工作过程

  • 取一条指令的工作过程
    取一条指令的工作过程
  1. 指令所在地址赋给程序计数器PC并送到地址寄存器AR
  2. PC自动地址加1,AR的内容不变
  3. 将地址寄存器AR的内容放在地址总线上,并送至内存储器,经地址译码器译码,选中相应单元
  4. CPU控制器发出读指令
  5. 在读指令的控制下,把选中内存单元的内容读到数据总线DB
  6. 将读出的内容经过数据总线送到数据寄存器DR
  7. 指令译码,DR将指令送到指令寄存器IR,然后再送到指令译码器ID

微处理器

指令的执行过程

执行一条指令需要执行的步骤

  1. 从存储器中取出指令
  2. 指令译码
  3. 读操作数(如果需要)
  4. 执行指令
  5. 写结果(如果需要)

指令的执行过程

微处理器组成

  • 运算器
    • 组成
      • 算术逻辑单元
      • 通用或专用寄存器组(可单独看成一个组成部分)
      • 内部总线
    • 功能
      • 实现数据的算术运算及逻辑运算
  • 控制器
    • 组成
      • 程序计数器
      • 指令寄存器
      • 指令译码器
      • 时序控制部件
      • 微操作控制部件
    • 功能
      • 指令控制
      • 时序控制
      • 操作控制

8086/8088

  • 16位CPU
  • 20位地址线,可寻址1M空间
  • 8086总线宽度16位,8088总线宽度8
  • 采用+5V电源,频率位5MHz
  • 采用并行流水线工作方式,通过设置指令预取队列实现(相当于有指令缓冲区)
  • 对内存空间实行分段管理
  • 支持多处理器系统
  • 内部结构框图
    8086/8088内部结构框图

8086/8088管脚及功能

  • 管脚示意图

8088管脚示意图

  1. : 地址、状态复用的引脚,三态输出
  2. : 中8位地址信号,三态输出
  3. $AD_0-AD_7$: 地址、数据分时复用的双向信号线,三态
  4. $IO/\overline{M}$: 输入输出/存储器控制信号,三态。低电平访问存储器,高电平访问$I/O$端口
  5. $\overline{WR}$: 写信号输出,三态。低电平为写操作
  6. $DT/\overline{R}$: 数据传送方向控制信号,三态。高电平CPU发送数据,低电平CPU接受数据
  7. $\overline{DEN}$: 数据允许输出,三态。低电平表示DB的数据有效
  8. $ALE$: 地址锁存信号,三态输出。高电平有效
  9. $\overline{RD}$: 读选通信号,三态输出,低电平有效
  10. $READY$: 外部同步控制输入信号,高电平有效
  11. $INTR$: 可屏蔽中断请求输出信号,高电平有效
  12. $NMI$: 非屏蔽中断请求输入信号,上升沿触发
  13. $\overline{INTA}$: 中断响应信号输出,低电平有效
  14. $HOLD$: 总线保持请求信号输入,高电平有效
  15. $HLDA$: 总线保持响应信号输入,高电平有效
  • 工作模式
    • 最小模式
      系统中只有8086/8088一个处理器,所有的控制信号都由8086/8088CPU产生
    • 最大模式
      系统可包含一个以上的处理器

当$MN/\overline{MX}$加上低电平时,CPU工作在最大模式,反之则在最小模式下

8086/8088寄存器

数据寄存器

为避免累赘,例如AL,AH类8位寄存器不列举

  • AX(Accumulator): 累加器,通常用作数据传输媒介
  • BX(Base): 基址寄存器,通常用作存放内存的基地址,常与DS配合使用
  • CX(Count): 计数寄存器,在循环和串操作指令中做计数器
  • DX(Data): 数据寄存器,在寄存器间接寻址的I/O指令中存放I/O端口地址

地址指针寄存器

  • SP(Stack Pointer): 堆栈指针寄存器,它指向栈顶
  • BP(Bace Pointer): 基址指针寄存器,常用来存放内存的基地址,常配合SS来使用

变址寄存器

  • SI(Source Index): 源变址寄存器,用作索引指针
  • DI(Destination Index): 目的变址寄存器,用作索引指针

段寄存器

存放相应段的段地址

  • CS(Code Segment): 代码段寄存器
  • SS(Stack Segment): 堆栈段寄存器
  • DS(Data Segment): 数据段寄存器
  • ES(Extra Segment): 附加段寄存器

控制寄存器

  • IP(Instructions Pointer): 指令指针寄存器
  • FLAGS: 标志寄存器

标志寄存器

物理地址与逻辑地址的转换(存储器分段)

物理地址 = 段基址 * 16 + 段内偏移地址

如段地址为1000H,偏移地址为1234H,则

物理地址 = $1000H * 16 + 1234H = 10000H + 1234H = 11234H$

堆栈操作

  • 每次压栈(PUSH)和退栈操作(POP)均以字(双字节)为单位
  • 栈的增长方向是从高地址到低地址

如将82F0H压栈,[SP] = F0H[SP+1] = 82H,如下图所示

栈操作图示

内存中的数据特点

  • 数据再内存中从低地址到高地址顺序存放
  • 数据位大于8位时,高字节放在高地址,低字节放在低地址
  • 数据的地址指它的最低字节所在内存单元的地址

系统总线

  • 按传输数据类型分类
    • 数据总线
    • 地址总线
    • 控制总线
  • 按相对CPU位置分类
    • 片内总线
    • 片外总线
  • 按层次结构分

    • CPU总线
    • 系统总线
    • 外部总线
  • 总线结构

    • 单总线结构:简单,但竞争严重
    • 多总线结构:性能高,但组成复杂
  • 性能指标

    • 带宽
    • 位宽
    • 工作频率

$总线带宽 = (位宽/8)*(工作频率/每个存取周期的时钟数)$

8086/8088指令系统

寻址方式

  • 立即寻址
    eg. MOV AX, 1200H
  • 直接寻址
    eg. MOV AX, [8000H]
  • 寄存器寻址
    eg. MOV AX, BX
  • 寄存器间接寻址
    eg. MOV AX, [BX]
  • 寄存器相对寻址
    eg. MOV AX, [BX + 1]
  • 基址-变址寻址
    指令中不允许同时出现两个基址寄存器或者两个变址寄存器
    eg. MOV AX, [BX][SI] or MOV AX, [BX + SI]
  • 基址-变址-相对寻址
    eg. MOV AX, [BX][SI]5

数据传送指令

  • MOV: 一般传输指令(源操作数和目标操作数不能同时为存储器操作数)
  • PUSH/POP: 堆栈操作指令
  • PUSHF/POPF: 将标志寄存器压栈或者从堆栈弹出
  • XCHG: 交换指令
  • IN/OUT: 输入输出指令
  • LEA: 取偏移地址指令

算术运算指令

加法指令

  • ADD: 不考虑进位的加法指令
  • ADC: 带进位的加法指令
  • INC: 加一指令

减法指令

  • SUB: 不考虑借位减法指令
  • SBB: 带借位的减法指令
  • DEC: 减一指令
  • NEG: 求补指令
  • CMP: 比较指令

乘法指令

  • MUL: 乘法指令

除法指令

  • DIV: 除法指令

逻辑运算与移位指令

逻辑指令

  • AND: 逻辑‘与’指令
  • OR: 逻辑‘或’指令
  • NOT: 逻辑‘非’指令
  • XOR: 逻辑‘异或’指令
  • TEST: 测试指令

移位指令

  • SAL: 算术左移指令
  • SAR: 算术右移指令
  • SHL: 逻辑左移指令
  • SHR: 逻辑右移指令
  • ROL: 不带进位的循环左移指令
  • ROR: 不带进位的循环右移指令
  • RCL: 带进位的循环左移指令
  • RCR: 带进位的循环右移指令

串操作指令

要预先设置源串指针(DS:[SI]),目标串指针(ES:[DI]),重复次数(CX),操作方向(DF),使用CLD or STD

重复前缀

共同特点,使用前要设置CX,每重复一次CX自减1,为0时停止

  • REP: 无条件重复
  • REPE(Repeat if Equal): 相等重复
  • REPZ(Repeat if Zero): 为0重复
  • REPNE(Repeat if Not Equal): 不相等重复
  • REPNZ(Repeat if Not Zero): 不为0重复

串操作指令

每次循环会使SI和DI自增一个字或者字节(取决于指令)

  • MOVS, MOVSB, MOVSW: 串传送
  • CMPS, CMPSB, CMPSW: 串比较
  • SCAS, SCASB, SCASW: 串扫描
  • LODS, LODSB, LODSW: 串装入
  • STOS, STOSB, STOSB: 串送存

每种串操作有三种格式,第一种格式是需要手动设置操作数的,第二种是默认使用预先设置的源串指针(DS:[SI]),目标串指针(ES:[DI])来按字节操作,第三种则是按操作

程序控制指令

转移指令

  • JMP: 无条件转移指令(加修饰符FAR可段间调用)
  • JC/JNC: 判断CF的状态,常用于比大小
  • JZ/JNZ: 判断ZF的状态,常用于循环体的结束判断
  • JO/JNO: 判断OF的状态,常用于有符号数的溢出判断
  • JP/JPE: 判断PF的状态,用于判断运算结果低八位1的个数是否为偶数
  • JA/JAE/JB/JBE: 判断CF或CF+ZF的状态,常用于无符号数的比较

更多指令查看下表
转移指令

循环指令

循环次数由预先设置的CX决定

  • LOOP: 无条件循环指令

过程调用和返回

调用时将IP压入堆栈,如果是段间调用(FAR)还要先将CS压入堆栈

  • CALL: 调用子程序(加修饰符FAR可实现段间调用)
  • RET: 从堆栈中弹出IP,返回到原程序

中断指令

  • INT: 中断程序调用,后跟中断类型码
  • 执行过程

    • 将FLAGS压入堆栈
    • 将INT指令的下一条指令的CSIP压栈
    • 由中断类型码乘4获得中断向量存放的地址
    • 将中断向量(中断服务程序入口地址)放入CSIP
    • 转入中断服务程序运行
  • IRET: 中断程序返回,恢复原程序的CSIPFLAGS

汇编

使用Hexo + GitHub Pages创建博客

使用Hexo + GitHub Pages创建博客

搭建博客

使用hexo搭建博客,具体过程点我

配置github pages

新建一个github repo

项目名为<yourUserName>.github.io

新建Github Repo

最简单的方法,将构建产物public push到这个项目,博客就搭建起来了

然后通过<yourUserName>.github.io即可访问你的博客

生成Github token

点击setting

Setting

然后点击Developer Settings -> Personal access tokens -> Generate new token

填写表单即可生成token

new Token

配置项目_config.yml

修改deploy部分,官方文档

1
2
3
4
5
deploy:
- type: git
repo: https://github.com/<username>/<username>.github.io.git
branch: <yourBranch>
token: <yourToken>

发布博客

$ hexo deploy
或者
$ npm deploy

然后访问<yourUserName>.github.io即可

使用Hexo创建博客

使用Hexo创建博客

11].pdf`)

环境准备

安装node.js和git

安装Hexo

准备好环境后,即可使用npm安装Hexo脚手架

$ npm install -g hexo-cli

开始搭建

$ hexo init # 创建项目
$ cd # 进入项目文件夹
$ npm install # 安装node依赖

项目目录结构如下

1
2
3
4
5
6
7
8
9
.
├── _config.yml
├── package.json
├── scaffolds
├── source
├── _drafts
└── _posts
└── themes
└──landscape

source/_posts下新建markdown文件即可开始写作

官方写作规范

运行

$ hexo server
或者
$ npm server

localhost:4000即可访问博客

配置网站信息

编辑_config.yml即可修改网站信息,配置信息文档

发布网站

$ hexo generate
或者
$ npm bulid

项目根目录文件夹下的public文件夹即为构建产物文件夹

public发布为静态网站即可

概率论总结(部分)

概率论总结(部分)

概率论的基本概念

随机试验

  • 确定性现象
    在一定条件下必然发生的现象
  • 随机现象
    在实验或观察前无法预知出现什么结果
  • 统计规律性
    随机试验在一次实验或观察的结果具有不确定性,但是在大量重复实验或观察呈现出某种规律性,称为统计规律性
  • 随机试验的特点

    1. 可在相同条件下重复进行
    2. 每次试验的结果可能不止一个,但能确定所有可能的结果
    3. 在一次试验之前无法确定具体是哪种结果出现

    在概率论中,将具有上述三个特点的试验称为随机试验,简称试验

样本空间、随机事件

样本空间

  • 定义
    随机试验E的所有可能结果所组成的集合称为样本空间,记为S
    样本空间的元素,即E的每个结果,称为样本点

随机事件

  • 定义
    试验E的样本空间S的子集为E的随机事件,简称事件
    在每次试验中,当且仅当这一子集的一个样本点出现时,称这一事件发生

  • 基本事件
    由一个样本点组成的单点集,称为基本事件

事件关系的运算

  • 研究规则
    事件间的关系和运算应该按照集合之间的关系和运算来规定

  • 运算法则

    1. 包含
      若$A\subset B$,则称事件B包含事件A,这是指事件A的发生必然导致事件B发生
      若$A\subset B$且$B\subset A$,即$A=B$,则称事件A与事件B相等
    2. 和事件
      事件$A\cup B={ x|x\in A $或$x\in B}$称为事件A与事件B的和事件。当且仅当A,B中至少有一个发生时事件$A \cup B$发生
    3. 积事件
      事件$A\cap B={ x|x\in A $且$x\in B}$称为事件A与事件B的积事件。当且仅当A,B中同时发生时事件$A \cap B$发生,记作$AB$
    4. 差事件
      事件$A - B={ x|x\in A $且$x\notin B}$称为事件A与事件B的积事件。当且仅当A发生B不发生时事件$A - B$发生
    5. 互斥
      若$A\cap B=\phi$,则称事件A与事件B是互不相容的,或互斥的,这指的是事件A与事件B不能同时发生
      基本事件是两两互不相容的
    6. 逆事件
      若$A\cup B=S$且$A\cap B=\phi$,则称事件A与事件B互为逆事件,又称事件A与事件B互为对立事件,记为$\overline{A}, \overline{A}=S-A$
      按差事件和对立事件的定义,显然有$A-B=A\overline{B}$
  • 运算律

    • 交换律
    • 结合律
    • 分配律

频率与概率

频率

  • 定义
    在相同条件下,进行了n次试验,在这n次试验中,事件A发生的次数$n_A$称为事件A发生的频数,记作$f_n(A)$

  • 性质

    1. $0 \leq f_n(A)\leq 1$
    2. $f_n(S)=1$
    3. 若$A_1, A_2,\dotsc,A_k$是两两互不相容事件,即对于$i\neq j$,$A_iA_j=\phi$,$i,j=1,2,\dotsc,k$,则

概率

  • 统计定义
    在相同条件下,重复进行n次试验,若事件A发生的频率$f_n(A)$随着试验次数n的增大而稳定在某个常数$p(0\leq p\leq 1)$附近摆动,则称p为事件A发生的概率,记为$p(A)$

  • 定义
    设E为随机试验,S是它的样本空间,对于E的每一事件A赋予一个实数,记为$P(A)$,称为事件A的概率,如果集合函数$P(\cdot)$曼珠下列条件:

    1. 非负性:对于每一个事件A,有$P(A)>0$
    2. 规范性:对于必然事件S,有$P(S)=1$
    3. 可列可加性:若$A_1, A_2,\dotsc,A_k$是两两互不相容事件,即对于$i\neq j$,$A_iA_j=\phi$,$i,j=1,2,\dotsc,k$,则
  • 性质

    • 性质1
    • 性质2(有限可加性)
      若$A_1, A_2,\dotsc,A_n$是两两互不相容事件,则
    • 性质3
      设A,B是两个事件,若$A\subset B$,则有
    • 性质4
      对于任一事件A,有
      $$P(A)\leq 1$
    • 性质5(逆事件概率)
      对于任一事件A,有
    • 性质6(加法公式)
      对于任意两事件A,B有

等可能概型(古典概型)

  • 定义
    具有以下两个特点的试验称为等可能概型,也称为古典概型

    1. 试验的样本空间只包含有限个元素
    2. 试验中每个基本事件发生的可能性相同
  • 性质

    • 设试验的样本空间$S={e_1,e_2,\dotsm,e_n}$,则
    • 若样本空间S包含n个基本事件,事件A包含k个基本事件,则
  • 实际推断原理
    概率很小的事件在一次试验中实际上几乎是不发生的,称为实际推断原理

条件概率

  • 定义
    一般地,设A、B是S中的两个事件,若$P(A)>0$,则

    称为在事件A发生的条件下事件B发生的条件概率

  • 性质
    条件概率$P(\cdot|A)$符合概率定义中的三个条件

    • 非负性:对任一事件B,有$P(B|A)\geq 0$
    • 规范性:对于样本空间S,有$P(S|A)=1$
    • 可列可加性:设$B_1,B_2\dotsm$是两两互斥事件,则
  • 乘法定理

    • 设$P(A)>0$,则有
    • 设$P(AB)>0$,推广
    • 一般地,设$A1,A_2,\dotsm,A_n$为n个事件,$n\geq 2$,且$P(A_1A_2\dotsm A{n-1})>0$,则有
  • 划分
    设S为试验E的样本空间,$B_1,B_2,\dotsm B_n$为E的一组事件,若

    1. $B_iB_j=\phi, i\neq j,~~i,j=1,2,\dotsm,n$
    2. $B_1\cup B_2\cup\dotsm\cup B_n=S$
      则称$B_1,B_2,\dotsm B_n$为样本空间的一个划分
  • 全概率公式
    设试验E的样本空间为S,A为E的事件,$B_1,B_2,\dotsm B_n$为S的一个划分,且$P(B_i)>0~(i=1,2,\dotsm,n)$,则全概率公式为

  • 贝叶斯公式
    设试验E的样本空间为S,A为E的事件,$B_1,B_2,\dotsm B_n$为S的一个划分,且$P(B_i)>0~(i=1,2,\dotsm,n)$,则贝叶斯公式为

  • 总结

    • 条件概率是求事件A发生条件下事件B发生的概率
    • 乘法公式是求“几个事件同时发生”的概率
    • 全概率公式是求“最后结果”的概率
    • 贝叶斯公式是已知“最后结果”,求“原因”的概率

独立性

  • 定义
    设A,B是两个事件,如果满足等式
    则称事件A、B相互独立,简称A、B独立

  • 相互独立与互不相容的区分

    • A、B相互独立 $\Longrightarrow P(AB)=P(A)P(B)$
    • A、B互不相容 $\Longrightarrow AB=\phi \Longrightarrow P(AB)=0$
      若$P(A)>0,P(B)>0$则A、B相互独立与A、B互不相容不能同时成立
  • 定理一
    设A、B是两事件,且$P(A)>0$,若A、B相互独立,则$P(B|A)=P(B)$反之亦然

  • 定理二
    设A、B是两事件,若A、B相互独立,则$A与\overline{B},\overline{A}与B,\overline{A}与\overline{B}$都相互独立

  • 多事件相互独立
    一般地,设$A_1,A_2,\dotsm,A_n (n\geq2)$个事件,如果对其中任意2个,3个,$\dotsm$,n个事件的积事件概率,都等于各事件概率之积,则称事件$A_1,A_2,\dotsm,A_n$相互独立

  • 推论
    若事件$A_1,A_2,\dotsm,A_n (n\geq2)$相互独立

    1. 其中任意$k(2\leq k\leq n)$个事件也是相互独立的
    2. 则将$A_1,A_2,\dotsm,A_n$中任意多个换成它们的对立事件,所得的n个事件仍然相互独立

随机变量及其分布

随机变量

  • 定义
    设$X=X(e)$是定义在样本空间S上的单值实值函数,称$X=X(e)$为随机变量
    随机变量通常用大写字母$X,Y,Z,W\dotsm$等表示

一般地,若L是一个实数集合,将X在L上取值写成${X\in L}$,它表示事件$A={e|X(e)\in L}$,即A是由S中使得$X(e)\in L$的所有样本点e所组成的事件,此时有

离散型随机变量及其分布律

  • 离散型随机变量的定义
    随机变量的全部可能取值是有限个或者可列无限个,这种随机变量称为离散型随机变量

  • 分布律
    设$X$所有可能取的值为$x_k(k=1,2,\dotsm)$,而
    $p_k$满足如下两个条件

    1. $p_k\geq 0, ~k=1,2,\dotsm$
    2. $\sum_{k=1}^{\infty}p_k=1$

    分布律也可以用表格表示

    $X$|$x_1$|$x_2$|$\dotsm$|$x_n$|$\dotsm$
    :-:|:-:|:-:|:-:|:-:|:-:
    $p_k$|$p_1$|$p_2$|$\dotsm$|$p_n$|$\dotsm$

(0-1)分布

设随机变量$X$只可能取0与1两个值,则称$X$服从$(0-1)$分布或两点分布,它的分布律是

$X$ $x_1$ $x_2$
$p_k$ $1-p$ $p$

二项分布

  • 伯努利试验
    设试验$E$只有两个可能结果:$A$及$\overline{A}$,则称$E$为伯努利试验
    设$P(A)=p~~~(0<p<1)$,此时$P(\overline{A})=1-p$
    将$E$独立地重复进行n次试验,则称这一串重复的独立试验为n重伯努利试验

n重伯努利试验即为二项分布

  • 二项分布
    设随机变量$X$服从参数为$n,p$的二项分布,记作$X\sim B(n,p)$则

泊松分布

设随机变量$X$所有可能的值为$0,1,2,\dotsm$,而取各个值的概率为

其中$\lambda>0$是常数,则称$X$服从参数为$\lambda$的泊松分布,记为$X\sim \pi(\lambda)$

总结

  • 二项分布$\xrightarrow{n=1}$两点分布
  • 二项分布$\xrightarrow{np\rightarrow\lambda(n\rightarrow\infty)}$泊松分布
  • 二项分布$\xrightarrow{n\rightarrow\infty}$正态分布
  • 二项分布中,当n很大,p很小时,可近似为

随机变量的分布函数

  • 定义
    设$X$是一个随机变量,$x$是任意实数,函数$F(x)=P{X\leq x}$称为$X$的分布函数

  • 基本性质

    1. $F(x)$是一个不减函数
    2. $0\leq F(x)\leq 1$,且
    3. $F(x+0)=F(x)$,即$F(x)$是右连续的

一般地,设离散型随机变量$X$的分布律为

分布函数$F(x)$在$x=x_k(k=1,2,\dotsm)$处有跳跃,其跳越值为$p_k=P{X=x_k}$

连续型随机变量及其概率密度

  • 定义
    如果对于随机变量$X$的分布函数$F(x)$,存在非负可积函数$f(x)$,使对于任意实数$x$有则称$X$为连续型随机变量,其中函数$f(x)$称为$X$的概率密度函数,简称概率密度

  • 性质

    1. $f(x)\geq 0$
    2. $\int_{+\infty}^{-\infty}f(x)dx=1$
    3. 任意实数$x_1,x_2,(x_1\leq x_2)$,则
    4. 若$f(x)$在点$x$连续,则有$F’(x)=f(x)$
    5. 对于任意可能值$a$,连续型随机变量取$a$的值为0,$P{X=a}=0$
    6. 连续型随机变量取值落在某一区间的概率与区间的开闭无关

均匀分布

设连续型随机变量$X$具有概率密度

则称$X$在区间$(a,b)$上服从均匀分布,记为$X\sim U(a,b)$

其分布函数为

指数分布

设连续型随机变量$X$具有概率密度

其中$\theta>0$为常数,则称$X$服从参数为$\theta$的指数分布

$X$的分布函数为

  • $X$服从指数分布,则任给$x,t>0$,有
    该性质称为无记忆性

正态分布

设连续型随机变量$X$具有概率密度

其中$\mu, \sigma(\sigma>0)$为常数,则称$X$服从参数为$\mu,\sigma$的正态分布或高斯分布,记为$X\sim N(\mu, \sigma^2)$

$X$的分布函数为

  • 性质

    • 曲线关于$x=\mu$对称
    • 当$x=\mu$时取到最大值
    • $x$离$\mu$越远,$f(x)$的值越小
    • 在$x=\mu\pm\sigma$处曲线有拐点
    • 曲线以$Ox$轴为渐近线
  • 标准正态分布
    特别地,称$N\sim(0,1)$为标准正态分布,其概率密度函数和分布函数常分别用$\varphi(x)$和$\varPhi(x)$表示

    任何一个一般的正态分布都可以转化为标准正态分布,即

    若$X\sim N(0,1)$,则

    • $\varPhi(-x)=1-\varPhi(x)$
    • $P{a<X<b}=\varPhi(b)-\varPhi(a)$
  • 上$\alpha$分位点
    设$X\sim N(0,1)$,若$z_\alpha$满足条件

    则称点$z\alpha$为标准正态分布的上$\alpha$分位点,可知$z{1-\alpha}=-z_\alpha$
    image

随机变量的函数的分布

  • 定义
    已知随机变量$X,Y$,$X$的分布律(概率密度)已知,$Y=g(X)$,$g$为连续函数,则随机变量$Y$的分布就称为随机变量$X$的函数的分布

  • 离散型
    若随机变量$X$为离散型,则直接代入计算$Y$的分布律,若有值相同的,合并即可

  • 连续型
    设随机变量$X$具有概率密度$f_X(x)$,其中$-\infty<x<+\infty$,设函数$g(x)$处处可导,且恒有$g’(x)>0$(或恒有$g’(x)<0$),则$Y=g(X)$也是连续型随机变量,其概率密度为

    其中$\alpha=min(g(-\infty), g(+\infty)),\beta=max(g(-\infty), g(+\infty)),h(y)$是$g(x)$的反函数

多维随机变量及其分布

二维随机变量

  • 定义
    设$E$是一个随机试验,其样本空间为$S={e}$,设$X=X(e)$和$Y=Y(e)$是定义在$S$上的随机变量,由它们构成的一个向量$(X,Y)$,叫做二维随机向量或二维随机变量

  • 联合分布函数
    设$(X,Y)$是二维随机变量,对于任意实数$x,y$,二元函数: 称为二维随机变量$(X,Y)$的分布函数,或称为随机变量$X$和$Y$的联合分布函数
    image

  • 分布函数的性质

    1. $F(x,y)$是变量$x,y$的不减函数
    2. $0\leq F(x,y)\leq 1$
    3. $F(x,y)=F(x+0,y),F(x,y)=F(x,y+0)$

二维离散型随机变量

  • 定义
    若二维随机变量$(X,Y)$全部可能取到的值的有限对或者可列无限多对,则称$(X,Y)$为二维离散型随机变量

  • 分布律
    设二维随机变量$(X,Y)$所有可能取的值为$(X_i,y_i),~i,j=1,2,\dotsm$,记

    称上式为二维离散型随机变量$(X,Y)$的分布律,或随机变量$X$和$Y$的联合分布律,其中

  • 分布函数
    二维离散型随机变量的$(X,Y)$的分布函数为
    上式是对一切满足$x_i\leq x,y_i\leq y$的$i,j$求和

二维连续型随机变量

  • 定义
    对于二维随机变量$(X,Y)$的分布函数$F(x,y)$,如果存在非负可积的函数$f(x,y)$使对于任意$x,y$有

    则称$(X,Y)$是二维连续型随机变量,函数$f(x,y)$称为二维随机变量$(X,Y)$的概率密度,或称为随机变量$X$和$Y$的联合概率密度

  • 性质

    1. $f(x,y)\geq 0$
    2. $\int{-\infty}^{+\infty}\int{-\infty}^{+\infty}f(x,y)dxdy=F(\infty,\infty)=1$
    3. 设$G$是$xOy$平面上的一个区域,点$(X,Y)$落在$G$内的概率为
    4. 若$f(x,y)$在$(x,y)$连续,则有$\frac{\partial^2F(x,y)}{\partial x \partial y}=f(x,y)$

边缘分布

边缘分布函数

二维随机变量$(X,Y)$作为一个整体,具有分布函数$F(x,y)$,而$X$和$Y$都是随机变量,也有各自的分布函数,分别记为$F_X(x),F_Y(y)$,依次称为二维随机变量$(X,Y)$关于$x,y$的边缘分布函数

离散型随机变量的边缘分布

设二维离散型随机变量$(X,Y)$的联合分布律为

分别称$p{i\cdot}$和$p{\cdot j}$为$(X,Y)$关于$X$和关于$Y$的边缘分布律

连续型随机变量的边缘分布

对于连续性随机变量$(X,Y)$,设它的概率密度为$f(x,y)$,则$X,Y$的边缘分布和边缘概率密度为

  • 均匀分布
    设$G$是平面上的有界区域,其面积为$A$,若二维随机变量$(X,Y)$具有概率密度则称$(X,Y)$在$G$上服从均匀分布
  • 正态分布
    太长了。。。就不写了

条件分布

设有两个随机变量$X,Y$,在$Y$取某个值或某些值的情况下,$X$的概率分布即为条件概率

二维离散型随机变量的条件分布

设$(X,Y)$是二维离散型随机变量,对于固定的$j$,若$P{Y=y_i}>0$,则称

为在$Y=y_i,i=1,2,\dotsm$条件下随机变量$X$的条件分布律
同理,在$X=x_i,
i=1,2,\dotsm$条件下随机变量$Y$的条件分布律为

二维连续型随机变量的条件分布

设二维随机变量$(X,Y)$的概率密度为$f(x,y),~(X,Y)$关于$Y$的边缘概率密度为$f_Y(y)$,若对于固定的$y$,$f_Y(y)>0$,则$Y=y$的条件下$X$的条件概率密度为

条件分布函数为

同理,在$X=x$的条件下$Y$的条件概率密度为

条件分布函数为

相互独立的随机变量

  • 定义
    设$F(x,y)$及$F_X(x),F_Y(y)$分别是二维随机变量$(X,Y)$的分布函数及边缘分布还是。若对于所有的$x,y$有

    则称随机变量$X,Y$是相互独立的。

  • 离散型随机变量
    若离散型随机变量$X$和$Y$的联合分布律为

    $X$和$Y$相互独立$\Leftrightarrow P{X=xi, Y=y_j}=P{X=x_i}{Y=y_j}\Leftrightarrow p{ij}=p{i\cdot}p{\cdot j}$

  • 连续型随机变量
    设$(X,Y)$是二维连续型随机变量,具有概率密度为$f(x,y)$,边缘概率密度分别为$f_X(x),f_Y(y)$。
    $X$和$Y$相互独立$\Leftrightarrow f(x,y)=f_X(x)f_Y(y)$

两个随机变量的函数的分布

  • $Z=X+Y$的分布
    设$(X,Y)$是二维连续型随机变量,具有概率密度为$f(x,y)$,则$Z=X+Y$的概率密度为

    若$X$和$Y$独立,设$(X,Y)$关于$X,Y$的边缘概率密度为$f_X(x),f_Y(y)$,则

    上式称为卷积公式

    若$X_i\sim N(\mu_i, \sigma_i^2), i=1,2,\dotsm$,则

  • $M=max(X,Y)$和$N=min(X,Y)$的分布
    设$X$和$Y$是两个相互独立的随机变量,它们的分布函数分别为$F_X(x)$和$F_Y(y)$,则$M=max(X,Y)$和$N=min(X,Y)$的分布函数为

随机变量的数字特征

数学期望

离散型随机变量的数学期望

设$X$是离散型随机变量,它的分布律为

若级数$\sum{k=1}^\infty x_kp_k$绝对收敛,则级数$\sum{k=1}^\infty x_kp_k$的和为随机变量$X$的数学期望,简称期望,又称为均值

连续型随机变量的数学期望

设$X$是连续型随机变量,其概率密度函数为$f(x)$,如果积分

绝对收敛,则称此积分值为$X$的数学期望,即

随机变量的函数的数学期望

设$Y$是随机变量$X$的函数:$Y=g(X)$($g$是连续函数)

  • 当$X$为连续型时,它的分布律为$P{X=xk}=p_k,~(k=1,2,\dotsm)$,若$\sum{k=1}^\infty g(x_k)p_k$绝对收敛,则有

  • 当$X$为连续型时,它的概率密度为$f(x)$,若$\int_{-\infty}^{+\infty} g(x)f(x)dx$绝对收敛,则有

数学期望的性质

  1. 设$C$为常数,则$E(C)=C$
  2. 设$k$为常数,则$E(kX)=kE(X)$
  3. $E(X+Y)=E(X)+E(Y)$
  4. 设$X$和$Y$相互独立,则$E(XY)=E(X)E(Y)$

方差

定义

设$X$是一个随机变量,若$E([X-E(X)]^2)$存在,称$E([X-E(X)]^2)$为$X$的方差。记为$D(X)$或$Var(X)$,即

方差的算术平方根$\sqrt{D(X)}$称为$X$的标准差或均方差,记为$\sigma(X)$

计算

由定义知,方差是随机变量$X$的函数$g(X)=[X-E(X)]^2$的数学期望

  • 离散型
    若$X$是离散型随机变量,它的分布律为$P{X=x_k}=p_k,~k=1,2,\dotsm$,则

  • 连续型
    若$X$为连续型时,它的概率密度为$f(x)$,则

性质

  1. 设$C$为常数,则$D(C)=0, D(X+C)=D(X)$
  2. 设$k$为常数,则$D(kX)=k^2D(X)$
  3. $D(X+Y)=D(X)+D(Y)+2E([X-E(X)][Y-E(Y)])$
  4. $D(X)=0 \Leftrightarrow P{X=C}=1$,这里$C=E(X)$
  5. 设$X$和$Y$相互独立,则$D(X+Y)=D(X)+D(Y)$
分布 参数 数学期望 方差
两点分布 $0<p<1$ $p$ $p(1-p)$
二项分布 $n\geq 1,0<p<1$ $np$ $np(1-p)$
泊松分布 $\lambda>0$ $\lambda$ $\lambda$
均匀分布 $a<b$ $(a+b)/2$ $(b-a)^2/12$
指数分布 $\theta>0$ $\theta$ $\theta^2$
正态分布 $\mu, \sigma>0$ $\mu$ $\sigma^2$

切比雪夫不等式

设随机变量$X$具有数学期望$E(X)=\mu$,方差$D(X)=\sigma^2$,则对于任意正数$\varepsilon$,有不等式

由切比雪夫不等式可以看出,若$\sigma^2$越小,则事件${|X-E(X)|\geq \varepsilon}$的概率越大

协方差及相关系数

协方差

  • 定义
    $E([X-E(X)][Y-E(Y)])$称为随机变量$X$和随机变量$Y$的协方差,记为$Cov(X,Y)$,即

  • 性质

    1. $Cov(X,Y)=Cov(Y,X)$
    2. $Cov(aX,bY)=ab~Cov(X,Y)$,$a,b$为常数
    3. $Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)$
    4. 若$X$与$Y$相互独立,$Cov(X,Y)=0$
    5. $Cov(X,X)=E(X^2)-E(X)^2=D(X)$

相关系数

  • 定义
    设$D(X)>0,D(Y)>0$,称

    为随机变量$X$和$Y$的相关系数,在不混淆的情况下,记$\rho_{XY}$为$\rho$

  • 性质

    1. $|\rho|\leq 1$
    2. $X$和$Y$相互独立时,$\rho=0$,但其逆不真
    3. $|\rho|=1\Leftrightarrow X,Y$线性相关

矩、协方差矩阵

原点矩、中心矩

设$X$和$Y$是随机变量,若

存在,称它为$X$的$k$阶原点矩,简称$k$阶矩

存在,称它为$X$的$k$阶中心距
可见,均值$E(X)$是$X$的$k$阶中心矩,方差$D(X)$是$X$的二阶中心矩

协方差矩阵(不考)

大数定律及中心极限定理

大数定律

  • 背景
    大量随机试验中,事件发生的频率稳定于某一常数,测量值的算术平均值具有稳定性
  • 概念
    概率论中用来阐明大量随机现象平均结果的稳定性的一系列定理,称为大数定律

依概率收敛

  • 定义
    设$Y_1,Y_2,\dotsm,Y_n\dotsm$是一个随机变量序列,$a$是一个常数。若对于任意正数$\varepsilon$,有

    则称序列$Y_1,Y_2,\dotsm,Y_n\dotsm$依概率收敛于$a$,记为

  • 性质
    设$X_n\xrightarrow{P}a,Y_n\xrightarrow{P}b$,设函数$g(x,y)$在点$(a,b)$连续,则

总结

设随机变量$X_1,X_2,\dotsm,X_n,\dotsm$相互独立

大数定律 表达式 条件
伯努利大数定律
切比雪夫大数定律
辛钦大数定律

$abs()$代表绝对值

中心极限定理

  • 独立同分布下的中心极限定理
    设随机变量$X1,X_2,\dotsm,X_n,\dotsm$相互独立,服从同一分布,具有数学期望和方差:$E(X_k)=\mu,D(X_k)=\sigma^2,(k=1,2,\dotsm)$,则随机变量之和$\sum{k=1}^n X_k$的标准化变量的分布函数为$F_n(x)$对于任意$x$满足

  • 李雅普诺夫定理
    设随机变量$X1,X_2,\dotsm,X_n,\dotsm$相互独立,服从同一分布,具有数学期望和方差:$E(X_k)=\mu_k,D(X_k)=\sigma^2_k,(k=1,2,\dotsm)$,记$B_n^2=\sum{k=1}^n\sigmak^2$,则随机变量之和$\sum{k=1}^n X_k$的标准化变量的分布函数为$F_n(x)$对于任意$x$满足

  • 棣莫弗-拉普拉斯定理
    设随机变量$\eta_n(n=1,2,\dotsm)$服从参数$n,p(0<p<1)$的二项分布,对于任意$x$有

    定理表明,当$n$很大,$0<p<1$是一个定值时,二项分布的随机变量的$\eta_n$分布近似正态分布$N(np,np(1-p))$.

样本及抽样分布

随机样本

总体与个体

  • 研究对象的全体称为总体
  • 总体中每个成员称为个体
  • 总体中所包含的个体的个数称为总体的容量

样本

  • 总体中抽出若干个体而成的的集体,称为样本
  • 样本所含个体的个数,称为样本容量

抽样分布


:D 一言句子获取中...