2022时政热点事件,2022最新时事新闻热点汇总
2022-11-13
更新时间:2023-01-09 12:54:00作者:51data
正态分布是定量现象的一个方便模型。各种心理测试成绩和现象,如计数,被发现近似服从正态分布。
在开始之前,先看几个重要的概念:
概率函数:事件的概率表示为事件变量的函数。
概率分布函数:随机变量的值小于某个值X的概率,该值是X的函数,这个函数称为随机变量的分布函数,简称分布函数,记为F(x),即F(x)=P(概率密度函数:
概率等于某个区间(事件范围)中某个变量的总概率除以该区间的长度。
概率密度函数是描述随机变量在某个值点附近的可能性的函数。
概率分布函数与概率密度函数的关系;
连续随机变量x的概率分布函数f(x),如果存在非负可积函数F(x),使得对于任意实数x,存在
F(x)是x的概率密度
高斯分布高斯分布由概率密度函数定义:
高斯分布的概率密度函数为:
平均值为,标准差为。
高斯分布的概率分布函数是:
高斯分布标准差在概率密度分布中的数据意义高斯分布重要量的性质
密度的平均值就是它的统计模式和中值函数曲线。68.268949%的面积在平均值周围一个标准差以内,95.449974%在平均值周围两个标准差以内,99.730020%在平均值周围三个标准差以内。第3-5条叫做68-95-99。
举个例子:
查看一些样本数据:
女性的平均体重=127.8
标准偏差(SD)=15.5
标准偏差范围
两个标准差的范围
如何检查你的数据是否是高斯分布?
看直方图!它看起来像钟吗?
计算描述性汇总指标-平均值、中值和模式相似吗?
2/3的观察值在平均值的1倍标准差以内吗?95%的观察值在平均值的2个标准偏差内吗?
中心极限定理的正态分布有一个很重要的性质:在一定条件下,大量统计独立的随机变量之和的分布趋于正态分布,这就是中心极限定理。中心极限定理的意义在于,根据该定理的结论,其他概率分布可以用正态分布来近似。
高斯分布可以从二项式(或泊松)假设中推导出来:
当p不接近1或0时,n很大。
我们有一个连续变量而不是离散变量。
考虑一次扔一枚硬币10000次。
p(人头)=0.5,N=10,000
对于二项式分布:
平均值为=np=5000,标准差为=[NP (1 p)] 1/2=50。
这种二项式分布的概率在 1以内:
高斯分布均值的一个标准差的概率积分:
高斯线性组合的重要性质