参数估计与置信区间.docx

上传人:小飞机 文档编号:3351282 上传时间:2023-03-12 格式:DOCX 页数:3 大小:37.76KB
返回 下载 相关 举报
参数估计与置信区间.docx_第1页
第1页 / 共3页
参数估计与置信区间.docx_第2页
第2页 / 共3页
参数估计与置信区间.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《参数估计与置信区间.docx》由会员分享,可在线阅读,更多相关《参数估计与置信区间.docx(3页珍藏版)》请在三一办公上搜索。

1、参数估计与置信区间我们总是希望能够从一些样本数据中去探究数据总体的表现特征,在网站数据分析中也是如此,我们试图从最近几天的数据表现来推测目前网站的整体形势是怎么样的,有没有变好或者变差的信号,但当前几天的数据无法完全代表总体,所以这里只能使用“估计”。同时,网站的数据始终存在波动,将最近时间段的数据作为抽样样本很可能数据正好处于较低或者较高水平,所以我们用样本得到的估计值不可能是无偏差的,我们同时需要去评估这个估计值可能的变化区间。 参数估计是指用样本的统计量去估计总体参数的方法,包括点估计和区间估计。 点估计 点估计是用抽样得到的样本统计指标作为总体某个未知参数特征值的估计,是一种统计推断方

2、法。 一般对总体参数的估计会包括两类:一种是用样本均值去估计总体均值,对应到网站数据中的数值型指标,比如网站每天的UV,我们可以用近一周的日均UV去估计目前网站每天唯一访客数量的大体情况;另外一种是用样本概率去估计总体概率,对应到网站数据中的比率型指标,比如网站的目标转化率,我们可以用近3天的转化率去预估网站当天目标转化的水平;同时我们会计算样本的标准差来说明样本均值或者概率的波动幅度的大小,从而估计总体数据的波动情况。 点估计还包括了使用最小二乘法对线性回归做曲线参数的拟合,以及最大似然估计的方法计算样本集分布的概率密度函数的参数。 区间估计 区间估计是依据抽取的样本,根据一定的正确度与精确

3、度的要求,估算总体的未知参数可能的取值区间。区间估计一般是在一个既定的置信水平下计算得到总体均值或者总体概率的置信区间,一般会根据样本的个数和标准差估算得到总体的标准误差,根据点估计中用样本均值或样本概率估计总体均值或总体概率,进而得出一个取值的上下临界点。 我们可以将样本标准差记作S,如果我们抽样获取的有n个样本,那么总体的标准差就可以用样本标准差估算得到: 从这个公式中我们可以看到大数定理的作用,当样本个数n越大时,总体指标差越小,样本估计值越接近总体的真实值。Excel的图表里面也提供了添加“误差线”的功能: 有了总体的标准差,我们就可以使用区间估计的方法计算总体参数在一定置信水平下的置

4、信区间,置信区间给出了一个总体参数的真实值在一定的概率下会落在怎么样的取值区间,而总体参数落在这个区间的可信程度的这个概率就是置信水平。当抽取的样本数量足够大时,根据“中心极限定理”,我们可以认为样本均值近似地服从正态分布。 根据Z统计量的计算公式: 假如在1-的置信水平下,则总体均值的置信区间为: 这里样本均值和标准差都可以根据抽样的结果计算得到,所以在既定置信水平的条件下,我们只要查Z值表得到相应的Z值就可以计算得到总体均值的置信区间。对于置信水平或者叫置信度的选择,在统计学中一般认为95%的置信度的结果具有统计学意义,但其实在互联网领域数据的分析中不需要这么高的置信度,我们有时也会选择80%或者90%的置信度,相应的Z值见下表: 置信水平1- 对应Z值Z/2 95% 1.96 90% 80% 1.65 1.28 对于总体概率的估计,在具备足够样本数量的条件下,我们用样本概率p预估总体概率,而总体概率的标准差则是sqrt(p(1-p)/n),同样可以计算得到置信区间。 来源:网站数据分析 参数估计与置信区间

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号