数理统计方法2-1
第2章 数理统计的基本概念
§2.1 总体与样本
在概率论中,我们引入了随机变量的概念。所谓随机变量,简单地说,就是随着试验结果的不同而随机地取各种值的变量。
例如,某厂生产了一批电子元件,从这批电子元件中随机地取一个,测试它的使用寿命,这个使用寿命就是一个随机变量。
我们希望知道电子元件的使用寿命服从什么分布,显然,不可能对这批电子元件中的每一个,都作一次使用寿命的测试。
在实际生产中,我们采用的是“抽样试验”的方法,即从这批电子元件中随机地抽取几个、十几个样品,测试它们的使用寿命,然后,根据样品测试的结果,推断出这批电子元件的使用寿命服从什么分布。
这样做,自然会产生一些问题:怎样根据一小部分样品的测试结果,来推断出整体的随机变量的分布?这样的推断,可靠性如何?还有,怎样使试验次数尽可能少一些,而仍然能得到我们所需要的结果?这一切,正是数理统计这门学科要研究的问题和要解决的任务。
在数理统计中,我们把作为统计研究对象的随机变量(例如上面例子中电子元件的使用寿命),称为总体,记为 ?,?,? (或记为X,Y,?)。对总体进行 n 次试验后所得到的结果,称为样本,记为(X1,X2,?,Xn),(Y1,Y2,?,Yn),??,其中,试验次数 n 称为样本容量。样本(X1,X2,?,Xn)中的每一个 Xi 都是随机变量。样本所取的一组具体的数值,称为样本观测值,记为(x1,x2,?,xn) 。
样本观测值(x1,x2,?,xn)是我们做了 n 次试验以后,得到的具体的结果,它们的取值是已知的,确定的,所以,样本观测值(x1,x2,?,xn)中的每一个 xi 都是数字。样本(X1,X2,?,Xn)是我们预计做 n 次试验后,可能会得到的结果,在试验未做之前,试验会得到什么结果是未知的,不确定的,它们的取值是随机的,随着试验结果不同而取各种不同的值,所以,样本(X1,X2,?,Xn)中的每一个 Xi 都应该看作是随机变量。
实际问题中的样本(X1,X2,?,Xn),一般来说,都具有下列两条性质:
(1)独立性,即 X1,X2,?,Xn 相互独立。
(2)同分布性,即每一个 Xi 都与总体 ? 服从相同的分布。
凡是具有这两条性质的样本,称为简单随机样本 。今后我们讲到“样本”,总是指简单随机 17
样本,也就是说,我们认为样本都是具有独立性和同分布性的。
如果总体 ? 是离散型随机变量,概率分布为 P{??k} , k?1,2,3,? , 则样本(X1,X2,?,Xn) 的联合概率分布为
P{X1?x1,X2?x2,?,Xn?xn}?P{X1?x1}P{X2?x2}?P{Xn?xn}
?P{??x1}P{??x2}?P{??xn}??P{??xi} ,xi?1,2,3? (i?1,2,?,n) 。.
i?1n
如果总体?是连续型随机变量,概率密度为 ?(x),则样本(X1,X2,?,Xn) 的联合概率密度为
?*(x1,x2,?,xn)??X(x1)?X(x2)??X(xn)??(x1)?(x2)??(xn)???(xi) 。 12nni?1
例1 设总体 ?~P(?),(X1,X2,X3)是?的样本,求(X1,X2,X3) 的联合概率分布。
解 因为?~P(?),? 的概率分布为 P{??k}?
(X1,X2,X3) 的联合概率分布为 ?kk!e??,k?0,1,2,?。 所以
?P{??x}??x!ei
i?133?xii?????xii?13i?1?x!i
i?13e?3? , xi?0,1,2,? (i?1,2,3)。.
例2 设总体?~E(?),(X1,X2,X3)是?的样本,求 (X1,X2,X3) 的联合概率密度。
??e??x
解 因为?~E(?),概率密度为 ?(x)???0
合概率密度为 x?0 。所以 (X1,X2,X3) 的联x?0
3?33???e??xi?(xi)??i?1?i?1?0?
???xixi?0(i?1,2,3)??3e?i?1???其他?0minxi?0 。 i其他
§2.2 用样本估计总体的分布
18
2.2.1 经验分布函数
数理统计的一个主要任务,就是要用样本估计总体的分布。
设F(x)?P{??x}为总体?的分布函数。称
Fn(x)?样本(X1,X2,?,Xn)中?x的值的个数 ,???x??? , 样本观测次数n
为经验分布函数(或样本分布函数)。
从这个定义可以看出,如果将样本观测值x1,x2,?,xn按从小到大的次序排列成
x(1)?x(2)???x(n) ,
则有
?0当x?x(1)?Fn(x)??in当x(i)?x?x(i?1),i?1,2,?,n?1 ,
?1当x?x(n)?
Fn(x)是一个单调非降的阶梯函数。
因为
Fn(x)?样本(X1,X2,?,Xn)?x的频率 ≈ 总体??x的概率 ?P{??x}?F(x) , 所以,当 n充分大时,经验分布函数Fn(x)是总体分布函数F(x)的良好近似。
1933年,俄国数学家格里文科(Γливенко)证明了
P{limsupn?????x???Fn(x)?F(x)?0}?1 ,
即Fn(x)以概率1一致收敛于F(x)。
2.2.2 频率直方图
如果总体?是一个连续型随机变量,我们可以用下列方法来估计它的概率密度 ?(x): 作分点 a?a0?a1?a2???ar?b,将?的样本取值范围 (a,b) 分成r个区间。设共进行了n次试验,落在区间 (ak?1,ak] 中的样本观测值的个数为 nk ,nk 称为频数,nkn 称为频率。在每一个区间 (ak?1,ak] 上,以
到的一排长方形,称为频率直方图(见图2-1 )。 nkn 为高度,作长方形。这样得ak?ak?1
19
由于
区间(ak?1,ak]上频率直方图的面积 ?nkn(ak?ak?1) ?nkn ak?ak?1
= 样本落在区间(ak?1,ak]中的频率 ≈ 总体落在区间(ak?1,ak]中的概率 ???(x)dx = 区间(ak?1,ak]上?(x)曲线下的曲边梯形的面积 , ak?1ak
所以,可以用频率直方图来近似估计总体分布的概率密度 ?(x)。
如果总体?是一个离散型随机变量,我们可以用下列方法来估计它的概率分布P{??xk},k?1,2,? :
设共进行了 n 次试验,取值为 xk 的样本观测值的个数(频数)为 nk。 由于 nkn = 样本取值为xk的频率 ≈ 总体取值为xk的概率 = P{??xk} ,所以,可以用 nkn 来近似估计总体的概率分布P{??xk},k?1,2,? 。
§2.3 统计量
样本(X1,X2,?,Xn)的不含未知参数的函数,称为统计量。因为样本是随机变量,所以,作为样本的函数的统计量,也是随机变量。用样本观测值(x1,x2,?,xn)代入统计量的表达式,得到统计量的具体数值,称为统计量的观测值。
内容需要下载文档才能查看
20
常用的统计量有:
1n
样本均值 ??Xi ; ni?1
1n1n22样本方差 S??(Xi?)??Xi?2 ; ni?1ni?12
1n
样本标准差 S?S?(Xi?)2 ; ?ni?12
1nn2修正样本方差 S*?(X?)?S2 ; ?in?1i?1n?12
修正样本标准差 S*?S*?21nn2(X?)?S ; ?in?1i?1n?1
样本m阶(原点)矩 Xm1nm??Xi 。 ni?1
这里有一点要着重说明,在各种数理统计教科书中,关于“样本方差”和“样本标准差”的定义并不一致。在有些教科书中,定义
1n
样本方差 S?(Xi?)2 ; ?n?1i?12
样本标准差 S?1n
(Xi?)2 。 ?n?1i?1
22即把我们定义的修正样本方差S*,称为样本方差,记为S;把我们定义的修正样本
标准差S*,称为样本标准差,记为S。在阅读数理统计文献时,必须注意其中样本方差的定义,以免发生混淆。
用带统计功能的函数型电子计算器可以很方便地计算出统计量的值。常见的计算器有SHARP(夏普)、TRULY(信利)、CASIO(卡西欧)等型号。SHARP计算器和TRULY计算器的用法完全相同,CASIO计算器则与它们有所不同,而且CASIO计算器本身又有多种型号,用法也不尽相同。下面以SHARP和TRULY计算器为例,说明怎样用计算器来计算统计量的值。(同时对CASIO计算器与它们的不同之处,也在括号中稍加说明。)
(1) 进入统计状态
按
内容需要下载文档才能查看 内容需要下载文档才能查看,进入统计状态,屏幕上出现 STAT 。(在 CASIO 计算器上,进入统计状态后,屏幕上出现 SD 。)
(2) 输入样本观测值(x1,
内容需要下载文档才能查看x2,?,xn)
输入数字x1x
内容需要下载文档才能查看2?? x
内容需要下载文档才能查看n。
21
下载文档
热门试卷
- 2016年四川省内江市中考化学试卷
- 广西钦州市高新区2017届高三11月月考政治试卷
- 浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
- 浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
- 辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
- 广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
- 广西钦州市钦州港区2017届高三11月月考政治试卷
- 广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
- 广西钦州市高新区2016-2017学年高二11月月考政治试卷
- 广西钦州市高新区2016-2017学年高一11月月考政治试卷
- 山东省滨州市三校2017届第一学期阶段测试初三英语试题
- 四川省成都七中2017届高三一诊模拟考试文科综合试卷
- 2017届普通高等学校招生全国统一考试模拟试题(附答案)
- 重庆市永川中学高2017级上期12月月考语文试题
- 江西宜春三中2017届高三第一学期第二次月考文科综合试题
- 内蒙古赤峰二中2017届高三上学期第三次月考英语试题
- 2017年六年级(上)数学期末考试卷
- 2017人教版小学英语三年级上期末笔试题
- 江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
- 重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
- 江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
- 江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
- 山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
- 【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
- 四川省简阳市阳安中学2016年12月高二月考英语试卷
- 四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
- 安徽省滁州中学2016—2017学年度第一学期12月月考高三英语试卷
- 山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
- 福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
- 甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷
网友关注
- 2017年首都医科大学105106皮肤病与性病学
- 施工合同网上备案
- 西方艺术之浪漫主义学派Word
- 暖通制冷基础知识Word
- 企业用工常见的十类违法现象Word
- 第10章评估与控制Word
- 人力资源三级重点整理第一章和第二章
- 广东广播电视台声学装修工程可行性研究报告-广州中撰咨询
- 餐劵
- 婴儿三个月健康食谱
- 营销策划格式Word
- 致阿里高考家长的一封信,通过立思辰留学360直接入读世界500强大学
- 夸父追日Word
- 光伏行业基础知识(硅片、电池、组件)Word
- 2017年山东职业学院职业教育活动周任务分解书
- 2017年事业单位考试判断推理“速”解枚举归纳答案
- 生活英语手册(完整版)
- 电子商务第一章Word
- 营销策划格式Word
- 仙林大学城微电影大赛2016
- 幼儿园毕业季 六个主题活动
- 怎么培养优秀的孩子
- 我只是一个人而已
- (好)体积单位之间的进率Word
- 职业经理人之人才管理Word
- 传媒学概论第1章近代报刊的萌芽Word
- 给我一个理由
- 夸父追日Word
- 成都檀香山2期销售策划竞标汇报76页Word
- 综合实践活动课题
网友关注视频
- 冀教版小学数学二年级下册第二单元《有余数除法的竖式计算》
- 冀教版英语四年级下册第二课
- 外研版英语七年级下册module3 unit2第一课时
- 第五单元 民族艺术的瑰宝_15. 多姿多彩的民族服饰_第二课时(市一等奖)(岭南版六年级上册)_T129830
- 人教版二年级下册数学
- 沪教版八年级下册数学练习册一次函数复习题B组(P11)
- 六年级英语下册上海牛津版教材讲解 U1单词
- 沪教版牛津小学英语(深圳用) 五年级下册 Unit 12
- 沪教版牛津小学英语(深圳用) 六年级下册 Unit 7
- 3月2日小学二年级数学下册(数一数)
- 七年级英语下册 上海牛津版 Unit5
- 沪教版八年级下册数学练习册21.3(3)分式方程P17
- 8.对剪花样_第一课时(二等奖)(冀美版二年级上册)_T515402
- 化学九年级下册全册同步 人教版 第25集 生活中常见的盐(二)
- 冀教版小学数学二年级下册1
- 第五单元 民族艺术的瑰宝_16. 形形色色的民族乐器_第一课时(岭南版六年级上册)_T3751175
- 七年级英语下册 上海牛津版 Unit3
- 北师大版小学数学四年级下册第15课小数乘小数一
- 沪教版八年级下册数学练习册20.4(2)一次函数的应用2P8
- 三年级英语单词记忆下册(沪教版)第一二单元复习
- 苏教版二年级下册数学《认识东、南、西、北》
- 外研版英语三起6年级下册(14版)Module3 Unit2
- 冀教版小学英语五年级下册lesson2教学视频(2)
- 【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,辽宁省
- 沪教版牛津小学英语(深圳用) 五年级下册 Unit 7
- 【部编】人教版语文七年级下册《逢入京使》优质课教学视频+PPT课件+教案,安徽省
- 每天日常投篮练习第一天森哥打卡上脚 Nike PG 2 如何调整运球跳投手感?
- 8.练习八_第一课时(特等奖)(苏教版三年级上册)_T142692
- 沪教版牛津小学英语(深圳用) 五年级下册 Unit 10
- 北师大版数学 四年级下册 第三单元 第二节 小数点搬家
精品推荐
- 2016-2017学年高一语文人教版必修一+模块学业水平检测试题(含答案)
- 广西钦州市高新区2017届高三11月月考政治试卷
- 浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
- 浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
- 辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
- 广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
- 广西钦州市钦州港区2017届高三11月月考政治试卷
- 广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
- 广西钦州市高新区2016-2017学年高二11月月考政治试卷
- 广西钦州市高新区2016-2017学年高一11月月考政治试卷
分类导航
- 互联网
- 电脑基础知识
- 计算机软件及应用
- 计算机硬件及网络
- 计算机应用/办公自动化
- .NET
- 数据结构与算法
- Java
- SEO
- C/C++资料
- linux/Unix相关
- 手机开发
- UML理论/建模
- 并行计算/云计算
- 嵌入式开发
- windows相关
- 软件工程
- 管理信息系统
- 开发文档
- 图形图像
- 网络与通信
- 网络信息安全
- 电子支付
- Labview
- matlab
- 网络资源
- Python
- Delphi/Perl
- 评测
- Flash/Flex
- CSS/Script
- 计算机原理
- PHP资料
- 数据挖掘与模式识别
- Web服务
- 数据库
- Visual Basic
- 电子商务
- 服务器
- 搜索引擎优化
- 存储
- 架构
- 行业软件
- 人工智能
- 计算机辅助设计
- 多媒体
- 软件测试
- 计算机硬件与维护
- 网站策划/UE
- 网页设计/UI
- 网吧管理