第1章 导 论 1.1 知识要点总结 一、统计学 1.统计学 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 数据收集也就是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。 2.数据分析所用的方法 (1)描述统计:研究数据收集、处理、汇总、图表描述、概括与分析的统计方法; (2)推断统计:研究如何利用样本数据来推断总体特征的统计方法。 二、统计数据的类型 1.分类数据、顺序数据、数值型数据(按计量尺度不同分类) (1)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的; (2)顺序数据:只能归于某一有序类别的非数字型数据,用文字来表述。顺序数据虽然也表现为类别,但这些类别是有序的; (3)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。 关系:分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。 2.观测数据和实验数据(按收集方法分类) (1)观测数据:通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的; (2)实验数据:通过在实验中控制实验对象而收集到的数据。 3.截面数据和时间序列数据(按被描述的现象与时间的关系分类) (1)截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述不同主体的现象在某一时刻的变化情况; (2)时间序列数据:在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述一个主体的现象随时间变化的情况。 三、统计中的几个基本概念 1.总体和样本 (1)总体 ①总体、个体 总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。组成总体的每一个元素称为个体。 ②总体的分类 根据总体所包含的单位数目是否可数可以分为: a.有限总体:指总体的范围能够明确确定,而且元素的数目是有限可数的; b.无限总体:指总体所包括的元素是无限的、不可数的。 (2)样本、样本量 ①样本:从总体中抽取的一部分元素的集合; ②样本量:构成样本的元素的数目。 2.参数和统计量 (1)参数 参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等。 (2)统计量 统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。研究者所关心的统计量主要有样本平均数、样本标准差、样本比例等。 3.变量 (1)变量、变量值 ①变量:说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。 ②变量值:变量的具体取值。 (2)变量的类型 ①分类变量 是说明事物类别的一个名称,其取值是分类数据。 ②顺序变量 是说明事物有序类别的一个名称,其取值是顺序数据。 ③数值型变量 是说明事物数字特征的一个名称,其取值是数值型数据。根据其取值的不同,又可以分为: a.离散型变量:只能取有限个或可数个值的变量,而且其取值都以整位数断开,可以一一列举; b.连续型变量:可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举。