题目

什么是变量数列?如何编制变量数列?(

在数据分析中,在对变量取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成的数列,就称为变量数列。

通常,编制组距数列有以下五个步骤:

(1)确定组数。采用组距分组的方法对变量的取值进行分组,各组的区间长度可以相等,也可以不等。各组区间长度相等的称为等距分组,各组区间长度不等的称为异距分组。等距分组便于比较和分析处理,因此实践中应尽量采用等距分组。组距分组的组数(m)究竟应该取多少并没有绝对的标准。一般来说,组数的多少应根据所取得的观测变量中观测值的个数来确定,变量中观测值较多时组数应多些,观测值较少时组数应少些。组距分组的组数通常选取在五组到二十多组之间,分组的组数不宜太多,也不宜过少。组数太少难以反映出变量分布的真实特征;组数太多则太琐碎,也难以反映出观测变量分布的特征。

(2)确定组距。在组距分组中,每组的上限和下限之间的距离称为组距。确定了分组的组数之后,接下来就需要确定出分组的组距。等距分组的组距可根据变量值的取值范围和已确定的组数而定,记观测变量中的第i个变量值为xi,等距分组的组距为d,则可计算出d的最低值为:。如此计算出的组距是在给定的组数下,组距的最小值。在实际分组中,为了使全部变量值都能有组可入,实际的组距只能比此值大,而不能比此值小。在实践中,人们通常都比较关注整数,特别关注诸如5和10及其整数倍等整数,所以在分组时通常都要选用整数作为组距,如果可作为组距的值接近于5和10的倍数,则通常要用5和10的倍数来作组距。

(3)确定组限。在组距分组中,每组的最大值称为该组的上限,每组的最小值称为该组的下限,上限和下限统称为组限。在确定了分组的组数和组距之后,就需要确定各组的组限。各组的组限应尽量用整数。特别是5和10的倍数来表示。因此,在确定各组的组限时,如果变量的最小值为整数,那么就可将此变量的最小值作为最低一组的下限,如果变量的最小值不是整数,那么就可将比此变量的最小值稍小一点的整数值作为最低一组的下限。确定了最低一组的下限以后,依次每增加一个组距就是一个组限,当组限值增加到比变量的最大值还大时即为最高组上限。这样,就实现了所观测变量的组距分组。

(4)计算各组的次数(频数)。在确定了各组的组限以后,接着就需要计算出所有变量值中 落入各组之内的变量值的个数。每组所分配的变量值的个数也就是该组的次数,又称频数。

(5)编制变量数列。当各组变量值的变动范围和各组的次数确定之后,接下来就可以将各组变量值按照从小到大的顺序排列,并列出相对应的次数,就形成变量数列。

多做几道

统计指数有哪些类别?

什么是指数?狭义的指数与广义的指数有什么区别?

(1)在统计指数中,试简单说明什么是总指数和个体指数。(2)总指数和个体指数有何联系与区别?

简述编制指数体系需要注意的问题。

试解释统计指数在生产和生活中有何作用。

该科目易错题