(一) 分类数据的整理与显示
分类数据本身就是对事物的一种分类。在整理时要列出所分的类别,每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,便于对数据及其特征有一个初步的了解。
频数与频数分布
(1) 频数也称次数,是落在各类别中的数据个数。
(2) 频数分布表:我们把各个类别及其相应的频数全部列出来就是频数分布或次数分布。将频数分布用表格的形式表现出来就是频数分布表。
对品质数据主要是做分类整理。品质数据是指分类数据与顺序数据。
(1) 条形图:用宽度相同的条形的高度或长短来表示数据变动的图形。既可以横置也可以纵置,纵置时也称为柱形图。
(2) 圆形图:也称饼图。是用圆形及圆内扇形的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。
(二) 顺序数据的整理与显示
对于分类数据适用的整理与显示方法都适用于顺序数据。有些方法适用于顺序数据的整理与显示,但不适用于分类数据。
累积频数和累积频率
(1) 累积频数:就是将各类别的频数逐级累加起来。方法有两种:一是从类别顺序的一方向类别顺序的最后一方累加频数(数值型数据则是从变量值小的一方向变量值大的一方累加频数),称为向上累积;二是从类别顺序的最后一方向类别顺序的开始一方累加频数(数值型数据则是从变量值大的一方向变量值小的一方累加频数),称为向下累积。通过累积频数,可以很容易看出某一类别(或数值)以下及某一类型(或数值)以上的频数之和。
(2) 累积频率或百分比:就是将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。
数值型数据的整理与显示
品质数据的整理与图示方法都适用于数值型数据的整理与显示。但数值型数据还有一些特定的整理和图示方法,并不适用于品质数据。
数据的分组
数据分组就是根据统计研究的需要,将数据按照某种标准划分成不同的组别。分组后再计算出各组中出现的次数和频数,形成一张频数分布表。分组的方法单变量值分组和组距分组两种。单变量值分组是把每一个变量值作为一组,这种分组方法通常只适用于离散变量且变量值较少的情况。在连续变量或变量值较多的情况下,通常采用组距分组。
组距分组是将全部变量值依次划分为若干区间,并将这一区间的变量值作为一组。下面结果具体的例子说明分组的过程和频数分布表的编制过程。
某高中一年级一共有55名学生,高一语文考试中成绩分别为:
59 73 87 65 89 85 77 94 69 97
56 80 68 95 96 50 63 88 91 90
96 92 93 79 74 65 74 89 83 51
74 79 94 67 92 92 93 70 87 86
54 87 86 54 62 76 86 73 86 70
100 110 108 102 112
第一步:确定分组组数。确定分组组数的要求是:第一,划分的组数,既不应太多也不应太少。组数过多,达不到通过分组压缩资料的目的;组数太少,将造成原始资料的信息丢失过多;第二,组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;第三,采用的分组办法,要能够充分显示客观现象本身存在的状态。
统计分组:斯特基方法,其计算公式为 ,K为分组组数,N为数据个数。本例中, ,即应分7组
第二步,对原始资料进行排序。(略)
第三步,求极差,即将最大的观察值与最小的观察值相减便得到极差。本例中为112-50=62
第四步,确定各组组距。组距=极差(全距)/组数
本例中,组距=62/7≈8.9,组距可取10。
组距与组数成反比关系,组数越多,组距越小,组数越少,组距越大。
组距=某组的上限值-该组的下限值
第五步,确定组限。
确定组限应注意:
第一,第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点;
第二,特别需要或不得已的情况除外,最好不要使用开口组;
第三,组限应取得美观些,按数字编好,组限值应能被5除尽,且一般要用整数表示。
本例中,把第一组的下限值定为50,
第六步,确定各组观察值出现的频数。采用组距分组时,需要遵循“不重不漏”的原则。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。
第七步,制作频数分布表,并填上相关的内容,以及其他需要说明的事。
| 广告合作:400-664-0084 全国热线:400-664-0084 Copyright 2010 - 2017 www.my8848.com 珠峰网 粤ICP备15066211号 珠峰网 版权所有 All Rights Reserved
|