黄晗
Spring 2019
当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选
「例3.1」下表是8名学生4门课程的考试成绩数据,请找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,四门课程成绩都大于70分的学生。
| 姓名 | 统计学成绩 | 数学成绩 | 英语成绩 | 经济学成绩 |
|---|---|---|---|---|
| 张松 | 69 | 68 | 84 | 86 |
| 王翔 | 91 | 75 | 95 | 94 |
| 田雨 | 54 | 88 | 67 | 78 |
| 李华 | 81 | 60 | 86 | 64 |
| 赵颖 | 75 | 96 | 81 | 83 |
| 宋媛 | 83 | 72 | 66 | 71 |
| 袁方 | 75 | 58 | 76 | 90 |
| 陈风 | 87 | 76 | 92 | 77 |
递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)<x(2)<…<x(n)递减排序:可表示为:x(1)>x(2)>…>x(n)实验课练习数据透视表操作
将分类数据转换为可计算的统计量。
「例3.3」一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次 。右边就是记录的原始数据。

「例3.5」在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”
「例3.6」某电脑公司连续个月各天的销售量数据(单位:台)。试对数据进行分组。
| 按销售量分组(台) | 频数(天) | 频率(%) |
|---|---|---|
| 140~150 | 4 | 3.33 |
| 150~160 | 9 | 7.50 |
| 160~170 | 16 | 13.33 |
| 170~180 | 27 | 22.50 |
| 180~190 | 20 | 16.67 |
| 190~200 | 17 | 14.17 |
| 200~210 | 10 | 8.33 |
| 210~220 | 8 | 6.67 |
| 220~230 | 4 | 3.33 |
| 230~240 | 5 | 4.17 |
| 合计 | 120 | 100 |
| 按销售量分组(台) | 频数(天) | 频率(%) |
|---|---|---|
| 140~149 | 4 | 3.33 |
| 150~159 | 9 | 7.50 |
| 160~169 | 16 | 13.33 |
| 170~179 | 27 | 22.50 |
| 180~189 | 20 | 16.67 |
| 190~199 | 17 | 14.17 |
| 200~209 | 10 | 8.33 |
| 210~219 | 8 | 6.67 |
| 220~229 | 4 | 3.33 |
| 230~239 | 5 | 4.17 |
| 合计 | 120 | 100 |
| 按销售量分组(台) | 频数(天) | 频率(%) |
|---|---|---|
| 150以下 | 4 | 3.33 |
| 150~159 | 9 | 7.50 |
| 160~169 | 16 | 13.33 |
| 170~179 | 27 | 22.50 |
| 180~189 | 20 | 16.67 |
| 190~199 | 17 | 14.17 |
| 200~209 | 10 | 8.33 |
| 210~219 | 8 | 6.67 |
| 220~229 | 4 | 3.33 |
| 230以上 | 5 | 4.17 |
| 合计 | 120 | 100 |
The decimal point is 1 digit(s) to the right of the |
14 | 134
14 | 9
15 | 02334
15 | 5689
16 | 00112334
16 | 55567888
17 | 0112222233444
17 | 55556677888999
18 | 0012234
18 | 5667777888999
19 | 001244
19 | 55666667788
20 | 01233
20 | 56789
21 | 001134
21 | 58
22 | 3
22 | 568
23 | 3344
23 | 7
「例3.7」从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征。
两个变量间的关系—二维散点图
用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图「例3.9」小麦的单位面积产量与降雨量和温度等有一定关系。为了解它们之间的关系形态,收集到如下数据。试绘制小麦产量与降雨量的散点图,并分析它们之间的关系。
| 温度 | 降雨量 | 产量 |
|---|---|---|
| 6 | 25 | 2250 |
| 8 | 40 | 3450 |
| 10 | 58 | 4500 |
| 13 | 68 | 5750 |
| 14 | 110 | 5800 |
| 16 | 98 | 7500 |
| 21 | 120 | 8250 |