请判断以下命题是否为真,若为假命题,请通过最少的逻辑修改使其成为真命题。
(1)均值的无偏性指当样本服从某些具有良好性质的分布时,样本均值等于总体均值。
(2)在对N名评委的打分进行”去掉一个最高分,去掉一个最低分”操作后得到N-2个打分,新数据的极差和标准差一定都变小
(3)将某课程每个人的期末考试成绩都加上10分,则课程成绩的均值增大,方差增大。
(4)在随机抽样的前提下,总体(population)方差比样本(sample)方差更大。
(5)貌美同学记录了一组长度的测量数据(单位:米),标准差为1.4(单位:米),将数据单位转换为厘米后,其标准差为140(单位:厘米)。
(6)将原始分数转换为z分数后,z分数大于0代表该数据的值比总体的中位数更大。
(7)期末考试中,如花同学语文得90分(\(M\) = 80, \(SD\) = 5),数学得80分(\(M\) = 60, \(SD\) = 10),如花同学这两科的排名是相同的。
按照要求 在代码块处写r代码 和/或 “答”后空白处报告结果
一、在文件”hw2_data1.xlsx”中有一列数据,请完成以下题目。计算结果均四舍五入保留5位小数(提示:使用round函数)。
library(readxl)
hw2_data1_2_2_ <- read_excel("C:/Users/crushmjl/Downloads/hw2_data1(2) (2).xlsx")
data <- read_excel('hw2_data1(2) (2).xlsx')
X <- data$score
(1)请计算数据的均值(2分)、中位数(2分)、众数(4分)、全距(2分)、四分位距(4分)。
mean(X)
## [1] 1.271187
median(X)
## [1] 1.2985
y = table(X)
z = rev(sort(y))
z[1]
## 1.334
## 6
names(z)[1]
## [1] "1.334"
max(X)-min(X)
## [1] 18.088
summary(X)[5]-summary(X)[2]
## 3rd Qu.
## 2.957
quantile(X,0.75)-quantile(X,0.25)
## 75%
## 2.957
答:请在这里用标准格式报告R的计算结果
(2)请用R语言的sd()函数计算数据的标准差(2分)
答:s == sd(X) s
(3)请用R语言实现数据的标准差公式,并使用该公式计算数据的标准差(8分)。 \[s = \sqrt{\frac{\sum_{i=1}^N(X_i-\overline X)^2}{N}}\]
x <- sample(X,50) #x是样本(确实来自总体X)
n = length(x)
#手动计算样本方差、标准差
SS_x = sum((x-mean(x))^2)
s2 = SS_x/(n-1)
s = sqrt(SS_x/(n-1))
s
## [1] 2.438955
答:请在这里用标准格式报告R的计算结果
(4)第(2)和(3)题的结果是否一致?若否,请解释原因。(6分)
答:请在这里用标准格式报告R的计算结果,并阐述理由
二、使用以下两行R语言代码可以生成100条均值为50,标准差为15的数据。(请勿修改这个代码块,本题结果无特殊要求保留2位小数) (提示,本题可能用到的函数包括但不限于scale、pnorm、dnorm)
set.seed(923)
data_x = rnorm(100, 50, 15)
summary(data_x)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.48 40.68 48.95 49.91 57.94 84.08
(1)假设这100个数据为某课程学生最终的总评成绩,为提高平均成绩,使用函数\(y = 10 * \sqrt x\)对成绩进行转换,请分别画出转换前后成绩分布的直方图。(8分)
hist(data_x,xlab='score',main='Frequency distribution of score', xlim= c(0,100), ylim = c(0,30))
(2)转换后成绩的分布形态是什么?(正偏态、正态、负偏态)(2分)
答:请在这里报告结果
(3)请将原始分数标准化为均值为0,标准差为1的z分数,并输出结果。(5分)
在代码内呈现,无需在此处复制
(4)请将(3)中所得的z分数转换为均值为80,标准差为5的数据,对数据取整后报告结果。(6分)
在代码内呈现,无需在此处复制
(5)在第(4)题转换后的数据中,取整后分数在85分及以上的数据所占的比例是多少?(4分)
答:请在这里用标准格式报告R的计算结果
(6)假设有一列均值为80,标准差为5的正态分布总体,这列总体取整后分数在85分及以上的数据所占比例的理论值是多少? (5分)
答:请在这里用标准格式报告R的计算结果
(7)第(5)题和第(6)题的结果是否一致?若否,请说明原因。(5分)
答:请在这里用标准格式报告R的计算结果, 并阐释理由