La poblacion objetivo seran los estudiantes de un colegio cualquiera ubicado en la ciudad de neiva, en el grado de once (A,B,C,D,E) donde estos cuentan con 30 alumnos por cada curso, en este sentido en total serian de 150 estudiantes.
set.seed(123)
Edad<-sample(c(15:21),size=150,replace=TRUE)
Materia <-sample(c("Matematicas","Sociales","Ingles","Espanol","C.Naturles"), size=150,replace=TRUE)
set.seed(123)
Notas<-round(runif(150, min=1.0, max=5.0),1)
Genero<-sample(c("Masculino","Femenino"), size=150,replace=TRUE)
set.seed(123)
Grado_Once<-data.frame(Edad,Materia,Notas,Genero)
Grado_Once
## Edad Materia Notas Genero
## 1 21 Ingles 2.2 Masculino
## 2 21 Sociales 4.2 Femenino
## 3 17 C.Naturles 2.6 Masculino
## 4 20 C.Naturles 4.5 Femenino
## 5 17 Ingles 4.8 Masculino
## 6 16 Espanol 1.2 Masculino
## 7 16 Espanol 3.1 Masculino
## 8 20 Espanol 4.6 Masculino
## 9 17 C.Naturles 3.2 Masculino
## 10 19 Ingles 2.8 Masculino
## 11 18 Matematicas 4.8 Masculino
## 12 20 Sociales 2.8 Femenino
## 13 20 Matematicas 3.7 Femenino
## 14 15 Sociales 3.3 Femenino
## 15 16 C.Naturles 1.4 Masculino
## 16 17 Ingles 4.6 Femenino
## 17 19 Espanol 2.0 Masculino
## 18 17 Espanol 1.2 Masculino
## 19 17 Matematicas 2.3 Femenino
## 20 15 Espanol 4.8 Masculino
## 21 18 Matematicas 4.6 Femenino
## 22 15 Ingles 3.8 Femenino
## 23 15 Espanol 3.6 Femenino
## 24 19 Ingles 5.0 Femenino
## 25 17 C.Naturles 3.6 Masculino
## 26 16 Espanol 3.8 Masculino
## 27 21 Espanol 3.2 Masculino
## 28 16 Espanol 3.4 Femenino
## 29 15 Matematicas 2.2 Femenino
## 30 20 Sociales 1.6 Femenino
## 31 17 Ingles 4.9 Femenino
## 32 18 Espanol 4.6 Masculino
## 33 20 Ingles 3.8 Masculino
## 34 15 Matematicas 4.2 Masculino
## 35 17 C.Naturles 1.1 Masculino
## 36 21 C.Naturles 2.9 Femenino
## 37 19 Sociales 4.0 Femenino
## 38 18 Ingles 1.9 Masculino
## 39 21 C.Naturles 2.3 Masculino
## 40 16 Matematicas 1.9 Femenino
## 41 19 Espanol 1.6 Femenino
## 42 21 Sociales 2.7 Masculino
## 43 15 Espanol 2.7 Masculino
## 44 15 C.Naturles 2.5 Femenino
## 45 16 C.Naturles 1.6 Femenino
## 46 21 C.Naturles 1.6 Masculino
## 47 17 C.Naturles 1.9 Masculino
## 48 18 Matematicas 2.9 Femenino
## 49 19 Sociales 2.1 Masculino
## 50 21 Matematicas 4.4 Femenino
## 51 19 Sociales 1.2 Femenino
## 52 17 C.Naturles 2.8 Femenino
## 53 20 C.Naturles 4.2 Femenino
## 54 15 Matematicas 1.5 Masculino
## 55 16 Sociales 3.2 Femenino
## 56 19 C.Naturles 1.8 Femenino
## 57 19 Espanol 1.5 Femenino
## 58 18 Sociales 4.0 Masculino
## 59 21 Sociales 4.6 Femenino
## 60 19 Ingles 2.5 Femenino
## 61 16 Matematicas 3.7 Femenino
## 62 15 Matematicas 1.4 Masculino
## 63 15 C.Naturles 2.5 Masculino
## 64 17 C.Naturles 2.1 Femenino
## 65 15 Ingles 4.3 Femenino
## 66 20 Sociales 2.8 Femenino
## 67 19 C.Naturles 4.2 Femenino
## 68 21 C.Naturles 4.2 Masculino
## 69 15 Ingles 4.2 Femenino
## 70 21 Ingles 2.8 Masculino
## 71 16 Matematicas 4.0 Femenino
## 72 18 Espanol 3.5 Masculino
## 73 21 Sociales 3.8 Masculino
## 74 18 Matematicas 1.0 Masculino
## 75 20 Sociales 2.9 Femenino
## 76 20 Espanol 1.9 Femenino
## 77 17 C.Naturles 2.5 Masculino
## 78 20 Matematicas 3.5 Masculino
## 79 20 Matematicas 2.4 Femenino
## 80 21 Matematicas 1.4 Masculino
## 81 21 C.Naturles 2.0 Masculino
## 82 15 Ingles 3.7 Femenino
## 83 20 Matematicas 2.7 Femenino
## 84 16 Sociales 4.2 Masculino
## 85 15 Sociales 1.4 Femenino
## 86 16 Matematicas 2.7 Femenino
## 87 18 Sociales 4.9 Femenino
## 88 19 Matematicas 4.6 Femenino
## 89 19 C.Naturles 4.5 Femenino
## 90 20 Sociales 1.7 Masculino
## 91 21 Ingles 1.5 Masculino
## 92 17 C.Naturles 3.6 Femenino
## 93 15 Espanol 2.4 Masculino
## 94 18 C.Naturles 3.6 Femenino
## 95 20 Sociales 2.3 Masculino
## 96 15 Matematicas 1.8 Masculino
## 97 20 Espanol 4.1 Masculino
## 98 15 Sociales 1.4 Femenino
## 99 21 C.Naturles 2.9 Femenino
## 100 17 Matematicas 3.0 Femenino
## 101 20 C.Naturles 3.4 Masculino
## 102 18 Matematicas 2.3 Femenino
## 103 21 Espanol 3.0 Femenino
## 104 15 Ingles 4.8 Masculino
## 105 20 Matematicas 2.9 Masculino
## 106 20 Matematicas 4.6 Masculino
## 107 17 Sociales 4.7 Masculino
## 108 20 Espanol 3.4 Masculino
## 109 19 Sociales 2.6 Femenino
## 110 21 Matematicas 1.6 Masculino
## 111 17 C.Naturles 4.7 Femenino
## 112 21 C.Naturles 2.2 Femenino
## 113 20 Matematicas 1.2 Femenino
## 114 16 Matematicas 4.8 Masculino
## 115 21 C.Naturles 3.9 Femenino
## 116 19 C.Naturles 1.6 Masculino
## 117 19 Sociales 3.2 Femenino
## 118 17 Sociales 4.8 Masculino
## 119 16 C.Naturles 3.3 Masculino
## 120 16 Matematicas 2.6 Masculino
## 121 16 Matematicas 3.6 Masculino
## 122 18 C.Naturles 2.3 Masculino
## 123 16 C.Naturles 2.2 Masculino
## 124 16 Espanol 1.9 Femenino
## 125 20 C.Naturles 2.5 Masculino
## 126 21 C.Naturles 4.9 Femenino
## 127 18 Espanol 1.6 Masculino
## 128 18 Sociales 1.4 Masculino
## 129 20 C.Naturles 1.6 Masculino
## 130 15 Matematicas 3.8 Masculino
## 131 20 Matematicas 3.5 Femenino
## 132 20 Sociales 4.6 Femenino
## 133 20 Matematicas 3.7 Masculino
## 134 17 Sociales 3.9 Masculino
## 135 20 C.Naturles 3.1 Masculino
## 136 17 Matematicas 3.6 Femenino
## 137 20 Ingles 4.3 Femenino
## 138 21 Sociales 4.1 Femenino
## 139 15 Sociales 4.9 Masculino
## 140 21 C.Naturles 2.8 Femenino
## 141 17 Espanol 2.2 Masculino
## 142 21 Matematicas 2.6 Masculino
## 143 19 C.Naturles 1.0 Masculino
## 144 21 Sociales 1.7 Masculino
## 145 21 C.Naturles 4.4 Masculino
## 146 16 Sociales 1.9 Femenino
## 147 20 Sociales 2.0 Femenino
## 148 20 Espanol 1.3 Femenino
## 149 21 Ingles 2.0 Masculino
## 150 21 Espanol 3.9 Masculino
set.seed(123)
Once_Edad<-rnorm(Grado_Once,18,2)
set.seed(123)
Once_Notas<-rnorm(Grado_Once,3,1)
Por medio del muestreo aleatorio simple se obtiene una muestra de la población
Poblacion=150
z=1.96
p=0.5
q=0.5
error=0.1
tamaño_muestra = (Poblacion+z^2*p*q)/ ((error^2*(Poblacion-1))+z^2*p*q)
tamaño_muestra
## [1] 61.60643
#Dado que los datos son aleatorio se coloca el termino replace=TRUE
set.seed(123)
Muestra_Edad<-sample(Once_Edad,tamaño_muestra,replace = TRUE)
set.seed(123)
Muestra_Notas<-sample(Once_Notas,tamaño_muestra,replace=TRUE)
set.seed(123)
media_EdadP<-mean(Once_Edad)
media_EdadP
## [1] 18.41928
set.seed(123)
Varianza_EdadP<-var(Once_Edad)
Varianza_EdadP
## [1] 3.501147
set.seed(123)
desviacion_EdadP<-sd(Once_Edad)
desviacion_EdadP
## [1] 1.871135
set.seed(123)
media_NotasP<-mean(Once_Notas)
media_NotasP
## [1] 3.209641
set.seed(123)
Varianza_NotasP<-var(Once_Notas)
Varianza_NotasP
## [1] 0.8752868
set.seed(123)
desviacion_NotasP<-sd(Once_Notas)
desviacion_NotasP
## [1] 0.9355676
set.seed(123)
media_muestral_Edad1<-mean(Muestra_Edad)
media_muestral_Edad1
## [1] 18.54783
set.seed(123)
varianza_muestral_Edad1<-var(Muestra_Edad)
varianza_muestral_Edad1
## [1] 3.205262
set.seed(123)
desviacion_muestral_Edad1<-sd(Muestra_Edad)
desviacion_muestral_Edad1
## [1] 1.790325
set.seed(123)
media_muestral_Notas1<-mean(Muestra_Notas)
media_muestral_Notas1
## [1] 3.273915
set.seed(123)
varianza_muestral_Notas1<-var(Muestra_Notas)
varianza_muestral_Notas1
## [1] 0.8013155
set.seed(123)
desviacion_muestral_Notas1<-sd(Muestra_Notas)
desviacion_muestral_Notas1
## [1] 0.8951623
Se deben cumplir las siguientes propiedades, para poder realizar estimaciones con la muestra
#DETERMINAMOS SI EXISTE SESGO DEL ESTIMADOR DE MEDIA DE EDADES
cat("El promedio de Edad Poblacional:",round(media_EdadP,2))
## El promedio de Edad Poblacional: 18.42
cat("El promedio de Edad Muestral:",round(media_muestral_Edad1,2))
## El promedio de Edad Muestral: 18.55
if (round(media_muestral_Edad1) != round(media_EdadP)) {
print("Si hay sesgo en el estimador de Media de Edad")
} else {
print("El estimador de media de Edad es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de Edad"
#DETERMINAMOS EL SESGO DEL ESTIMADOR DE MEDIA DE EDADES
set.seed(123)
sesgo_Edad<-media_muestral_Edad1-media_EdadP
sesgo_Edad
## [1] 0.128548
#DETERMINAMOS SI EXISTE SESGO DEL ESTIMADOR DE MEDIA DE NOTAS
cat("El promedio de Nota Poblacional:",media_NotasP)
## El promedio de Nota Poblacional: 3.209641
cat("El promedio de Nota Muestral:",media_muestral_Notas1)
## El promedio de Nota Muestral: 3.273915
if (media_muestral_Notas1 != media_NotasP) {
print("Si hay sesgo en el estimador de la media de notas")
} else {
print("El estimador de media de las notas es insesgado")
}
## [1] "Si hay sesgo en el estimador de la media de notas"
#DETERMINAMOS EL SESGO DEL ESTIMADOR DE MEDIA DE NOTAS
set.seed(123)
sesgo_Notas<-media_muestral_Notas1-media_NotasP
sesgo_Notas
## [1] 0.06427402
Extraemos una nueva muestra de la población para determinar si entre más grande la muestra, el valor del estimador se aproxima al valor del parametro
set.seed(123)
Muestra_Edad_2<-sample(Once_Edad,80,replace = TRUE)
set.seed(123)
Muestra_Notas_2<-sample(Once_Notas,80,replace=TRUE)
#MEDIA DE LA MUESTRA 2
set.seed(123)
media_muestral_Edad2 = mean(Muestra_Edad_2)
cat("El promedio poblacional de edades es igual a",round(media_EdadP,2))
## El promedio poblacional de edades es igual a 18.42
cat("El promedio muestral con una muestra de 61 estudiantes es de", round(media_muestral_Edad1,2))
## El promedio muestral con una muestra de 61 estudiantes es de 18.55
cat("El promedio muestral con una muestra de 80 estudiantes es de", round(media_muestral_Edad2,2))
## El promedio muestral con una muestra de 80 estudiantes es de 18.52
#VARIANZA DE LA MUESTRA 2
set.seed(123)
varianza_muestral_Edad2=var(Muestra_Edad_2)
varianza_muestral_Edad2
## [1] 3.112071
#DESVIACIÓN ESTANDAR DE LA MUESTRA 2
set.seed(123)
desviacion_muestral_Edad2=sd(Muestra_Edad_2)
cat("La desviación estandar poblacional de la edad es igual a", round(desviacion_EdadP,2))
## La desviación estandar poblacional de la edad es igual a 1.87
cat("La desviación estandar de la edad con una muestra de 61 estudiantes es de", round(desviacion_muestral_Edad1,2))
## La desviación estandar de la edad con una muestra de 61 estudiantes es de 1.79
cat("El promedio muestral de la edad con una muestra de 80 estudiantes es de", round(desviacion_muestral_Edad2,2))
## El promedio muestral de la edad con una muestra de 80 estudiantes es de 1.76
Analisis: Para que exista consistencia del estimador se debe tener en cuenta que entre más muestras, los estimadores de estas muestras deben aproximarse al valor de los parametros, luego se observa el comportamiento de la media muestral, donde en la muestra 1 es de 18.55 años, luego en la muestra 2 es de 18.52 años, y por ultimo la media poblacional es de 18.42 años, se puede concluir, que existe consistencia para el estimador de la variable edad, ya que a medida que se va aumentando la muestra, el estimador muestral se va comportando de la misma manera que el paramentro poblacional.
#MEDIA DE LA MUESTRA 2 DE NOTAS
set.seed(123)
media_muestral_Notas2=mean(Muestra_Notas_2)
cat("El promedio poblacional de notas es igual a", round(media_NotasP,2))
## El promedio poblacional de notas es igual a 3.21
cat("El promedio muestral con una muestra de 61 estudiantes es de", round(media_muestral_Notas1,2))
## El promedio muestral con una muestra de 61 estudiantes es de 3.27
cat("El promedio muestral con una muestra de 80 estudiantes es de", round(media_muestral_Notas2,2))
## El promedio muestral con una muestra de 80 estudiantes es de 3.26
#VARIANZA DE LA MUESTRA 2 DE NOTAS
set.seed(123)
varianza_muestral_Notas2=var(Muestra_Notas_2)
varianza_muestral_Notas2
## [1] 0.7780177
#DESVIACIÓN ESTANDAR DE LA MUESTRA 2 DE NOTAS
set.seed(123)
desviacion_muestral_Notas2=sd(Muestra_Notas_2)
cat("La desviación estandar poblacional de las notas es igual a", round(desviacion_NotasP,2))
## La desviación estandar poblacional de las notas es igual a 0.94
cat("La desviación estandar de las notas con una muestra de 61 estudiantes es de", round(desviacion_muestral_Notas1,2))
## La desviación estandar de las notas con una muestra de 61 estudiantes es de 0.9
cat("El promedio muestral de las notas con una muestra de 80 estudiantes es de", round(desviacion_muestral_Notas2,2))
## El promedio muestral de las notas con una muestra de 80 estudiantes es de 0.88
Analisis: Para que exista consistencia del estimador se debe tener en cuenta que entre más muestras, los estimadores de estas muestras deben aproximarse al valor de los parametros, luego se observa el comportamiento de la media muestral para la variable notas,donde en la muestra 1 es de 3.27, luego en la muestra 2 es de 3.26 , y por ultimo la media poblacional es de 3.21, por lo tanto se puede concluir, que existe consistencia para el estimador de la variable notas, ya que a medida que se va aumentando la muestra, el estimador muestral se va comportando de la misma manera que el paramentro poblacional.
cat("La varianza de la Edad con una muestrea de 61 estudiantes es de", varianza_muestral_Edad1)
## La varianza de la Edad con una muestrea de 61 estudiantes es de 3.205262
cat("La varianza de la Edad con una muestrea de 80 estudiantes es de", varianza_muestral_Edad2)
## La varianza de la Edad con una muestrea de 80 estudiantes es de 3.112071
if (floor(varianza_muestral_Edad1) < floor(varianza_muestral_Edad2)) {
print("Es eficiente")
} else {
print("No es eficiente")
}
## [1] "No es eficiente"
Analisis: Teniendo en cuenta que la varianza de la primera muestra de la variable edad, con una muestra de 61 estudiantes es mayor que la varianza de la segunda muestra de la variable edad, con una muestra de 80 estudiantes de grado once, se determina que el estimador de la muestra 1 no es eficiente.
cat("La varianza de las notas con una muestrea de 61 estudiantes es de", varianza_muestral_Notas1)
## La varianza de las notas con una muestrea de 61 estudiantes es de 0.8013155
cat("La varianza de la notas con una muestrea de 80 estudiantes es de", varianza_muestral_Notas2)
## La varianza de la notas con una muestrea de 80 estudiantes es de 0.7780177
if (varianza_muestral_Notas1 < varianza_muestral_Notas2) {
print("Es eficiente")
} else {
print("No es eficiente")
}
## [1] "No es eficiente"
Analisis: Teniendo en cuenta que la varianza de la primera muestra de la variable Notas, con una muestra de 61 estudiantes es mayor que la varianza de la segunda muestra de la variable Notas, con una muestra de 80 estudiantes de grado once, se determina que el estimador de la muestra 1 no es eficiente.
nivel_confianza <-0.99
valor_critico <-qnorm((1 + nivel_confianza) / 2)
valor_critico
## [1] 2.575829
nivel_confianza <- 0.95
muestra_media <- media_muestral_Edad1
desviacion_estandar <- 15
tamano_muestra <- 40
error_estandar <- 15 / sqrt(40)
valor_critico <- qt((1 + 0.95) / 2, df = 40 - 1)
margen_error <- valor_critico * error_estandar
intervalo_confianza <- c(media_muestral_Edad1 - margen_error, media_muestral_Edad1 + margen_error)
intervalo_confianza
## [1] 13.75060 23.34506
nivel_confianza <- 0.95
muestra_media <- media_muestral_Notas1
desviacion_estandar <- 15
tamano_muestra <- 40
error_estandar <- 15 / sqrt(40)
valor_critico <- qt((1 + 0.95) / 2, df = 40 - 1)
margen_error <- valor_critico * error_estandar
intervalo_confianza <- c(media_muestral_Notas1 - margen_error, media_muestral_Notas1 + margen_error)
intervalo_confianza
## [1] -1.523318 8.071148