Elaborar un análisis descriptivo de la variable promedios de alumnos una muestra de la población a partir de la lectura de un archivo promedios.csv
Importar datos de promedio en la dirección: https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv y dejarlo en un data.frame.
Mostrar solo los primeros diez registros y los últimos diez registros.
Identificar la variable de interés llamada promedio.
Determinar una muestra de 300 registros de la población. La población es todos los registros del archivo y la muestra es una parte de la población
Identifica la media de la población
Identificar la media de la muestra
Comparar las medias aritméticas
Crear un histograma de los datos
Realizar interpretación
poblacion.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv")
Mostrar los primeros y últimos registros
head(poblacion.alumnos, 10)
## no promedio
## 1 1 91.60891
## 2 2 86.68564
## 3 3 84.06292
## 4 4 80.94624
## 5 5 88.49800
## 6 6 85.42097
## 7 7 81.11855
## 8 8 78.97463
## 9 9 75.81317
## 10 10 86.60781
tail(poblacion.alumnos, 10)
## no promedio
## 5591 5591 83.61431
## 5592 5592 78.48419
## 5593 5593 79.59696
## 5594 5594 83.86262
## 5595 5595 81.04476
## 5596 5596 87.74938
## 5597 5597 86.64384
## 5598 5598 88.44429
## 5599 5599 88.19806
## 5600 5600 83.74940
La variable de interés es promedio
str(poblacion.alumnos)
## 'data.frame': 5600 obs. of 2 variables:
## $ no : int 1 2 3 4 5 6 7 8 9 10 ...
## $ promedio: num 91.6 86.7 84.1 80.9 88.5 ...
Muestra de 300 registros
Determinando la variable N el total de registros de la población
N <- nrow(poblacion.alumnos)
Se determinan los registros de la muestra
cuales <- sample(x = 1:N, 300, replace = FALSE)
cuales
## [1] 4060 3958 236 2300 3800 2381 4185 949 2013 2945 3168 1674 1048 2538 5590
## [16] 2404 5464 1418 2032 2174 3106 1710 1219 3553 1170 1451 255 3970 416 423
## [31] 4138 3916 4265 2670 4663 67 2654 3269 4487 5392 547 4714 4863 1639 1516
## [46] 5196 323 71 1274 2358 4375 5509 3735 4511 2693 1119 1427 5247 3931 2605
## [61] 3283 4552 4590 832 2012 2790 3175 3786 2575 1984 302 4600 1832 4626 4521
## [76] 3984 2213 1689 1346 2330 5259 3412 3213 659 3084 2767 2910 1140 4523 1035
## [91] 1099 1296 1834 4314 4175 2323 3776 2571 1350 1340 3854 954 3478 4020 12
## [106] 2563 4589 1034 388 4582 4968 4825 1317 2506 767 2053 5318 2504 1950 1331
## [121] 3709 4818 4082 1782 456 5134 4130 211 243 4965 179 5154 687 2239 212
## [136] 1008 189 2717 2745 5515 2253 63 5537 2332 1078 3620 5524 2433 3182 2011
## [151] 1682 2070 2973 3536 2006 726 5419 248 1295 3896 3209 1831 3354 5066 842
## [166] 4388 4624 5020 4886 932 5292 3496 173 3830 4745 2088 518 2893 785 232
## [181] 3021 4385 1136 3746 5375 4990 1279 2569 2683 3232 1949 1900 1042 3655 3131
## [196] 542 1386 4111 491 4184 3561 2036 991 4255 1981 2593 5508 2131 4135 4698
## [211] 5351 4848 1157 2655 4781 3162 5208 2811 5471 5486 684 3329 4313 3768 2266
## [226] 3860 1619 4075 4146 1298 4723 945 645 3282 3963 864 4311 5059 4712 387
## [241] 4789 513 2495 3608 2079 3664 5434 516 174 5151 4923 4827 4435 3732 4682
## [256] 3667 1014 157 1202 2211 5200 804 677 1491 2804 5457 1443 3009 1068 4100
## [271] 4926 5222 1102 4651 1372 3810 5128 5052 269 3550 4065 3619 3411 3017 5113
## [286] 4814 4366 4927 4911 4236 3170 3138 5582 437 3291 2894 4424 3294 2160 213
Se determina la muestra
muestra.alumnos <- poblacion.alumnos[cuales, ]
head(muestra.alumnos, 10)
## no promedio
## 4060 4060 81.29527
## 3958 3958 90.87629
## 236 236 83.40467
## 2300 2300 81.77353
## 3800 3800 83.75890
## 2381 2381 82.38898
## 4185 4185 77.87282
## 949 949 81.66600
## 2013 2013 83.48894
## 2945 2945 80.71106
tail(muestra.alumnos, 10)
## no promedio
## 3170 3170 83.74650
## 3138 3138 94.24920
## 5582 5582 76.50315
## 437 437 81.44919
## 3291 3291 84.64691
## 2894 2894 88.83935
## 4424 4424 85.19912
## 3294 3294 84.51871
## 2160 2160 87.71911
## 213 213 85.42069
Media de la población
media.poblacion <- mean(poblacion.alumnos$promedio)
media.poblacion
## [1] 84.01415
Media de la muestra
media.muestra <- mean(muestra.alumnos$promedio)
media.muestra
## [1] 84.11141
Interpretación
En este caso se elaboro un analisis descriptivo de la variable promedios de alumnos en donde se importo datos desde una dirección y, también un registro de los primeros 10 y últimos 10 al igual se determino una muestra de 300 registros en donde todo esto nos sirvió para sacar la media de la población y la media de la muestra que en este caso fueron 300.