Elaborar un análisis descriptivo de la variable promedios de alumnos una muestra de la población a partir de la lectura de un archivo promedios.csv
Importar datos de promedio en la dirección: https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv y dejarlo en un data.frame.
Mostrar solo los primeros diez registros y los últimos diez registros.
Identificar la variable de interés llamada promedio.
Determinar una muestra de 300 registros de la población. La población es todos los registros del archivo y la muestra es una parte de la población
Identifica la media de la población
Identificar la media de la muestra
Comparar las medias aritméticas
Crear un histograma de los datos
Realizar interpretación
poblacion.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv")
Mostrar los primeros y últimos registros
head(poblacion.alumnos, 10)
## no promedio
## 1 1 91.60891
## 2 2 86.68564
## 3 3 84.06292
## 4 4 80.94624
## 5 5 88.49800
## 6 6 85.42097
## 7 7 81.11855
## 8 8 78.97463
## 9 9 75.81317
## 10 10 86.60781
tail(poblacion.alumnos, 10)
## no promedio
## 5591 5591 83.61431
## 5592 5592 78.48419
## 5593 5593 79.59696
## 5594 5594 83.86262
## 5595 5595 81.04476
## 5596 5596 87.74938
## 5597 5597 86.64384
## 5598 5598 88.44429
## 5599 5599 88.19806
## 5600 5600 83.74940
La variable de interés es promedio
str(poblacion.alumnos)
## 'data.frame': 5600 obs. of 2 variables:
## $ no : int 1 2 3 4 5 6 7 8 9 10 ...
## $ promedio: num 91.6 86.7 84.1 80.9 88.5 ...
Muestra de 300 registros
Determinando la variable N el total de registros de la población
N <- nrow(poblacion.alumnos)
Se determinan los registros de la muestra
cuales <- sample(x = 1:N, 300, replace = FALSE)
cuales
## [1] 768 346 5574 1992 475 1661 2293 4444 4245 5527 3927 2622 4636 3739 1800
## [16] 258 1087 989 1756 4228 16 5568 4860 4863 3016 1193 594 58 2062 3901
## [31] 1085 2219 4232 5281 1755 2084 1880 5503 5234 3470 3209 3978 2519 926 802
## [46] 1660 3437 899 4099 1415 2731 5309 3706 5326 1335 3513 2745 3533 4773 1310
## [61] 888 2984 1399 2184 1463 2551 2697 729 2813 1862 4196 4508 3645 553 550
## [76] 5189 4914 4769 4557 3373 3885 2510 4986 262 4544 2629 3393 5565 2078 5267
## [91] 4802 308 1921 4676 3237 3017 4755 571 1631 4843 5409 5146 5428 5317 4132
## [106] 663 5117 5098 5466 3681 3440 5155 4198 4651 4419 2483 4980 2006 2144 4822
## [121] 1870 5388 5488 2991 2677 1083 2631 2761 4671 4325 5216 5145 2696 88 4406
## [136] 54 2725 21 681 1567 3597 2134 4764 709 213 5379 1379 2924 5485 4926
## [151] 5094 4879 4102 1227 3429 2657 3322 4957 4661 1364 4846 154 3431 2280 2781
## [166] 1893 4491 4420 1672 1987 4937 3455 4528 3458 1726 4114 4318 4535 933 5319
## [181] 2729 5499 287 2626 2981 1664 985 5238 9 688 137 1956 5392 2896 1611
## [196] 4917 3078 3233 2156 1719 4248 1494 5511 4672 2145 4933 2472 4316 3283 1052
## [211] 1690 2772 5522 3084 2018 2833 3214 3583 3258 3932 3376 2009 5226 3974 4977
## [226] 2623 3900 1856 4100 3451 3892 878 4053 1651 4713 4781 3756 1315 454 4501
## [241] 4991 1887 3587 2600 721 2899 4644 3652 328 4899 2172 1338 2718 4804 98
## [256] 1815 343 5106 1598 2630 2918 2531 3270 983 4033 818 4758 3976 1580 2862
## [271] 510 5435 1050 1682 1046 570 3603 5002 2264 3007 3531 2888 2128 2322 3510
## [286] 698 4268 4408 4612 2824 2713 3181 4376 1374 3578 4056 4944 4186 1540 4149
Se determina la muestra
muestra.alumnos <- poblacion.alumnos[cuales, ]
head(muestra.alumnos, 10)
## no promedio
## 768 768 85.79204
## 346 346 86.84353
## 5574 5574 82.01132
## 1992 1992 82.51152
## 475 475 85.18086
## 1661 1661 95.61840
## 2293 2293 82.90319
## 4444 4444 80.84749
## 4245 4245 81.81940
## 5527 5527 83.46789
tail(muestra.alumnos, 10)
## no promedio
## 2713 2713 83.53019
## 3181 3181 93.29812
## 4376 4376 90.55815
## 1374 1374 85.84324
## 3578 3578 90.98614
## 4056 4056 88.25176
## 4944 4944 87.49395
## 4186 4186 76.76992
## 1540 1540 73.81979
## 4149 4149 77.13917
Media de la población
media.poblacion <- mean(poblacion.alumnos$promedio)
media.poblacion
## [1] 84.01415
Media de la muestra
media.muestra <- mean(muestra.alumnos$promedio)
media.muestra
## [1] 83.88569
Interpretación
En este caso se manejo un registro mediante una dirección de la cual se importaron los datos de promedios de alumnos los cuales manejamos de los primeros 10 a los últimos 10 así para que se llevara acabo de manera correcta lo cual después se tendría que sacar una media de los ya registrados así para ya sacar una muestra la cual seria una pequeña cantidad, se determinaron los datos de acuerdo a las variables.