Elaborar un análisis descriptivo de la variable promedios de alumnos una muestra de la población a partir de la lectura de un archivo
promedios.csv
importar datos de promedio en la dirección:
https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv y dejarlo en un data.frame.
Mostrar solo los primeros diez registros y los últimos diez registros
Identificar la variable de interés llamada promedio
Determinar una muestra de la población.La población es todos los registros del archivo y la muestra es una parte de la población.
Identifica la media de la población
identificar la media de la muestra
comparar las medias aritméticas
crear un histograma de los datos
Realizar interpretación
poblacion.alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv")
Con head() y tail()
head(poblacion.alumnos,10)
## no promedio
## 1 1 91.60891
## 2 2 86.68564
## 3 3 84.06292
## 4 4 80.94624
## 5 5 88.49800
## 6 6 85.42097
## 7 7 81.11855
## 8 8 78.97463
## 9 9 75.81317
## 10 10 86.60781
tail(poblacion.alumnos,10)
## no promedio
## 5591 5591 83.61431
## 5592 5592 78.48419
## 5593 5593 79.59696
## 5594 5594 83.86262
## 5595 5595 81.04476
## 5596 5596 87.74938
## 5597 5597 86.64384
## 5598 5598 88.44429
## 5599 5599 88.19806
## 5600 5600 83.74940
La variable de interés es promedio
str(poblacion.alumnos)
## 'data.frame': 5600 obs. of 2 variables:
## $ no : int 1 2 3 4 5 6 7 8 9 10 ...
## $ promedio: num 91.6 86.7 84.1 80.9 88.5 ...
Muestra de 300 registros
Determinando la variable N el total de registros de la población
N <- nrow(poblacion.alumnos)
Se determinan los registros de la muestra
cuales <- sample(x = 1:N, 300, replace = FALSE)
cuales
## [1] 4066 2776 4257 1294 1434 731 5589 5396 110 1079 3964 115 1208 309 5323
## [16] 5135 4475 5034 4605 3482 191 3557 772 2472 5453 2645 677 1942 146 1532
## [31] 4318 3289 5172 4972 1625 3978 3461 845 4678 2712 3292 5590 3008 822 3897
## [46] 4630 878 2241 1897 493 460 1842 774 4496 2698 179 1435 1612 1869 3580
## [61] 1838 495 4758 231 1285 1635 4597 5443 5483 2077 2867 3125 5280 4215 3228
## [76] 4921 4217 3182 4298 5325 4043 558 3563 318 3596 470 5569 3536 2562 1284
## [91] 5526 5095 4827 1571 304 3843 1670 2921 1249 832 784 5200 1169 1763 2531
## [106] 1885 1413 1519 2397 3524 1180 1916 1259 4128 5184 1725 818 924 414 1281
## [121] 5273 3765 2146 4819 2820 627 5175 2790 1311 3752 4514 4341 2525 1692 2402
## [136] 5307 1250 886 164 1619 4264 1934 4362 4894 1606 498 2877 1501 169 5428
## [151] 2226 2727 1907 171 5170 3626 1051 1975 1701 4457 1200 1687 5247 5138 1020
## [166] 2252 2219 981 1219 4304 5222 40 1109 5217 3761 2505 1611 1800 5213 3084
## [181] 563 462 1028 281 3353 2457 2864 4562 1273 2395 3743 442 4768 2125 3987
## [196] 5179 1414 1441 5334 3798 1623 3024 2934 1067 5537 2760 1865 2713 5322 3673
## [211] 4181 4695 1505 2351 1358 2340 3349 1508 4671 3681 3813 4247 5496 5053 4118
## [226] 3239 2754 3750 3583 2464 5275 3425 4116 1360 5368 687 4908 138 2956 5014
## [241] 2535 2694 1437 1326 2222 5538 4798 3931 5337 1423 2197 2391 795 2581 1098
## [256] 3719 3734 4332 492 1239 5243 518 1137 5104 614 2829 1335 2495 2563 3692
## [271] 1961 4236 873 3283 5510 2188 2246 4434 4472 3740 2897 5218 4026 4676 1658
## [286] 3295 4849 1049 2320 2147 2606 4882 4653 2451 2646 732 797 3012 3588 2370
se determina la muestra
muestra.alumnos <- poblacion.alumnos[cuales, ]
head(muestra.alumnos, 10)
## no promedio
## 4066 4066 92.08324
## 2776 2776 85.68723
## 4257 4257 87.52578
## 1294 1294 85.98212
## 1434 1434 82.38202
## 731 731 86.98235
## 5589 5589 82.60416
## 5396 5396 81.77291
## 110 110 90.62691
## 1079 1079 76.13873
media.poblacion <- mean(poblacion.alumnos$promedio)
media.poblacion
## [1] 84.01415
media.muestra <- mean(muestra.alumnos$promedio)
media.muestra
## [1] 84.14869
este caso extrae los datos de promedio desde una dirección el cual mostrara de un registro de 5600 los primeros 10 y los últimos 10 del registro a partir del grupo se determinara una muestra de 300 registros el cual de a partir de esos 300 registros se sacaría la media de la población y la media de la muestra.