Objetivo

Elaborar un análisis descriptivo de la variable promedios de alumnos una muestra de la población a partir de la lectura de un archivo promedios.csv

Descripción

Desarrollo

importar los datos

poblacion.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv")

Mostrar los primeros y últimos registros

head(poblacion.alumnos, 10)
##    no promedio
## 1   1 91.60891
## 2   2 86.68564
## 3   3 84.06292
## 4   4 80.94624
## 5   5 88.49800
## 6   6 85.42097
## 7   7 81.11855
## 8   8 78.97463
## 9   9 75.81317
## 10 10 86.60781
tail(poblacion.alumnos, 10)
##        no promedio
## 5591 5591 83.61431
## 5592 5592 78.48419
## 5593 5593 79.59696
## 5594 5594 83.86262
## 5595 5595 81.04476
## 5596 5596 87.74938
## 5597 5597 86.64384
## 5598 5598 88.44429
## 5599 5599 88.19806
## 5600 5600 83.74940

La variable de interés es promedio

str(poblacion.alumnos)
## 'data.frame':    5600 obs. of  2 variables:
##  $ no      : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ promedio: num  91.6 86.7 84.1 80.9 88.5 ...

Muestra de 300 registros

Determinando la variable N el total de registros de la población

N <- nrow(poblacion.alumnos)

Se determinan los registros de la muestra

cuales <- sample(x = 1:N, 300, replace = FALSE)
cuales
##   [1]  768  346 5574 1992  475 1661 2293 4444 4245 5527 3927 2622 4636 3739 1800
##  [16]  258 1087  989 1756 4228   16 5568 4860 4863 3016 1193  594   58 2062 3901
##  [31] 1085 2219 4232 5281 1755 2084 1880 5503 5234 3470 3209 3978 2519  926  802
##  [46] 1660 3437  899 4099 1415 2731 5309 3706 5326 1335 3513 2745 3533 4773 1310
##  [61]  888 2984 1399 2184 1463 2551 2697  729 2813 1862 4196 4508 3645  553  550
##  [76] 5189 4914 4769 4557 3373 3885 2510 4986  262 4544 2629 3393 5565 2078 5267
##  [91] 4802  308 1921 4676 3237 3017 4755  571 1631 4843 5409 5146 5428 5317 4132
## [106]  663 5117 5098 5466 3681 3440 5155 4198 4651 4419 2483 4980 2006 2144 4822
## [121] 1870 5388 5488 2991 2677 1083 2631 2761 4671 4325 5216 5145 2696   88 4406
## [136]   54 2725   21  681 1567 3597 2134 4764  709  213 5379 1379 2924 5485 4926
## [151] 5094 4879 4102 1227 3429 2657 3322 4957 4661 1364 4846  154 3431 2280 2781
## [166] 1893 4491 4420 1672 1987 4937 3455 4528 3458 1726 4114 4318 4535  933 5319
## [181] 2729 5499  287 2626 2981 1664  985 5238    9  688  137 1956 5392 2896 1611
## [196] 4917 3078 3233 2156 1719 4248 1494 5511 4672 2145 4933 2472 4316 3283 1052
## [211] 1690 2772 5522 3084 2018 2833 3214 3583 3258 3932 3376 2009 5226 3974 4977
## [226] 2623 3900 1856 4100 3451 3892  878 4053 1651 4713 4781 3756 1315  454 4501
## [241] 4991 1887 3587 2600  721 2899 4644 3652  328 4899 2172 1338 2718 4804   98
## [256] 1815  343 5106 1598 2630 2918 2531 3270  983 4033  818 4758 3976 1580 2862
## [271]  510 5435 1050 1682 1046  570 3603 5002 2264 3007 3531 2888 2128 2322 3510
## [286]  698 4268 4408 4612 2824 2713 3181 4376 1374 3578 4056 4944 4186 1540 4149

Se determina la muestra

muestra.alumnos <- poblacion.alumnos[cuales, ] 
head(muestra.alumnos, 10)
##        no promedio
## 768   768 85.79204
## 346   346 86.84353
## 5574 5574 82.01132
## 1992 1992 82.51152
## 475   475 85.18086
## 1661 1661 95.61840
## 2293 2293 82.90319
## 4444 4444 80.84749
## 4245 4245 81.81940
## 5527 5527 83.46789
tail(muestra.alumnos, 10)
##        no promedio
## 2713 2713 83.53019
## 3181 3181 93.29812
## 4376 4376 90.55815
## 1374 1374 85.84324
## 3578 3578 90.98614
## 4056 4056 88.25176
## 4944 4944 87.49395
## 4186 4186 76.76992
## 1540 1540 73.81979
## 4149 4149 77.13917

Media de la población

media.poblacion <- mean(poblacion.alumnos$promedio)
media.poblacion
## [1] 84.01415

Media de la muestra

media.muestra <- mean(muestra.alumnos$promedio)
media.muestra
## [1] 83.88569

Interpretación

En este caso se manejo un registro mediante una dirección de la cual se importaron los datos de promedios de alumnos los cuales manejamos de los primeros 10 a los últimos 10 así para que se llevara acabo de manera correcta lo cual después se tendría que sacar una media de los ya registrados así para ya sacar una muestra la cual seria una pequeña cantidad, se determinaron los datos de acuerdo a las variables.