Objetivo

Elaborar un analisis descriptivo de la variable promedios de alumnos una muesta de la poblacion a partir de la lectura de un archivo promedios.csv

Descripción

Desarrollo

Importar los datos

poblacion.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv")

Mostrar los primeros y ultimos registros

head(poblacion.alumnos, 10)
##    no promedio
## 1   1 91.60891
## 2   2 86.68564
## 3   3 84.06292
## 4   4 80.94624
## 5   5 88.49800
## 6   6 85.42097
## 7   7 81.11855
## 8   8 78.97463
## 9   9 75.81317
## 10 10 86.60781
tail(poblacion.alumnos, 10)
##        no promedio
## 5591 5591 83.61431
## 5592 5592 78.48419
## 5593 5593 79.59696
## 5594 5594 83.86262
## 5595 5595 81.04476
## 5596 5596 87.74938
## 5597 5597 86.64384
## 5598 5598 88.44429
## 5599 5599 88.19806
## 5600 5600 83.74940

La variable de interes es promedio

str(poblacion.alumnos)
## 'data.frame':    5600 obs. of  2 variables:
##  $ no      : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ promedio: num  91.6 86.7 84.1 80.9 88.5 ...

Muestra de 300 registros

Determinando la variable N el total de registros de la poblacion.

N <- nrow(poblacion.alumnos)

Se determinan los registros de la muestra.

cuales <- sample(x = 1:N, 300, replace = FALSE)
cuales
##   [1] 2290 2886 1203 4162 3357 2615  819 1663  736  430 5195 2885 3703 2943 3796
##  [16] 4710 3667  130 3494 5571 5244 2499 4303 1060 1649  287 2737 2479 2883  231
##  [31] 2565 3117 1921 1864 3899 2814 4523 3507 2730 1436 1952  174  306 3273  189
##  [46] 3361 1044 4618   35 5069 3993 3960 3187 2857 1875 2978 1006 4294 2472 2500
##  [61] 3876  139 4168 5456 1590 2876 1682 2281 3700 2339 1755  830 2475 1419 3293
##  [76] 1808 3840 4782 2244 4746 4851 2343 5009 3712 5559 3154   86 1395  781 4538
##  [91] 3683 3916 2897 4033 2570  128 1588 4721 4363 5078 3807  503 1679  558 2032
## [106] 5357 3823 1612  582 2062 5350 4518 3785 3388 1078 3862 2682 2080 3485 4044
## [121]  302 5508 2296 2220 3050  787 3479 1234 5227 3859 2279 2208 4819 3012 1087
## [136] 1427 5422 3685 2802  686 2605 2699 2182 3210 3692 2816 3579 4698 3061 1938
## [151]  438 1583 1744   88 4655 2941 1664 4257 4056 3319 1722 2152  421 3557 5097
## [166]  313  809  732 3935  948 5162 1435 2169 5526 2799  575  920 3421 2621 4577
## [181] 5398 2458 3551 1972 1132 2937 5486 2567 5176 3701 2122 1318 1935 2589  277
## [196] 4739 4064 5470 3716 3498  499 4066 4260 3367  788 5342 1793 5365 3737 1146
## [211] 1662 1421 1469 1306 1642 4290 2393 2243 1565 3688 3506   17   20 4093 3890
## [226] 2137 2203 1221 3638 5148 4724 4705 1749  309 2473  166 5291 1874 4031  577
## [241] 4826 2823 1889 2222 1797 3225  715 1289 3285 2252  305 5179 3815  340 2336
## [256] 3196 4321 3601  422 4791 3456 1629 2992 2426 3675 1193 3002 2856 3274 5566
## [271]  546  826 5484 2424 1191 4629 1126 5439 3666 1264 4083 4964 3887   78 5288
## [286] 5222 4915 1525 5058 2009 2822 4691  816 1346 5022 2724  639  260 2396 2891

Se determina la muestra

muestra.alumnos <- poblacion.alumnos[cuales, ] 
head(muestra.alumnos, 10)
##        no promedio
## 2290 2290 86.76942
## 2886 2886 83.33277
## 1203 1203 81.22625
## 4162 4162 78.29411
## 3357 3357 77.19820
## 2615 2615 86.00847
## 819   819 84.04455
## 1663 1663 86.77522
## 736   736 86.35149
## 430   430 89.23884
tail(muestra.alumnos, 10)
##        no promedio
## 2822 2822 87.63049
## 4691 4691 85.85396
## 816   816 78.86899
## 1346 1346 82.67603
## 5022 5022 82.57304
## 2724 2724 78.25953
## 639   639 79.35612
## 260   260 86.38772
## 2396 2396 81.99435
## 2891 2891 89.91519

Media de la poblacion

media.poblacion <- mean(poblacion.alumnos$promedio)
media.poblacion
## [1] 84.01415

Media de la muestra

media.muestra <- mean(muestra.alumnos$promedio)
media.muestra
## [1] 83.90178

Interpretación

En lo personal se me hizo muy interesante este caso ya que vimos varios ejemplos y problemas que se nos presentaron y se nos pueden presentar, vimos como de una direccion URL podemos pasar solo ciertos registros y de ellos sacar los primeros 10 y ultimos 10 de una larga lista de promedios y como sacar la media y media de la muestra.