Elaborar un analisis descriptivo de la variable promedios de alumnos una muesta de la poblacion a partir de la lectura de un archivo promedios.csv
Importar datos de promedio en la dirección: https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv y dejarlo en un data.frame.
Identificar la variable de interés llamada promedio
Determinar una muestra de la población. La población es todos los registros del archivo y la muestra es una parte de la población
Identifica la media de la población
Identificar la media de la muestra
Comparar las medias aritméticas
Crear un histograma de los datos
Realizar interpretación
poblacion.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv")
Mostrar los primeros y ultimos registros
head(poblacion.alumnos, 10)
## no promedio
## 1 1 91.60891
## 2 2 86.68564
## 3 3 84.06292
## 4 4 80.94624
## 5 5 88.49800
## 6 6 85.42097
## 7 7 81.11855
## 8 8 78.97463
## 9 9 75.81317
## 10 10 86.60781
tail(poblacion.alumnos, 10)
## no promedio
## 5591 5591 83.61431
## 5592 5592 78.48419
## 5593 5593 79.59696
## 5594 5594 83.86262
## 5595 5595 81.04476
## 5596 5596 87.74938
## 5597 5597 86.64384
## 5598 5598 88.44429
## 5599 5599 88.19806
## 5600 5600 83.74940
La variable de interes es promedio
str(poblacion.alumnos)
## 'data.frame': 5600 obs. of 2 variables:
## $ no : int 1 2 3 4 5 6 7 8 9 10 ...
## $ promedio: num 91.6 86.7 84.1 80.9 88.5 ...
Muestra de 300 registros
Determinando la variable N el total de registros de la poblacion.
N <- nrow(poblacion.alumnos)
Se determinan los registros de la muestra.
cuales <- sample(x = 1:N, 300, replace = FALSE)
cuales
## [1] 2290 2886 1203 4162 3357 2615 819 1663 736 430 5195 2885 3703 2943 3796
## [16] 4710 3667 130 3494 5571 5244 2499 4303 1060 1649 287 2737 2479 2883 231
## [31] 2565 3117 1921 1864 3899 2814 4523 3507 2730 1436 1952 174 306 3273 189
## [46] 3361 1044 4618 35 5069 3993 3960 3187 2857 1875 2978 1006 4294 2472 2500
## [61] 3876 139 4168 5456 1590 2876 1682 2281 3700 2339 1755 830 2475 1419 3293
## [76] 1808 3840 4782 2244 4746 4851 2343 5009 3712 5559 3154 86 1395 781 4538
## [91] 3683 3916 2897 4033 2570 128 1588 4721 4363 5078 3807 503 1679 558 2032
## [106] 5357 3823 1612 582 2062 5350 4518 3785 3388 1078 3862 2682 2080 3485 4044
## [121] 302 5508 2296 2220 3050 787 3479 1234 5227 3859 2279 2208 4819 3012 1087
## [136] 1427 5422 3685 2802 686 2605 2699 2182 3210 3692 2816 3579 4698 3061 1938
## [151] 438 1583 1744 88 4655 2941 1664 4257 4056 3319 1722 2152 421 3557 5097
## [166] 313 809 732 3935 948 5162 1435 2169 5526 2799 575 920 3421 2621 4577
## [181] 5398 2458 3551 1972 1132 2937 5486 2567 5176 3701 2122 1318 1935 2589 277
## [196] 4739 4064 5470 3716 3498 499 4066 4260 3367 788 5342 1793 5365 3737 1146
## [211] 1662 1421 1469 1306 1642 4290 2393 2243 1565 3688 3506 17 20 4093 3890
## [226] 2137 2203 1221 3638 5148 4724 4705 1749 309 2473 166 5291 1874 4031 577
## [241] 4826 2823 1889 2222 1797 3225 715 1289 3285 2252 305 5179 3815 340 2336
## [256] 3196 4321 3601 422 4791 3456 1629 2992 2426 3675 1193 3002 2856 3274 5566
## [271] 546 826 5484 2424 1191 4629 1126 5439 3666 1264 4083 4964 3887 78 5288
## [286] 5222 4915 1525 5058 2009 2822 4691 816 1346 5022 2724 639 260 2396 2891
Se determina la muestra
muestra.alumnos <- poblacion.alumnos[cuales, ]
head(muestra.alumnos, 10)
## no promedio
## 2290 2290 86.76942
## 2886 2886 83.33277
## 1203 1203 81.22625
## 4162 4162 78.29411
## 3357 3357 77.19820
## 2615 2615 86.00847
## 819 819 84.04455
## 1663 1663 86.77522
## 736 736 86.35149
## 430 430 89.23884
tail(muestra.alumnos, 10)
## no promedio
## 2822 2822 87.63049
## 4691 4691 85.85396
## 816 816 78.86899
## 1346 1346 82.67603
## 5022 5022 82.57304
## 2724 2724 78.25953
## 639 639 79.35612
## 260 260 86.38772
## 2396 2396 81.99435
## 2891 2891 89.91519
Media de la poblacion
media.poblacion <- mean(poblacion.alumnos$promedio)
media.poblacion
## [1] 84.01415
Media de la muestra
media.muestra <- mean(muestra.alumnos$promedio)
media.muestra
## [1] 83.90178
En lo personal se me hizo muy interesante este caso ya que vimos varios ejemplos y problemas que se nos presentaron y se nos pueden presentar, vimos como de una direccion URL podemos pasar solo ciertos registros y de ellos sacar los primeros 10 y ultimos 10 de una larga lista de promedios y como sacar la media y media de la muestra.