Objetivo

Elaborar un analisis descriptivo de la variable promedios de alumnos una muesta de la poblacion a partir de la lectura de un archivo promedios.csv

Descripción

Importar datos de promedio en la dirección: https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv y dejarlo en un data.frame.
Identificar la variable de interés llamada promedio
Determinar una muestra de la población. La población es todos los registros del archivo y la muestra es una parte de la población
Identifica la media de la población
Identificar la media de la muestra
Comparar las medias aritméticas
Crear un histograma de los datos
Realizar interpretación

Desarrollo

Importar los datos

poblacion.alumnos = read.csv("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/promedios.csv")

Mostrar los primeros y ultimos registros

head(poblacion.alumnos, 10)

##    no promedio
## 1   1 91.60891
## 2   2 86.68564
## 3   3 84.06292
## 4   4 80.94624
## 5   5 88.49800
## 6   6 85.42097
## 7   7 81.11855
## 8   8 78.97463
## 9   9 75.81317
## 10 10 86.60781

tail(poblacion.alumnos, 10)

##        no promedio
## 5591 5591 83.61431
## 5592 5592 78.48419
## 5593 5593 79.59696
## 5594 5594 83.86262
## 5595 5595 81.04476
## 5596 5596 87.74938
## 5597 5597 86.64384
## 5598 5598 88.44429
## 5599 5599 88.19806
## 5600 5600 83.74940

La variable de interes es promedio

str(poblacion.alumnos)

## 'data.frame':    5600 obs. of  2 variables:
##  $ no      : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ promedio: num  91.6 86.7 84.1 80.9 88.5 ...

Muestra de 300 registros

Determinando la variable N el total de registros de la poblacion.

N <- nrow(poblacion.alumnos)

Se determinan los registros de la muestra.

cuales <- sample(x = 1:N, 300, replace = FALSE)
cuales

##   [1] 2290 2886 1203 4162 3357 2615  819 1663  736  430 5195 2885 3703 2943 3796
##  [16] 4710 3667  130 3494 5571 5244 2499 4303 1060 1649  287 2737 2479 2883  231
##  [31] 2565 3117 1921 1864 3899 2814 4523 3507 2730 1436 1952  174  306 3273  189
##  [46] 3361 1044 4618   35 5069 3993 3960 3187 2857 1875 2978 1006 4294 2472 2500
##  [61] 3876  139 4168 5456 1590 2876 1682 2281 3700 2339 1755  830 2475 1419 3293
##  [76] 1808 3840 4782 2244 4746 4851 2343 5009 3712 5559 3154   86 1395  781 4538
##  [91] 3683 3916 2897 4033 2570  128 1588 4721 4363 5078 3807  503 1679  558 2032
## [106] 5357 3823 1612  582 2062 5350 4518 3785 3388 1078 3862 2682 2080 3485 4044
## [121]  302 5508 2296 2220 3050  787 3479 1234 5227 3859 2279 2208 4819 3012 1087
## [136] 1427 5422 3685 2802  686 2605 2699 2182 3210 3692 2816 3579 4698 3061 1938
## [151]  438 1583 1744   88 4655 2941 1664 4257 4056 3319 1722 2152  421 3557 5097
## [166]  313  809  732 3935  948 5162 1435 2169 5526 2799  575  920 3421 2621 4577
## [181] 5398 2458 3551 1972 1132 2937 5486 2567 5176 3701 2122 1318 1935 2589  277
## [196] 4739 4064 5470 3716 3498  499 4066 4260 3367  788 5342 1793 5365 3737 1146
## [211] 1662 1421 1469 1306 1642 4290 2393 2243 1565 3688 3506   17   20 4093 3890
## [226] 2137 2203 1221 3638 5148 4724 4705 1749  309 2473  166 5291 1874 4031  577
## [241] 4826 2823 1889 2222 1797 3225  715 1289 3285 2252  305 5179 3815  340 2336
## [256] 3196 4321 3601  422 4791 3456 1629 2992 2426 3675 1193 3002 2856 3274 5566
## [271]  546  826 5484 2424 1191 4629 1126 5439 3666 1264 4083 4964 3887   78 5288
## [286] 5222 4915 1525 5058 2009 2822 4691  816 1346 5022 2724  639  260 2396 2891

Se determina la muestra

muestra.alumnos <- poblacion.alumnos[cuales, ] 
head(muestra.alumnos, 10)

##        no promedio
## 2290 2290 86.76942
## 2886 2886 83.33277
## 1203 1203 81.22625
## 4162 4162 78.29411
## 3357 3357 77.19820
## 2615 2615 86.00847
## 819   819 84.04455
## 1663 1663 86.77522
## 736   736 86.35149
## 430   430 89.23884

tail(muestra.alumnos, 10)

##        no promedio
## 2822 2822 87.63049
## 4691 4691 85.85396
## 816   816 78.86899
## 1346 1346 82.67603
## 5022 5022 82.57304
## 2724 2724 78.25953
## 639   639 79.35612
## 260   260 86.38772
## 2396 2396 81.99435
## 2891 2891 89.91519

Media de la poblacion

media.poblacion <- mean(poblacion.alumnos$promedio)
media.poblacion

## [1] 84.01415

Media de la muestra

media.muestra <- mean(muestra.alumnos$promedio)
media.muestra

## [1] 83.90178

Interpretación

En lo personal se me hizo muy interesante este caso ya que vimos varios ejemplos y problemas que se nos presentaron y se nos pueden presentar, vimos como de una direccion URL podemos pasar solo ciertos registros y de ellos sacar los primeros 10 y ultimos 10 de una larga lista de promedios y como sacar la media y media de la muestra.

Caso 1. Analisis de promedios de alumnos

Jesus Manuel Aldana Reyes

8/9/2021

Objetivo

Descripción

Desarrollo

Importar los datos

Interpretación