CASO 1. Muestras y medias de variables de un conjunto de datos

Objetivo: Elaborar un archivo markdown que identifique muestras y medias de un conjunto de datos

1.Crear un conjunto de datos de una población con variables. El conjunto de datos será un data.frame(). 50 registros

Crear un DataFrame()

nombres <- c("RUBEN", 'JUAN', 'PEDRO', 'LUISA', 'LUZ', 'ADRIANA', 'LOLA', 'PATY', 'ERNESTO', 'JAVIER', 'PABLO', 'EMILIO', 'ALBERTO', 'JOSE', 'MARIA', 'PABLO', 'ESMERALDA', 'JAZMIN', 'MANUEL', 'VANESSA', 'ALEJANDRA', 'CECILIA', 'CARMEN', 'JESUS', 'DAMYAN', 'CARLOS', 'JUANA', 'MARIANA', 'JANET', 'ELIZABETH', 'DIANA', 'ANTONIO', 'FRANSISCO', 'DAVID', 'ANTONIO', 'SEBASTIAN', 'RAUL', 'IVAN', 'IRENE', 'SILVIA', 'TERESA', 'ROSA', 'MONICA', 'JOAQUIN', 'VICTOR', 'JESUS', 'DAMYAN', 'CARLOS', 'JUANA', 'MARIANA')
edades = sample(18:60, size=50, replace= TRUE, prob= NULL )
carrera <- c("SISTEMAS", 'ADMINISTRACION', 'ARQUITECTURA', 'BIOQUIMICA', 'MECATRONICA', 'ELECTRONICA', 'DERECHO', 'MECANICA', 'ANTROPOLOGIA', 'FILOSOFIA', 'ADMINISTRACION', 'FILOSOFIA', 'CIVIL', 'AGRONOMIA', 'MECATRONICA', 'CIVIL', 'CIVIL', 'ARQUITECTURA', 'SISTEMAS', 'FILOSOFIA', 'CIVIL', 'CIVIL', 'BIOQUIMICA', 'MECATRONICA', 'MEDICINA', 'DERECHO', 'MEDICINA', 'MEDICINA', 'MEDICINA', 'ANTROPOLOGIA', 'ARQUITECTURA', 'ELECTRONICA', 'DERECHO', 'MECATRONICA', 'SISTEMAS', 'ANTROPOLOGIA', 'ADMINISTRACION', 'ELECTRONICA', 'SISTEMAS', 'ELECTRONICA', 'ADMINISTRACION', 'BIOQUIMICA', 'DERECHO', 'MECANICA', 'ARQUITECTURA', 'FILOSOFIA', 'ANTROPOLOGIA', 'MECANICA', 'SISTEMAS', 'DERECHO')
genero <- c("M", 'M', 'M', 'F', 'F', 'F', 'F', 'F', 'M', 'M', 'M', 'M', 'M', 'M', 'F', 'M', 'F', 'F', 'M', 'F', 'F', 'F', 'F', 'M', 'M', 'M', 'F', 'M', 'F', 'F', 'F', 'M', 'M', 'M', 'M', 'M', 'M', 'M', 'F', 'F', 'F', 'F', 'F', 'M', 'M', 'M', 'M', 'M', 'F', 'F')
estatura = runif(50, min=1.4, max=2.1)
peso = sample(10:140, size=50, replace= TRUE, prob= NULL )
datos <- data.frame(nombres,edades,carrera,genero,estatura,peso)
datos

##      nombres edades        carrera genero estatura peso
## 1      RUBEN     40       SISTEMAS      M 2.057763   44
## 2       JUAN     31 ADMINISTRACION      M 1.588696  109
## 3      PEDRO     21   ARQUITECTURA      M 2.058796   36
## 4      LUISA     52     BIOQUIMICA      F 2.006991   74
## 5        LUZ     32    MECATRONICA      F 1.587954   59
## 6    ADRIANA     23    ELECTRONICA      F 1.595843   10
## 7       LOLA     37        DERECHO      F 1.907721   86
## 8       PATY     23       MECANICA      F 1.721531  132
## 9    ERNESTO     44   ANTROPOLOGIA      M 1.415180   39
## 10    JAVIER     23      FILOSOFIA      M 1.560324   64
## 11     PABLO     50 ADMINISTRACION      M 1.591758   93
## 12    EMILIO     53      FILOSOFIA      M 1.636006  118
## 13   ALBERTO     54          CIVIL      M 2.060010   92
## 14      JOSE     29      AGRONOMIA      M 1.439438   79
## 15     MARIA     34    MECATRONICA      F 1.926083   25
## 16     PABLO     26          CIVIL      M 2.044869   64
## 17 ESMERALDA     44          CIVIL      F 2.089072   55
## 18    JAZMIN     52   ARQUITECTURA      F 2.085228  117
## 19    MANUEL     22       SISTEMAS      M 1.721994   74
## 20   VANESSA     54      FILOSOFIA      F 2.052025  129
## 21 ALEJANDRA     41          CIVIL      F 2.083869   17
## 22   CECILIA     40          CIVIL      F 1.828147   29
## 23    CARMEN     41     BIOQUIMICA      F 1.768693   99
## 24     JESUS     29    MECATRONICA      M 1.914428   35
## 25    DAMYAN     25       MEDICINA      M 2.074311   98
## 26    CARLOS     49        DERECHO      M 1.585616   73
## 27     JUANA     50       MEDICINA      F 1.919155  132
## 28   MARIANA     33       MEDICINA      M 2.062577   61
## 29     JANET     31       MEDICINA      F 1.907265   93
## 30 ELIZABETH     38   ANTROPOLOGIA      F 1.725409   27
## 31     DIANA     22   ARQUITECTURA      F 1.947564  112
## 32   ANTONIO     46    ELECTRONICA      M 2.072142   29
## 33 FRANSISCO     42        DERECHO      M 1.592053   40
## 34     DAVID     40    MECATRONICA      M 1.560647  134
## 35   ANTONIO     28       SISTEMAS      M 1.829337  130
## 36 SEBASTIAN     39   ANTROPOLOGIA      M 1.840589   30
## 37      RAUL     57 ADMINISTRACION      M 2.029597  120
## 38      IVAN     45    ELECTRONICA      M 1.452559   95
## 39     IRENE     33       SISTEMAS      F 1.803279  100
## 40    SILVIA     42    ELECTRONICA      F 1.504148   77
## 41    TERESA     32 ADMINISTRACION      F 1.751832   97
## 42      ROSA     26     BIOQUIMICA      F 1.955547   36
## 43    MONICA     33        DERECHO      F 1.656433   84
## 44   JOAQUIN     55       MECANICA      M 1.898565   15
## 45    VICTOR     33   ARQUITECTURA      M 1.821286   70
## 46     JESUS     24      FILOSOFIA      M 1.549213   75
## 47    DAMYAN     38   ANTROPOLOGIA      M 2.013124   45
## 48    CARLOS     60       MECANICA      M 1.980662   45
## 49     JUANA     29       SISTEMAS      F 1.797638   47
## 50   MARIANA     44        DERECHO      F 1.409842   31

2.-Crear 5 muestras de 10 datos de una poblacion.

5 Muestras de edades de la poblacion

set.seed(2020)
muestra1e <- sample(datos$edades, 10, replace = FALSE)
muestra1e

##  [1] 33 55 41 40 29 40 44 39 26 23

muestra2e <- sample(datos$edades, 10, replace = FALSE)
muestra2e

##  [1] 29 33 23 26 26 31 40 21 31 44

muestra3e <- sample(datos$edades, 10, replace = FALSE)
muestra3e

##  [1] 42 52 29 60 53 38 37 54 52 41

muestra4e <- sample(datos$edades, 10, replace = FALSE)
muestra4e

##  [1] 60 55 52 23 22 23 33 54 46 29

muestra5e <- sample(datos$edades, 10, replace = FALSE)
muestra5e

##  [1] 54 33 31 22 26 44 40 45 21 31

5 Muestras de peso de la poblacion

set.seed(2020)
muestra1p <- sample(datos$peso, 10, replace = FALSE)
muestra1p

##  [1] 61 15 99 29 35 44 55 30 36 10

muestra2p <- sample(datos$peso, 10, replace = FALSE)
muestra2p

##  [1]  47  70 132  36  64  93 134  36 109  31

muestra3p <- sample(datos$peso, 10, replace = FALSE)
muestra3p

##  [1]  77  74  79  45 118  45  86 129 117  17

muestra4p <- sample(datos$peso, 10, replace = FALSE)
muestra4p

##  [1]  45  15 117  64 112  10  84  92  29  35

muestra5p <- sample(datos$peso, 10, replace = FALSE)
muestra5p

##  [1]  92  70 109 112  64  31  44  95  36  93

5 Muestras de estatura de la poblacion

set.seed(2020)
muestra1 <- sample(datos$estatura, 10, replace = FALSE)
muestra1

##  [1] 2.062577 1.898565 1.768693 1.828147 1.914428 2.057763 2.089072 1.840589
##  [9] 1.955547 1.595843

muestra2 <- sample(datos$estatura, 10, replace = FALSE)
muestra2

##  [1] 1.797638 1.821286 1.721531 1.955547 2.044869 1.907265 1.560647 2.058796
##  [9] 1.588696 1.409842

muestra3 <- sample(datos$estatura, 10, replace = FALSE)
muestra3

##  [1] 1.504148 2.006991 1.439438 1.980662 1.636006 2.013124 1.907721 2.052025
##  [9] 2.085228 2.083869

muestra4 <- sample(datos$estatura, 10, replace = FALSE)
muestra4

##  [1] 1.980662 1.898565 2.085228 1.560324 1.947564 1.595843 1.656433 2.060010
##  [9] 2.072142 1.914428

muestra5 <- sample(datos$estatura, 10, replace = FALSE)
muestra5

##  [1] 2.060010 1.821286 1.588696 1.947564 2.044869 1.409842 2.057763 1.452559
##  [9] 2.058796 1.907265

3.De cada muestra determinar la media mean(muestra1,muestar2…. muestra5) de la edad, del peso y de la estatura

Medias de las muestras de la edad

meanM1 <- mean(muestra1e)
meanM1

## [1] 37

meanM2 <- mean(muestra2e)
meanM2

## [1] 30.4

meanM3 <- mean(muestra3e)
meanM3

## [1] 45.8

meanM4 <- mean(muestra4e)
meanM4

## [1] 39.7

meanM5 <- mean(muestra5e)
meanM5

## [1] 34.7

Medias de las muestras del peso

meanM1 <- mean(muestra1p)
meanM1

## [1] 41.4

meanM2 <- mean(muestra2p)
meanM2

## [1] 75.2

meanM3 <- mean(muestra3p)
meanM3

## [1] 78.7

meanM4 <- mean(muestra4p)
meanM4

## [1] 60.3

meanM5 <- mean(muestra5p)
meanM5

## [1] 74.6

Medias de las muestras de la estatura

meanM1 <- mean(muestra1)
meanM1

## [1] 1.901122

meanM2 <- mean(muestra2)
meanM2

## [1] 1.786612

meanM3 <- mean(muestra3)
meanM3

## [1] 1.870921

meanM4 <- mean(muestra4)
meanM4

## [1] 1.87712

meanM5 <- mean(muestra5)
meanM5

## [1] 1.834865

4. Comparar la media de cada muestra con la media de toda la población de la edad, del peso y de la estatura.

Comparar media de la poblacion con la media de las edades

mean(datos$edades)

## [1] 37.78

Comparar media de la poblacion con la media del peso

mean(datos$peso)

## [1] 71.5

5. Descripción del caso

Al comparar la media de las muestras con la media la poblacion pude notar que se acercan bastante, por lo que creo que la poblacion puede ser de mucha importancia para realizar una operacion y determinar la media y esta puede ser muy cercana a la de la poblacion. Aunque hay que tomar en cuenta que entre mas datos se consideran mas presiso va a ser el resultado por lo que el dato mas presiso que podemos obtener es usando todos los dato, es decir la poblacion.

CASO 1. Muestras y medias de variables de un conjunto de datos

Jesus Javier Gomez Soto

17/9/2020

Objetivo: Elaborar un archivo markdown que identifique muestras y medias de un conjunto de datos

1.Crear un conjunto de datos de una población con variables. El conjunto de datos será un data.frame(). 50 registros

2.-Crear 5 muestras de 10 datos de una poblacion.

3.De cada muestra determinar la media mean(muestra1,muestar2…. muestra5) de la edad, del peso y de la estatura

4. Comparar la media de cada muestra con la media de toda la población de la edad, del peso y de la estatura.

5. Descripción del caso