Estadistica Descriptiva

Sample es una funcion que muestra aleatoreamente de una seccion de numeros, Replace va a repetir de los mismos numeros

sample(25:75, n, replace = TRUE)
##  [1] 63 56 58 64 36 72 54 53 40 60 55 28 44 47 46 74 68 39 42 55 46 57 75 65 58
## [26] 66 44 56 43 45 46 54 49 61 44 34 62 41 48 26 70 29 73 43 66 53 30 72 43 61
## [51] 72 69 56 26 37 75 72 66 37 37
#otro
sample(1:6,3)
## [1] 3 2 4
rm(n)
metabolico
##    id edad      sexo glucosa colesterol sistolica  imc tabaquismo  actividad
## 1   1   26  Femenino   113.1      227.2       140 20.0      FALSE       Leve
## 2   2   61  Femenino   100.3      223.2       133 24.0       TRUE   Moderado
## 3   3   69  Femenino   106.2      151.4        99 23.7      FALSE Sedentario
## 4   4   41  Femenino   158.8      192.8       132 30.0      FALSE Sedentario
## 5   5   69  Femenino    95.2      183.7       139 31.8      FALSE   Moderado
## 6   6   56 Masculino   101.8      171.8       127 30.9      FALSE    Intenso
## 7   7   65  Femenino   105.1       89.2       132 25.7      FALSE       Leve
## 8   8   58 Masculino    89.8      133.6       147 21.7       TRUE       Leve
## 9   9   53  Femenino   104.8      214.3        91 27.0      FALSE Sedentario
## 10 10   35  Femenino    63.7      199.9       130 26.4       TRUE Sedentario
## 11 11   40 Masculino    88.7      159.3        96 33.8       TRUE       Leve
## 12 12   53 Masculino   122.6      277.9       106 31.1      FALSE   Moderado
## 13 13   38 Masculino    88.8      138.9       116 32.4       TRUE   Moderado
## 14 14   58 Masculino   124.7      132.0       133 32.3      FALSE Sedentario
## 15 15   50  Femenino   114.2      188.7       121 31.3      FALSE   Moderado
## 16 16   68 Masculino   102.3      147.1       130 26.4      FALSE       Leve
## 17 17   74  Femenino   119.3      277.9       119 24.7      FALSE   Moderado
## 18 18   50 Masculino   125.9      200.4       108 18.8       TRUE       Leve
## 19 19   56  Femenino   115.0      198.2       105 26.7       TRUE       Leve
## 20 20   45 Masculino    60.5      178.9       143 32.3      FALSE Sedentario
## 21 21   25 Masculino   112.0      276.1       145 20.7      FALSE       Leve
## 22 22   35  Femenino   137.3      124.8       136 32.0      FALSE    Intenso
## 23 23   59 Masculino   121.1      232.8       144 22.5      FALSE Sedentario
## 24 24   65  Femenino   158.4      216.0       163 27.1       TRUE Sedentario
## 25 25   70 Masculino   121.1      180.7        97 35.4      FALSE       Leve
## 26 26   41  Femenino    85.1      216.3       127 31.5       TRUE   Moderado
## 27 27   52 Masculino    69.4      158.5       136 35.4       TRUE Sedentario
## 28 28   72  Femenino    80.0      204.7       120 29.8      FALSE Sedentario
## 29 29   48  Femenino    73.8      212.2       123 28.1       TRUE   Moderado
## 30 30   44  Femenino   107.0      141.5       139 24.0      FALSE    Intenso
## 31 31   52 Masculino   135.5      201.7       120 32.3      FALSE       Leve
## 32 32   44  Femenino    70.5      229.4        99 28.5       TRUE Sedentario
## 33 33   67 Masculino    84.5      169.1       166 18.7       TRUE Sedentario
## 34 34   44 Masculino    72.3      177.7       140 24.8      FALSE       Leve
## 35 35   47  Femenino   103.3      133.5       161 27.6      FALSE       Leve
## 36 36   66  Femenino   127.7      284.7       116 27.5       TRUE   Moderado
## 37 37   28 Masculino   132.8      128.7       161 29.2      FALSE   Moderado
## 38 38   31 Masculino   106.1      206.2       112 28.9      FALSE Sedentario
## 39 39   40  Femenino   105.5      244.2       129 21.4      FALSE       Leve
## 40 40   44  Femenino   125.3      181.9       148 28.8      FALSE Sedentario
## 41 41   27  Femenino    86.8      259.5       147 27.6      FALSE       Leve
## 42 42   49 Masculino   110.9      158.8       126 33.5      FALSE       Leve
## 43 43   58  Femenino   107.8      268.4       123 27.8       TRUE       Leve
## 44 44   49 Masculino   130.0      214.4       112 30.9      FALSE       Leve
## 45 45   73  Femenino   142.9      195.6       144 31.9       TRUE Sedentario
## 46 46   50 Masculino   107.0      241.4       123 27.6       TRUE   Moderado
## 47 47   73  Femenino    89.7      243.2       105 28.8      FALSE Sedentario
## 48 48   27 Masculino    96.7      201.9       136 20.4      FALSE    Intenso
## 49 49   49 Masculino   137.6      245.7       114 22.4       TRUE Sedentario
## 50 50   25 Masculino    86.5      181.9       121 31.1      FALSE Sedentario
## 51 51   30 Masculino   138.6      180.6       133 28.2      FALSE       Leve
## 52 52   44  Femenino    72.9      195.3       138 16.4      FALSE   Moderado
## 53 53   33  Femenino   103.3      194.8       113 25.4       TRUE Sedentario
## 54 54   39  Femenino    86.7      220.7       118 22.7       TRUE Sedentario
## 55 55   37  Femenino   245.0      163.1       117 31.2      FALSE    Intenso
## 56 56   40 Masculino   267.0      312.0       129 18.0      FALSE    Intenso
## 57 57   67 Masculino      NA      328.0        89 52.1      FALSE Sedentario
## 58 58   58 Masculino      NA         NA       195 54.3      FALSE Sedentario
## 59 59   73  Femenino      NA         NA       198   NA      FALSE       Leve
## 60 60   75  Femenino    18.0         NA        NA   NA      FALSE   Moderado
glucosa<- metabolico$glucosa

mediaG<- mean(glucosa, na.rm=T)
sdG <-sd(glucosa, na.rm=T)
print(round(mediaG))
## [1] 110
print(round(sdG))
## [1] 38

#Practica hacer lo de arriba pero con colesterol

Colesterol <-metabolico$colesterol
Colesterol
##  [1] 227.2 223.2 151.4 192.8 183.7 171.8  89.2 133.6 214.3 199.9 159.3 277.9
## [13] 138.9 132.0 188.7 147.1 277.9 200.4 198.2 178.9 276.1 124.8 232.8 216.0
## [25] 180.7 216.3 158.5 204.7 212.2 141.5 201.7 229.4 169.1 177.7 133.5 284.7
## [37] 128.7 206.2 244.2 181.9 259.5 158.8 268.4 214.4 195.6 241.4 243.2 201.9
## [49] 245.7 181.9 180.6 195.3 194.8 220.7 163.1 312.0 328.0    NA    NA    NA
medC<-mean(Colesterol, na.rm = T)
sdC <-sd(Colesterol, na.rm=T)
print(round(mediaG),2)
## [1] 110
print(round(sdC),2)
## [1] 49

Se usa el summary para una estadistica descriptiva

summary(metabolico)
##        id             edad              sexo       glucosa        colesterol   
##  Min.   : 1.00   Min.   :25.00   Femenino :32   Min.   : 18.0   Min.   : 89.2  
##  1st Qu.:15.75   1st Qu.:40.00   Masculino:28   1st Qu.: 88.7   1st Qu.:169.1  
##  Median :30.50   Median :49.50                  Median :106.1   Median :198.2  
##  Mean   :30.50   Mean   :50.25                  Mean   :109.8   Mean   :200.2  
##  3rd Qu.:45.25   3rd Qu.:62.00                  3rd Qu.:124.7   3rd Qu.:227.2  
##  Max.   :60.00   Max.   :75.00                  Max.   :267.0   Max.   :328.0  
##                                                 NA's   :3       NA's   :3      
##    sistolica          imc        tabaquismo           actividad 
##  Min.   : 89.0   Min.   :16.40   Mode :logical   Sedentario:22  
##  1st Qu.:116.0   1st Qu.:24.18   FALSE:40        Leve      :19  
##  Median :129.0   Median :27.95   TRUE :20        Moderado  :13  
##  Mean   :129.0   Mean   :28.20                   Intenso   : 6  
##  3rd Qu.:139.5   3rd Qu.:31.27                                  
##  Max.   :198.0   Max.   :54.30                                  
##  NA's   :1       NA's   :2

Varianza el cuadrado de la sd

var(glucosa, na.rm=T)
## [1] 1444.093

Funcion de Quantiles, trabaja con los Quarts y tambien elimina los datos no disponibles

quantile(glucosa,
         probs = c(0.05, 0.10, 0.25, 0.50, 0.75, 0.90, 0.95), #Se usan con por sentaje eg 5/100
         na.rm = TRUE)
##     5%    10%    25%    50%    75%    90%    95% 
##  68.26  72.66  88.70 106.10 124.70 138.00 158.48

NA remove

IQR(glucosa, na.rm = TRUE)   # Rango intercuartílico = Q3 - Q1
## [1] 36

summary segun lo que uno quiere

summary(metabolico[, c("edad","glucosa","colesterol","sistolica","imc")])
##       edad          glucosa        colesterol      sistolica    
##  Min.   :25.00   Min.   : 18.0   Min.   : 89.2   Min.   : 89.0  
##  1st Qu.:40.00   1st Qu.: 88.7   1st Qu.:169.1   1st Qu.:116.0  
##  Median :49.50   Median :106.1   Median :198.2   Median :129.0  
##  Mean   :50.25   Mean   :109.8   Mean   :200.2   Mean   :129.0  
##  3rd Qu.:62.00   3rd Qu.:124.7   3rd Qu.:227.2   3rd Qu.:139.5  
##  Max.   :75.00   Max.   :267.0   Max.   :328.0   Max.   :198.0  
##                  NA's   :3       NA's   :3       NA's   :1      
##       imc       
##  Min.   :16.40  
##  1st Qu.:24.18  
##  Median :27.95  
##  Mean   :28.20  
##  3rd Qu.:31.27  
##  Max.   :54.30  
##  NA's   :2

Tabla de frecuencias de actividada eg

table(metabolico$actividad)                         # frecuencias absolutas
## 
## Sedentario       Leve   Moderado    Intenso 
##         22         19         13          6
round(prop.table(table(metabolico$actividad))*100, 1) # frecuencias relativas
## 
## Sedentario       Leve   Moderado    Intenso 
##       36.7       31.7       21.7       10.0

Generacion de valores usando el comando seq de sequencia

x <- seq(0,10,0.1)
y <-sin(3*x) #calculando el seno de x multiplicado por 3
plot(x, y, col= "blue", bg= "grey", xlab="Time in s", ylab = "sen(t)", main = "Funcion seno(t) vs t")
lines(x,y)

otro valor personalizacion #pch es el tipo de puntos y cex es para el tamano de los puntos, cex.main y cex.axis para los parametros, abline traza una linea en un punto especifico

x <- seq(0,10,0.5)
x2 <-seq(0.10,0.1)
y <-sin(x) #calculando el seno de x multiplicado por 3
y2<-sin(x2)
plot(x, y, col= "brown", bg= "grey", xlab="Time in s", ylab = "sen(t)", main = "Funcion seno(t) vs t", pch=90, cex=1, cex.main= 1.5, cex.axis=0.7, cex.lab=0.7) 
lines(x,y, col= "000100", lty=10) 
abline(v=6, lty=3, col="red")
abline(h=-0.3, lty=34, col="gold")

Hasta aqui el profesor publico como prueba es facil de accder por link https://rpubs.com/pgBeermann/1409009

Histogramas variables continuas con numeros aleatorios normal. rnorm genera numeros aleatorios con normalidad

a <-rnorm(1000,5,1)
hist(a, breaks = 50)

ahora con 10000, font.main tiene 4 tipos 1: negrita, 2: and so on…

a <-rnorm(10000,5,1)
hist(a, breaks = 100, col = "light blue", main = "Histograma de Frecuencia Aleatoria", xlab="Kg of Corn", ylab="density",family="mono", font.main=3)

Boxplots

boxplot(Colesterol, col ="gold", data=metabolico)

para relacionar usas ~

boxplot(glucosa~actividad, col =c("green", "red", "purple", "gold"), data=metabolico)

con colores distintos para cada Boxplot. los valores que se ponen en x en el boxplot debe ser categoricos (fctr), y en y (ord) continuos

boxplot(glucosa~sexo, col =c("gold", "cyan"), data=metabolico)

boxplot(glucosa~tabaquismo, col =c("grey","red"), data=metabolico)

Graficos de barra, xtra= la orientacion en xlabs se usa las = con diferentes valores

valores <- c(25,45,30,12,60)
nombres <-c("H","R", "E","J", "K")
barplot(valores,names.arg = nombres, col = c("red", "grey", "green", "yellow", "black"), border="gold", xlab="Personas", ylab="Glucosa m/ml", main="Glucosa de personas", las=3)

Tomorrow traer datos propios