Estadistica Descriptiva
Sample es una funcion que muestra aleatoreamente de una seccion de numeros, Replace va a repetir de los mismos numeros
sample(25:75, n, replace = TRUE)
## [1] 63 56 58 64 36 72 54 53 40 60 55 28 44 47 46 74 68 39 42 55 46 57 75 65 58
## [26] 66 44 56 43 45 46 54 49 61 44 34 62 41 48 26 70 29 73 43 66 53 30 72 43 61
## [51] 72 69 56 26 37 75 72 66 37 37
#otro
sample(1:6,3)
## [1] 3 2 4
rm(n)
metabolico
## id edad sexo glucosa colesterol sistolica imc tabaquismo actividad
## 1 1 26 Femenino 113.1 227.2 140 20.0 FALSE Leve
## 2 2 61 Femenino 100.3 223.2 133 24.0 TRUE Moderado
## 3 3 69 Femenino 106.2 151.4 99 23.7 FALSE Sedentario
## 4 4 41 Femenino 158.8 192.8 132 30.0 FALSE Sedentario
## 5 5 69 Femenino 95.2 183.7 139 31.8 FALSE Moderado
## 6 6 56 Masculino 101.8 171.8 127 30.9 FALSE Intenso
## 7 7 65 Femenino 105.1 89.2 132 25.7 FALSE Leve
## 8 8 58 Masculino 89.8 133.6 147 21.7 TRUE Leve
## 9 9 53 Femenino 104.8 214.3 91 27.0 FALSE Sedentario
## 10 10 35 Femenino 63.7 199.9 130 26.4 TRUE Sedentario
## 11 11 40 Masculino 88.7 159.3 96 33.8 TRUE Leve
## 12 12 53 Masculino 122.6 277.9 106 31.1 FALSE Moderado
## 13 13 38 Masculino 88.8 138.9 116 32.4 TRUE Moderado
## 14 14 58 Masculino 124.7 132.0 133 32.3 FALSE Sedentario
## 15 15 50 Femenino 114.2 188.7 121 31.3 FALSE Moderado
## 16 16 68 Masculino 102.3 147.1 130 26.4 FALSE Leve
## 17 17 74 Femenino 119.3 277.9 119 24.7 FALSE Moderado
## 18 18 50 Masculino 125.9 200.4 108 18.8 TRUE Leve
## 19 19 56 Femenino 115.0 198.2 105 26.7 TRUE Leve
## 20 20 45 Masculino 60.5 178.9 143 32.3 FALSE Sedentario
## 21 21 25 Masculino 112.0 276.1 145 20.7 FALSE Leve
## 22 22 35 Femenino 137.3 124.8 136 32.0 FALSE Intenso
## 23 23 59 Masculino 121.1 232.8 144 22.5 FALSE Sedentario
## 24 24 65 Femenino 158.4 216.0 163 27.1 TRUE Sedentario
## 25 25 70 Masculino 121.1 180.7 97 35.4 FALSE Leve
## 26 26 41 Femenino 85.1 216.3 127 31.5 TRUE Moderado
## 27 27 52 Masculino 69.4 158.5 136 35.4 TRUE Sedentario
## 28 28 72 Femenino 80.0 204.7 120 29.8 FALSE Sedentario
## 29 29 48 Femenino 73.8 212.2 123 28.1 TRUE Moderado
## 30 30 44 Femenino 107.0 141.5 139 24.0 FALSE Intenso
## 31 31 52 Masculino 135.5 201.7 120 32.3 FALSE Leve
## 32 32 44 Femenino 70.5 229.4 99 28.5 TRUE Sedentario
## 33 33 67 Masculino 84.5 169.1 166 18.7 TRUE Sedentario
## 34 34 44 Masculino 72.3 177.7 140 24.8 FALSE Leve
## 35 35 47 Femenino 103.3 133.5 161 27.6 FALSE Leve
## 36 36 66 Femenino 127.7 284.7 116 27.5 TRUE Moderado
## 37 37 28 Masculino 132.8 128.7 161 29.2 FALSE Moderado
## 38 38 31 Masculino 106.1 206.2 112 28.9 FALSE Sedentario
## 39 39 40 Femenino 105.5 244.2 129 21.4 FALSE Leve
## 40 40 44 Femenino 125.3 181.9 148 28.8 FALSE Sedentario
## 41 41 27 Femenino 86.8 259.5 147 27.6 FALSE Leve
## 42 42 49 Masculino 110.9 158.8 126 33.5 FALSE Leve
## 43 43 58 Femenino 107.8 268.4 123 27.8 TRUE Leve
## 44 44 49 Masculino 130.0 214.4 112 30.9 FALSE Leve
## 45 45 73 Femenino 142.9 195.6 144 31.9 TRUE Sedentario
## 46 46 50 Masculino 107.0 241.4 123 27.6 TRUE Moderado
## 47 47 73 Femenino 89.7 243.2 105 28.8 FALSE Sedentario
## 48 48 27 Masculino 96.7 201.9 136 20.4 FALSE Intenso
## 49 49 49 Masculino 137.6 245.7 114 22.4 TRUE Sedentario
## 50 50 25 Masculino 86.5 181.9 121 31.1 FALSE Sedentario
## 51 51 30 Masculino 138.6 180.6 133 28.2 FALSE Leve
## 52 52 44 Femenino 72.9 195.3 138 16.4 FALSE Moderado
## 53 53 33 Femenino 103.3 194.8 113 25.4 TRUE Sedentario
## 54 54 39 Femenino 86.7 220.7 118 22.7 TRUE Sedentario
## 55 55 37 Femenino 245.0 163.1 117 31.2 FALSE Intenso
## 56 56 40 Masculino 267.0 312.0 129 18.0 FALSE Intenso
## 57 57 67 Masculino NA 328.0 89 52.1 FALSE Sedentario
## 58 58 58 Masculino NA NA 195 54.3 FALSE Sedentario
## 59 59 73 Femenino NA NA 198 NA FALSE Leve
## 60 60 75 Femenino 18.0 NA NA NA FALSE Moderado
glucosa<- metabolico$glucosa
mediaG<- mean(glucosa, na.rm=T)
sdG <-sd(glucosa, na.rm=T)
print(round(mediaG))
## [1] 110
print(round(sdG))
## [1] 38
#Practica hacer lo de arriba pero con colesterol
Colesterol <-metabolico$colesterol
Colesterol
## [1] 227.2 223.2 151.4 192.8 183.7 171.8 89.2 133.6 214.3 199.9 159.3 277.9
## [13] 138.9 132.0 188.7 147.1 277.9 200.4 198.2 178.9 276.1 124.8 232.8 216.0
## [25] 180.7 216.3 158.5 204.7 212.2 141.5 201.7 229.4 169.1 177.7 133.5 284.7
## [37] 128.7 206.2 244.2 181.9 259.5 158.8 268.4 214.4 195.6 241.4 243.2 201.9
## [49] 245.7 181.9 180.6 195.3 194.8 220.7 163.1 312.0 328.0 NA NA NA
medC<-mean(Colesterol, na.rm = T)
sdC <-sd(Colesterol, na.rm=T)
print(round(mediaG),2)
## [1] 110
print(round(sdC),2)
## [1] 49
Se usa el summary para una estadistica descriptiva
summary(metabolico)
## id edad sexo glucosa colesterol
## Min. : 1.00 Min. :25.00 Femenino :32 Min. : 18.0 Min. : 89.2
## 1st Qu.:15.75 1st Qu.:40.00 Masculino:28 1st Qu.: 88.7 1st Qu.:169.1
## Median :30.50 Median :49.50 Median :106.1 Median :198.2
## Mean :30.50 Mean :50.25 Mean :109.8 Mean :200.2
## 3rd Qu.:45.25 3rd Qu.:62.00 3rd Qu.:124.7 3rd Qu.:227.2
## Max. :60.00 Max. :75.00 Max. :267.0 Max. :328.0
## NA's :3 NA's :3
## sistolica imc tabaquismo actividad
## Min. : 89.0 Min. :16.40 Mode :logical Sedentario:22
## 1st Qu.:116.0 1st Qu.:24.18 FALSE:40 Leve :19
## Median :129.0 Median :27.95 TRUE :20 Moderado :13
## Mean :129.0 Mean :28.20 Intenso : 6
## 3rd Qu.:139.5 3rd Qu.:31.27
## Max. :198.0 Max. :54.30
## NA's :1 NA's :2
Varianza el cuadrado de la sd
var(glucosa, na.rm=T)
## [1] 1444.093
Funcion de Quantiles, trabaja con los Quarts y tambien elimina los datos no disponibles
quantile(glucosa,
probs = c(0.05, 0.10, 0.25, 0.50, 0.75, 0.90, 0.95), #Se usan con por sentaje eg 5/100
na.rm = TRUE)
## 5% 10% 25% 50% 75% 90% 95%
## 68.26 72.66 88.70 106.10 124.70 138.00 158.48
NA remove
IQR(glucosa, na.rm = TRUE) # Rango intercuartÃlico = Q3 - Q1
## [1] 36
summary segun lo que uno quiere
summary(metabolico[, c("edad","glucosa","colesterol","sistolica","imc")])
## edad glucosa colesterol sistolica
## Min. :25.00 Min. : 18.0 Min. : 89.2 Min. : 89.0
## 1st Qu.:40.00 1st Qu.: 88.7 1st Qu.:169.1 1st Qu.:116.0
## Median :49.50 Median :106.1 Median :198.2 Median :129.0
## Mean :50.25 Mean :109.8 Mean :200.2 Mean :129.0
## 3rd Qu.:62.00 3rd Qu.:124.7 3rd Qu.:227.2 3rd Qu.:139.5
## Max. :75.00 Max. :267.0 Max. :328.0 Max. :198.0
## NA's :3 NA's :3 NA's :1
## imc
## Min. :16.40
## 1st Qu.:24.18
## Median :27.95
## Mean :28.20
## 3rd Qu.:31.27
## Max. :54.30
## NA's :2
Tabla de frecuencias de actividada eg
table(metabolico$actividad) # frecuencias absolutas
##
## Sedentario Leve Moderado Intenso
## 22 19 13 6
round(prop.table(table(metabolico$actividad))*100, 1) # frecuencias relativas
##
## Sedentario Leve Moderado Intenso
## 36.7 31.7 21.7 10.0
Generacion de valores usando el comando seq de sequencia
x <- seq(0,10,0.1)
y <-sin(3*x) #calculando el seno de x multiplicado por 3
plot(x, y, col= "blue", bg= "grey", xlab="Time in s", ylab = "sen(t)", main = "Funcion seno(t) vs t")
lines(x,y)
otro valor personalizacion #pch es el tipo de puntos y cex es para el tamano de los puntos, cex.main y cex.axis para los parametros, abline traza una linea en un punto especifico
x <- seq(0,10,0.5)
x2 <-seq(0.10,0.1)
y <-sin(x) #calculando el seno de x multiplicado por 3
y2<-sin(x2)
plot(x, y, col= "brown", bg= "grey", xlab="Time in s", ylab = "sen(t)", main = "Funcion seno(t) vs t", pch=90, cex=1, cex.main= 1.5, cex.axis=0.7, cex.lab=0.7)
lines(x,y, col= "000100", lty=10)
abline(v=6, lty=3, col="red")
abline(h=-0.3, lty=34, col="gold")
Hasta aqui el profesor publico como prueba es facil de accder por link
https://rpubs.com/pgBeermann/1409009
Histogramas variables continuas con numeros aleatorios normal. rnorm genera numeros aleatorios con normalidad
a <-rnorm(1000,5,1)
hist(a, breaks = 50)
ahora con 10000, font.main tiene 4 tipos 1: negrita, 2: and so on…
a <-rnorm(10000,5,1)
hist(a, breaks = 100, col = "light blue", main = "Histograma de Frecuencia Aleatoria", xlab="Kg of Corn", ylab="density",family="mono", font.main=3)
Boxplots
boxplot(Colesterol, col ="gold", data=metabolico)
para relacionar usas ~
boxplot(glucosa~actividad, col =c("green", "red", "purple", "gold"), data=metabolico)
con colores distintos para cada Boxplot. los valores que se ponen en x en el boxplot debe ser categoricos (fctr), y en y (ord) continuos
boxplot(glucosa~sexo, col =c("gold", "cyan"), data=metabolico)
boxplot(glucosa~tabaquismo, col =c("grey","red"), data=metabolico)
Graficos de barra, xtra= la orientacion en xlabs se usa las = con diferentes valores
valores <- c(25,45,30,12,60)
nombres <-c("H","R", "E","J", "K")
barplot(valores,names.arg = nombres, col = c("red", "grey", "green", "yellow", "black"), border="gold", xlab="Personas", ylab="Glucosa m/ml", main="Glucosa de personas", las=3)
Tomorrow traer datos propios