| Cargue de archivo plano y librerías |
setwd("C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller/")
getwd()
## [1] "C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller"
df <- read.csv("Gr1.csv", sep=",")
dfII <- read.csv("Gr2.csv", sep=",")
library(knitr)
library(kableExtra)
library(ggplot2)
library(moments)
Representar la variable Grupo Sanguíneo mediante un diagrama de sectores en cada uno de los grupos. Incluir un título descriptivo en cada gráfico y colorear los sectores de azul, amarillo, rosa y verde.
grIGS <- as.data.frame(table(df$Grupo.Sanguineo))
grIIGS <- as.data.frame(table(dfII$Grupo.Sanguineo))
grIpie <- ggplot(grIGS, aes(x="", y=Freq, fill=Var1))+
geom_bar(width = 1, stat = "identity")+
coord_polar("y", start=0)+
scale_fill_manual(values=c("#1D17BC", "#F6C02F", "#E84D8B", "#008140"))+
theme_minimal() +
guides(fill = guide_legend(title = "Grupo Sanguineo"))+
theme(legend.position = "bottom") +
geom_label(aes(label = Freq),
color = "white",
position = position_stack(vjust = 0.3),
show.legend = FALSE)+
ggtitle("Gr1 - Distribucion Grupos Sanguineos")
grIpie
grIIpie <- ggplot(grIIGS, aes(x="", y=Freq, fill=Var1))+
geom_bar(width = 1, stat = "identity")+
coord_polar("y", start=0)+
scale_fill_manual(values=c("#1D17BC", "#F6C02F", "#E84D8B", "#008140"))+
theme_minimal() +
guides(fill = guide_legend(title = "Grupo Sanguineo"))+
theme(legend.position = "bottom") +
geom_label(aes(label = Freq),
color = "white",
position = position_stack(vjust = 0.3),
show.legend = FALSE)+
ggtitle("Gr2 - Distribucion Grupos Sanguineos")
grIIpie
Representar la variable Estatura mediante un histograma en cada uno de los grupos.
hist(df$Estatura,col = heat.colors(6), main = "Gr1 - Histograma de estatura")
hist(dfII$Estatura,col = heat.colors(6), main = "Gr2 - Histograma de estatura")
¿Existe algún dato atípico en la variable Edad en el grupo A? ¿Y en el grupo B?
Rta, se genera un boxplot por cada Variable para evidenciar algún dato atípico representados por circunferencias:
boxplot(df$Estatura, horizontal = T, notch = T, col = "bisque", range = 0.5, main = "Gr1 - Boxplot de estatura")
## Warning in (function (z, notch = FALSE, width = NULL, varwidth = FALSE, : some
## notches went outside hinges ('box'): maybe set notch=FALSE
boxplot(dfII$Estatura,horizontal = T, notch = T, col = "bisque", range = 0.5, main = "Gr2 - Boxplot de estatura")
¿Cuál es el valor máximo del 40% de las estaturas más pequeñas de los individuos en el grupo A?
dfna <- na.omit(df)
dfest <- max(subset(dfna$Estatura,dfna$Estatura <= quantile(dfna$Estatura,.40)))
dfest
## [1] 1.78
¿Y el valor mínimo del 30% de las estaturas mayores de los individuos en el grupo B?
dfIIna <- na.omit(dfII)
dfIIest <- min(subset(dfIIna$Estatura,dfIIna$Estatura >= quantile(dfIIna$Estatura,.70)))
dfIIest
## [1] 1.79
¿Dónde son las variables edad y estatura más homogéneas: en el grupo A o en el B?
operation <- c("Gr1 - Desviacion Estandar Estatura","Gr2 - Desviacion Estandar Estatura","Gr1 - Desviacion Estandar Edad","Gr2 - Desviacion Estandar Edad")
result <- c(sd(dfna$Estatura),sd(dfIIna$Estatura),sd(dfna$Edad),sd(dfIIna$Edad));
ind <- data.frame(operation,result)
ind %>%
kbl(caption = "Verificacion de homogeneidad de los grupos") %>%
kable_minimal(full_width = F, position = "left");
| operation | result |
|---|---|
| Gr1 - Desviacion Estandar Estatura | 0.0619429 |
| Gr2 - Desviacion Estandar Estatura | 0.0538213 |
| Gr1 - Desviacion Estandar Edad | 3.5558109 |
| Gr2 - Desviacion Estandar Edad | 5.1245915 |
Segun estos resulados el Grupo numero 2 tiene una menor variacion teniendo en cuenta toda la muestra por lo cual se determina que este grupo es el que posee mayor homogeneidad entre las estaturas.
Segun estos resulados el Grupo numero 1 tiene una menor variacion teniendo en cuenta toda la muestra por lo cual se determina que este grupo es el que posee mayor homogeneidad entre las Edades
¿En qué grupo presentan los individuos una altura media mayor? ¿En qué grupo presentan los individuos una altura mediana menor? —
summary(dfna) %>%
kbl(caption = "Gr 1 - Resumen Descriptivo") %>%
kable_minimal(full_width = F, position = "left");
| Sexo | Edad | Estatura | Grupo.Sanguineo | |
|---|---|---|---|---|
| Length:18 | Min. :20.00 | Min. :1.650 | Length:18 | |
| Class :character | 1st Qu.:22.00 | 1st Qu.:1.755 | Class :character | |
| Mode :character | Median :22.00 | Median :1.790 | Mode :character | |
| NA | Mean :23.94 | Mean :1.776 | NA | |
| NA | 3rd Qu.:27.25 | 3rd Qu.:1.800 | NA | |
| NA | Max. :30.00 | Max. :1.900 | NA |
summary(dfIIna) %>%
kbl(caption = "Gr 2 - Resumen Descriptivo") %>%
kable_minimal(full_width = F, position = "left");
| Sexo | Edad | Estatura | Grupo.Sanguineo | |
|---|---|---|---|---|
| Length:18 | Min. :22.00 | Min. :1.660 | Length:18 | |
| Class :character | 1st Qu.:25.00 | 1st Qu.:1.755 | Class :character | |
| Mode :character | Median :28.50 | Median :1.790 | Mode :character | |
| NA | Mean :28.44 | Mean :1.786 | NA | |
| NA | 3rd Qu.:31.50 | 3rd Qu.:1.820 | NA | |
| NA | Max. :39.00 | Max. :1.900 | NA |
Media Mayor: Grupo 2 (1.786)
Mediana Menor: Iguales.
Estudia la asimetría y la curtosis de la variable Estatura en el grupo A.
operation <- c("Asimetria Gr1","Curtosis Gr2")
result <- c(skewness(dfna$Estatura),kurtosis(dfna$Estatura));
ind <- data.frame(operation,result)
ind %>%
kbl(caption = "Resultados asimetría y curtosis") %>%
kable_minimal(full_width = F, position = "left");
| operation | result |
|---|---|
| Asimetria Gr1 | -0.5029718 |
| Curtosis Gr2 | 3.1812205 |
Con el estudio de estas dos muestras podemos concluir que
Gracias.