Cargue de archivo plano y librerías
setwd("C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller/")
getwd()
## [1] "C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller"
df <- read.csv("Gr1.csv", sep=",")
dfII <- read.csv("Gr2.csv", sep=",")

library(knitr)
library(kableExtra)
library(ggplot2)
library(moments)

Punto 1.

Representar la variable Grupo Sanguíneo mediante un diagrama de sectores en cada uno de los grupos. Incluir un título descriptivo en cada gráfico y colorear los sectores de azul, amarillo, rosa y verde.

grIGS <- as.data.frame(table(df$Grupo.Sanguineo))
grIIGS <- as.data.frame(table(dfII$Grupo.Sanguineo))

grIpie <- ggplot(grIGS, aes(x="", y=Freq, fill=Var1))+
  geom_bar(width = 1, stat = "identity")+ 
  coord_polar("y", start=0)+
  scale_fill_manual(values=c("#1D17BC", "#F6C02F", "#E84D8B", "#008140"))+
  theme_minimal() +
  guides(fill = guide_legend(title = "Grupo Sanguineo"))+
  theme(legend.position = "bottom") +
  geom_label(aes(label = Freq),
             color = "white",
             position = position_stack(vjust = 0.3),
             show.legend = FALSE)+
  ggtitle("Gr1 - Distribucion Grupos Sanguineos")

grIpie

grIIpie <- ggplot(grIIGS, aes(x="", y=Freq, fill=Var1))+
  geom_bar(width = 1, stat = "identity")+ 
  coord_polar("y", start=0)+
  scale_fill_manual(values=c("#1D17BC", "#F6C02F", "#E84D8B", "#008140"))+
  theme_minimal() +
  guides(fill = guide_legend(title = "Grupo Sanguineo"))+
  theme(legend.position = "bottom") +
  geom_label(aes(label = Freq),
             color = "white",
             position = position_stack(vjust = 0.3),
             show.legend = FALSE)+
  ggtitle("Gr2 - Distribucion Grupos Sanguineos")
grIIpie

Punto 2.

Representar la variable Estatura mediante un histograma en cada uno de los grupos.

hist(df$Estatura,col = heat.colors(6), main =  "Gr1 - Histograma de estatura")
hist(dfII$Estatura,col = heat.colors(6), main =  "Gr2 - Histograma de estatura")

Punto 3.

¿Existe algún dato atípico en la variable Edad en el grupo A? ¿Y en el grupo B?

Rta, se genera un boxplot por cada Variable para evidenciar algún dato atípico representados por circunferencias:

boxplot(df$Estatura, horizontal = T, notch = T, col = "bisque", range = 0.5, main =  "Gr1 - Boxplot de estatura")
## Warning in (function (z, notch = FALSE, width = NULL, varwidth = FALSE, : some
## notches went outside hinges ('box'): maybe set notch=FALSE
boxplot(dfII$Estatura,horizontal = T, notch = T, col = "bisque", range = 0.5, main =  "Gr2 - Boxplot de estatura")

Punto 4.

¿Cuál es el valor máximo del 40% de las estaturas más pequeñas de los individuos en el grupo A?

dfna <- na.omit(df)
dfest <- max(subset(dfna$Estatura,dfna$Estatura <= quantile(dfna$Estatura,.40)))
dfest
## [1] 1.78

¿Y el valor mínimo del 30% de las estaturas mayores de los individuos en el grupo B?

dfIIna <- na.omit(dfII)
dfIIest <- min(subset(dfIIna$Estatura,dfIIna$Estatura >= quantile(dfIIna$Estatura,.70)))
dfIIest
## [1] 1.79

Punto 5.

¿Dónde son las variables edad y estatura más homogéneas: en el grupo A o en el B?

operation <- c("Gr1 - Desviacion Estandar Estatura","Gr2 - Desviacion Estandar Estatura","Gr1 - Desviacion Estandar Edad","Gr2 - Desviacion Estandar Edad")
result <- c(sd(dfna$Estatura),sd(dfIIna$Estatura),sd(dfna$Edad),sd(dfIIna$Edad));

ind <- data.frame(operation,result)

ind %>%
  kbl(caption  =  "Verificacion de homogeneidad de los grupos") %>%
  kable_minimal(full_width = F, position = "left");
Verificacion de homogeneidad de los grupos
operation result
Gr1 - Desviacion Estandar Estatura 0.0619429
Gr2 - Desviacion Estandar Estatura 0.0538213
Gr1 - Desviacion Estandar Edad 3.5558109
Gr2 - Desviacion Estandar Edad 5.1245915

Respuesta:

Segun estos resulados el Grupo numero 2 tiene una menor variacion teniendo en cuenta toda la muestra por lo cual se determina que este grupo es el que posee mayor homogeneidad entre las estaturas.

Segun estos resulados el Grupo numero 1 tiene una menor variacion teniendo en cuenta toda la muestra por lo cual se determina que este grupo es el que posee mayor homogeneidad entre las Edades

Punto 6.

¿En qué grupo presentan los individuos una altura media mayor? ¿En qué grupo presentan los individuos una altura mediana menor? —

summary(dfna) %>%
  kbl(caption  =  "Gr 1 - Resumen Descriptivo") %>%
  kable_minimal(full_width = F, position = "left");
Gr 1 - Resumen Descriptivo
Sexo Edad Estatura Grupo.Sanguineo
Length:18 Min. :20.00 Min. :1.650 Length:18
Class :character 1st Qu.:22.00 1st Qu.:1.755 Class :character
Mode :character Median :22.00 Median :1.790 Mode :character
NA Mean :23.94 Mean :1.776 NA
NA 3rd Qu.:27.25 3rd Qu.:1.800 NA
NA Max. :30.00 Max. :1.900 NA
summary(dfIIna) %>%
  kbl(caption  =  "Gr 2 - Resumen Descriptivo") %>%
  kable_minimal(full_width = F, position = "left");
Gr 2 - Resumen Descriptivo
Sexo Edad Estatura Grupo.Sanguineo
Length:18 Min. :22.00 Min. :1.660 Length:18
Class :character 1st Qu.:25.00 1st Qu.:1.755 Class :character
Mode :character Median :28.50 Median :1.790 Mode :character
NA Mean :28.44 Mean :1.786 NA
NA 3rd Qu.:31.50 3rd Qu.:1.820 NA
NA Max. :39.00 Max. :1.900 NA

Respuesta:

Media Mayor: Grupo 2 (1.786)

Mediana Menor: Iguales.

Punto 7.

Estudia la asimetría y la curtosis de la variable Estatura en el grupo A.

operation <- c("Asimetria Gr1","Curtosis Gr2")
result <- c(skewness(dfna$Estatura),kurtosis(dfna$Estatura));

ind <- data.frame(operation,result)

ind %>%
  kbl(caption  =  "Resultados asimetría y curtosis") %>%
  kable_minimal(full_width = F, position = "left");
Resultados asimetría y curtosis
operation result
Asimetria Gr1 -0.5029718
Curtosis Gr2 3.1812205

Conclusion:

Con el estudio de estas dos muestras podemos concluir que

Gracias.