DRESCRIPCIÓN DE LA BASE DE DATOS DAVIS EN R

Autoinformes de altura y peso - Davis

El marco de datos esta compuesto por 200 filas y 5 columnas.Los sujetos eran hombres y mujeres que realizaban ejercicio regularmente. Hay algunos datos que faltan.

2. Identificación de variables

sexo - Un factor con niveles: F, Femenino; M, Masculino

peso - Peso medido en kg:

altura - Altura medida en cm:

Peso reportado - Peso informado en kg:

Altura reportada - Altura reportada en cm:

3. Caracterización del conjunto de datos (todas las variables o máximo 5 de ellas, entre cualitativas y cuantitativas)

Medidas de tendencia central:

library(carData)
attach(Davis)
MediaPeso=mean(weight,na.rm = T);
MediaAltura=mean(height,na.rm = T);
MediaPesoR=mean(repwt,na.rm = T);
MediaAlturaR=mean(repht,na.rm = T);

paste("La media es del peso:",MediaPeso)
## [1] "La media es del peso: 65.8"
paste("La media es del Altura:",MediaAltura)
## [1] "La media es del Altura: 170.02"
paste("La media es del Peso Repotado:",MediaPesoR)
## [1] "La media es del Peso Repotado: 65.6229508196721"
paste("La media es del Altura Repotada:",MediaAlturaR)
## [1] "La media es del Altura Repotada: 168.497267759563"

Medidas de variabilidad:

Rango

RangoPeso= max(weight,na.rm = T) - min(weight,na.rm = T);
RangoAltura= max(height,na.rm = T) - min(height,na.rm = T);
RangoPesoR= max(repwt,na.rm = T) - min(repwt,na.rm = T);
AlturaR= max(repht,na.rm = T) - min(repht,na.rm = T);

paste("El Rango del peso:",RangoPeso)
## [1] "El Rango del peso: 127"
paste("El Rango del MediaAltura:",RangoAltura)
## [1] "El Rango del MediaAltura: 140"
paste("El Rango del peso:",RangoPesoR)
## [1] "El Rango del peso: 83"
paste("El Rango del peso:",AlturaR)
## [1] "El Rango del peso: 52"

Varianza

PesoVar= round(var(weight,na.rm = T));
AlturaVar=round(var(height,na.rm = T));
PesoVarR=round(var(repwt,na.rm = T));
AlturaVarR=round(var(repht,na.rm = T));

paste("La varianza del peso:",PesoVar)
## [1] "La varianza del peso: 228"
paste("La varianza de la altura:",AlturaVar)
## [1] "La varianza de la altura: 144"
paste("La varianza del peso reportado:",PesoVarR)
## [1] "La varianza del peso reportado: 190"
paste("La varianza de la altura reportada:",AlturaVarR)
## [1] "La varianza de la altura reportada: 90"

Coeficiente de variación

CvPeso= (PesoVar/MediaPeso)*100;
CvAltura=(AlturaVar/MediaAltura)*100;
CvPesoR=(PesoVarR/MediaPesoR)*100;
CvAlturaR=(AlturaVarR/MediaAlturaR)*100;
paste("El coeficiente de variacion del peso :",CvPeso)
## [1] "El coeficiente de variacion del peso : 346.504559270517"
paste("El coeficiente de variacion del Altura :",CvAltura)
## [1] "El coeficiente de variacion del Altura : 84.6959181272791"
paste("El coeficiente de variacion del peso reportado :",CvPesoR)
## [1] "El coeficiente de variacion del peso reportado : 289.532850362228"
paste("El coeficiente de variacion del Altura reportado :",CvAlturaR)
## [1] "El coeficiente de variacion del Altura reportado : 53.4133290092427"

Medidas de colocación

cuartiles

Q<-c("Q0","Q1","Q2","Q3","Q4");
PesoQ=data.frame (quantile(weight,na.rm = T));
row.names(PesoQ)<-Q
names(PesoQ)<-c("Cuartiles Peso")
PesoQ
##    Cuartiles Peso
## Q0             39
## Q1             55
## Q2             63
## Q3             74
## Q4            166
AlturaQ=data.frame(quantile(height,na.rm = T));
row.names(AlturaQ)<-Q
names(AlturaQ)<-c("Cuartiles Altura");
AlturaQ
##    Cuartiles Altura
## Q0            57.00
## Q1           164.00
## Q2           169.50
## Q3           177.25
## Q4           197.00
PesoRQ= data.frame(quantile(repwt,na.rm = T));
row.names(PesoRQ)<-Q
names(PesoRQ)<-c("Cuartiles Peso Reportado");
PesoRQ
##    Cuartiles Peso Reportado
## Q0                     41.0
## Q1                     55.0
## Q2                     63.0
## Q3                     73.5
## Q4                    124.0
AlturaRQ=data.frame(quantile(repht,na.rm = T));
row.names(AlturaRQ)<-Q
names(AlturaRQ)<-c("Cuartiles Altura reportada");
AlturaRQ
##    Cuartiles Altura reportada
## Q0                      148.0
## Q1                      160.5
## Q2                      168.0
## Q3                      175.0
## Q4                      200.0

Medidas de forma y simetría:

coeficiente de asimetría

coefi=function(x) {
  expresion1=sum(((x-mean(x,na.rm = T))/sd(x,na.rm = T))^3,na.rm = T)
  n=length(x)
  expresion2=n/((n-1)*(n-2))
  skew=expresion1*expresion2
  skew}

PesoCA=coefi(weight)
AlturaCA=coefi(height)
PesoRRC=coefi(repwt)
AlturaRRC=coefi(repht)
paste("El coeficiente de asimetría de Peso :",PesoCA)
## [1] "El coeficiente de asimetría de Peso : 2.03745027988917"
paste("El coeficiente de asimetría de Altura  :",AlturaCA)
## [1] "El coeficiente de asimetría de Altura  : -4.06527728579398"
paste("El coeficiente de asimetría de Peso reportado:",PesoRRC)
## [1] "El coeficiente de asimetría de Peso reportado: 0.953835660647652"
paste("El coeficiente de asimetría de Altura Repotada:",AlturaRRC)
## [1] "El coeficiente de asimetría de Altura Repotada: 0.30282737299505"

Curtósis

Cur=function(x) {
  expresion1=sum(((x-mean(x,na.rm = T))/sd(x,na.rm = T))^4,na.rm = T)
  n=length(x)
  expresion2=(n*(n+1))/((n-1)*(n-2)*(n-3))
  expresion3=(3*(n-1)^2)/((n-2)*(n-3))
  curt=expresion1*expresion2-expresion3
  curt}

PesoK=Cur(weight)
AlturaK=Cur(height)
PesoRK=Cur(repwt)
AlturaRK=coefi(repht)

paste("La Curtósis de Peso :",PesoK)
## [1] "La Curtósis de Peso : 9.34706662034831"
paste("La Curtósis de Altura  :",AlturaK)
## [1] "La Curtósis de Altura  : 38.4554665353331"
paste("La Curtósis de Peso reportado:",PesoRK)
## [1] "La Curtósis de Peso reportado: 1.0565997884328"
paste("La Curtósis de Altura Repotada:",AlturaRK)
## [1] "La Curtósis de Altura Repotada: 0.30282737299505"

4.Representación del conjunto de datos según el tipo de variable

Diagrama de densidad de las variables weight,height,repwt

pesoDensity <-density(weight,na.rm = T)
alturaDensity <-density(height,na.rm = T)
pesorDensity <-density(repwt,na.rm = T)
alturarDensity <-density(repht,na.rm = T)
par(mfrow = c(2, 2));
plot(pesoDensity,main="Grafica de densidad \n de la variable Peso ",
     col="yellow",lwd=3,  col.main = "#5e00bb", col.lab = "red3" )

plot(alturaDensity,main="Grafica de densidad densidad \n de la variable Altura",
     col="blue",lwd=3,  col.main = "#6eba59", col.lab = "red3" )

plot(pesorDensity,main="Grafica de densidad \n de la variable Peso Reportado",
     col="Red",lwd=3,  col.main = "#2c349e", col.lab = "red3" )

plot(alturarDensity,main="Grafica de densidad \nde la variable Altura Reportada",
     col="Black",lwd=3,  col.main = "#b89f3b", col.lab = "red3" )

Diagrama circular

library(RColorBrewer)
genero=table(sex);genero
## sex
##   F   M 
## 112  88
Gen<-c("Fenino","Masculino")
porcentaje<-paste0(Gen, "(",round(genero/sum(genero)*100),"%",")")
colr <- brewer.pal(length(genero),"Accent")
## Warning in brewer.pal(length(genero), "Accent"): minimal value for n is 3, returning requested palette with 3 different levels
pie(genero, labels = porcentaje,col = colr,main ="Grafica circular \n de Genero " )

Diagrama de dispersión

Peso=c(weight,na.rm = T);
Altura=c(height,na.rm = T);
PesoR=c(repwt,na.rm = T);
AlturaR=c(repht,na.rm = T);
par(mfrow = c(1, 2));
plot(Peso,
     PesoR,
     xlab="Peso",
     ylab="Peso Reportado",
     main="Gráfico de Dispersión entre \n peso y peso reportado" ,
     col="#32e698",
     lwd=1,
     xlim=c(0,200),
     ylim=c(0,200))

plot(Altura,
     AlturaR,
     xlab="Altura",
     ylab="Altura Reportado",
     main="Gráfico de Dispersión entre \n Altura y Altura Reportad" ,
     col="#f5369f",
     lwd=1,
     xlim=c(0,200),
     ylim=c(0,200))

Histograma

#library(AER)
par(mfrow = c(2, 2));
P<-c(weight,na.rm = T)
A<-c(height,na.rm = T)
Pr<-c(repwt,na.rm = T)
Ar<-c(repht,na.rm = T)
hist(P, main="Histograma \n de la variable Peso",col = c("blue", "#301994", "gray", "green"))
hist(A, main="Histograma \n  de la variable Altura",col = c("blue", "red", "gray", "green"))
hist(Pr, main="Histograma \n de la variable Peso reportado",col = c("blue", "red", "gray", "green"))
hist(Ar, main="Histograma \n  de la variable altura reportada",col = c("blue", "red", "gray", "#301994"))

CONCLUCIONES

1. Las grafica de la densidad de las variables Peso,altura y peso reportado son Leptocúrtica.

2.Las grafica de la densidad de la variable Altura Repotada que es Platicúrtica.

3. De la Diagrama circular se puede inferir que hubieron mas mujeres que hombres en la informaicon recolectada.

4. El histograma de la variable Peso tiene el sesgo a la derecha.

4. El histograma de la variable Altura tiene el sesgo a la izquierda.

5. El histograma de la variable Peso reportado tiene el sesgo a la izquierda.

6. El histograma de la variable altura reportada tiene el sesgo a la izquierda.