Se nos está pidiendo que calculemos la media y mediana para las diferentes variables de la base de datos “acciones”. Una vez hagamos eso, compararemos los calculos realizados y comentaremos sobre ellos.
#Insertaremos la base de datos "acciones"
library(moments)
acciones <-read.csv("acciones.csv",sep=",")
head(acciones)
## Obs. X1 X2 X3
## 1 1 3.4 89.7 30.2
## 2 2 5.1 55.7 9.9
## 3 3 4.5 52.3 11.5
## 4 4 3.5 47.0 11.2
## 5 5 5.9 42.7 7.0
## 6 6 5.1 30.6 6.9
#Calcularemos la media y mediana de dicha base de datos
Medianas <- apply(acciones[,2:4],2,median)
Medias <- apply(acciones[, 2:4], 2, mean)
Tendencia <- rbind(Medias,Medianas)
round(Tendencia,2)
## X1 X2 X3
## Medias 9.42 69.53 9.10
## Medianas 7.05 61.45 7.35
La variable X1 y X3 aparentan tener valores muy similares,con la media y la mediana estando muy cerca entre las dos variables. Por otro lado la variable X2 aparenta tener una diferencia significativa con las otras variables esto pudiendo significar que la variable X2 tiene valores extremos (outliers) o una distribución asimétrica.Podemos llegar a esta conclusión ya que hay una diferencia notable entre la media (69.53) y la mediana (61.45) de la variable X2. La mediana sigue siendo una medida útil para variables como X2, donde los valores extremos afectan la media, mientras que la media sigue siendo una buena medida cuando no hay grandes outliers o si queremos conocer el valor promedio considerando todos los datos.
#Crear data
Indicadores <- data.frame(
x1 = c(2,1,2,3),
x2 = c(3,5,2,3),
x3 = c(-1,-2,1,1)
)
print(Indicadores)
## x1 x2 x3
## 1 2 3 -1
## 2 1 5 -2
## 3 2 2 1
## 4 3 3 1
#1. Medias
Medias <- apply(Indicadores[1:3],2,mean)
Medias
## x1 x2 x3
## 2.00 3.25 -0.25
La media de X1 nos dice que en promedio los indicadores de los cuatro paises es dos. Analizando los datos podemos ver que los numeros son cercanos, dandonos una media que es un entero, queriendo decir que no hay mucha variabilidad en estos datos (confirmaremos si es cierto cuando calculemos la desviación estandar). La media en el indicador X2 es 3.25, dándonos a entender que los valores de este indicador son un poco más altos que los de X1. X3 al ser una media negativa nos da a entender que los valores de X3 son en promedio negativos o por debajo de cero.
#2. Mediana
Medianas <- apply(Indicadores[1:3],2, median)
Medianas
## x1 x2 x3
## 2 3 0
El indicador X1 tiene una mediana igual a la media, lo que indica que la distribución es simétrica y los valores son cercanos.Utilizando la misma lógica, podemos decir que la media y la mediana del indicador X2 están muy cercanos. No obstante hay una ligera diferencia, significando que no es simétrica del todo y está un poco sesgada. El indicador X3, con una mediana de cero y una media negativa muestra que los valores están sesgados negatívamente.
#3. Distribución estandar
DS <- apply(Indicadores,2, sd)
DS
## x1 x2 x3
## 0.8164966 1.2583057 1.5000000
Con el indicador X1, confirmamos que los valores en el indicador son todos cercanos al tener una desviación estandar relatívamente baja. Nuevamente, vemos que la desviación de X2 es mayor que la de X1, dandonos a entender que existe una variabilidad en este indicador.Y en el indicador X3 al ser la desviación estandar más alta, podemos concluir que los valores en este indicador son los más dispersos comparados que los otros indicadores.
#4. Asimería
Asimetria <- apply(Indicadores, 2, skewness)
Asimetria
## x1 x2 x3
## 0.0000000 0.6520237 -0.2138334
El indicador X1 no tiene asimetría ya que se encuentra exactamente en cero. Por otro lado X2 y X3 si parecen tener cierto grado de asimetría, X2 siendo positivo por lo cual se sesga hacia la derecha y X3 siendo negativo por lo que se sesga hacia la izquierda.
#5. Curtosis
Curtosis <- apply(Indicadores,2,kurtosis)
Curtosis
## x1 x2 x3
## 2.000000 2.096953 1.279835
Los tres indicadores se encuentran por debajo de tres, dando a entender que las distribuciones tienen colas cortas y picos planos (en gráficas campanas).
#6. Coeficiente de varianza
CV <- DS/Medias
CV
## x1 x2 x3
## 0.4082483 0.3871710 -6.0000000
Aquí podemos observar como X1 y X2 tienen variabilidades moderadas mientras que X3 es una dispersión extrema en comparación con la media. Esto se debe a que la media de X3 es negativa y aparenta tener valores dispersos.
# Observemos los calculos descriptivos
Descriptivas <- rbind(Medias,Medianas,DS,Asimetria,Curtosis,CV)
round(Descriptivas,2)
## x1 x2 x3
## Medias 2.00 3.25 -0.25
## Medianas 2.00 3.00 0.00
## DS 0.82 1.26 1.50
## Asimetria 0.00 0.65 -0.21
## Curtosis 2.00 2.10 1.28
## CV 0.41 0.39 -6.00
#Dos nuevos indicadores Y1 y Y2
x1 <- c(2,1,2,3)
x2 <- c(3,5,2,3)
x3 <- c(-1,-2,1,1)
y1 <- (x1+x2+x3)/3
y2 <- x1-(x2+x3)/2
#Creamos vector
y <- cbind(y1,y2)
round(y,2)
## y1 y2
## [1,] 1.33 1.0
## [2,] 1.33 -0.5
## [3,] 1.67 0.5
## [4,] 2.33 1.0
yt <-t(round(y,2))
#Y1
Medias <- apply(y,2,mean)
Medias
## y1 y2
## 1.666667 0.500000
Mediana <- apply(y,2,median)
Mediana
## y1 y2
## 1.50 0.75
DS <- apply(y,2,sd)
DS
## y1 y2
## 0.4714045 0.7071068
Asimetria <- apply(y,2,skewness)
Asimetria
## y1 y2
## 0.8164966 -0.8164966
Curtosis <- apply(y,2,kurtosis)
Curtosis
## y1 y2
## 2 2
CV <- DS/Medias
CV
## y1 y2
## 0.2828427 1.4142136
Descriptivas <- rbind(Medias,Mediana,DS,Asimetria,Curtosis,CV)
round(Descriptivas,2)
## y1 y2
## Medias 1.67 0.50
## Mediana 1.50 0.75
## DS 0.47 0.71
## Asimetria 0.82 -0.82
## Curtosis 2.00 2.00
## CV 0.28 1.41