1.Calcula el vector de medias y de medianas para las tres variables de la base de datos acciones . Compara sus ventajas como medidas de centralización de estas variables.

Se nos está pidiendo que calculemos la media y mediana para las diferentes variables de la base de datos “acciones”. Una vez hagamos eso, compararemos los calculos realizados y comentaremos sobre ellos.

#Insertaremos la base de datos "acciones"

library(moments)

acciones <-read.csv("acciones.csv",sep=",")
head(acciones)
##   Obs.  X1   X2   X3
## 1    1 3.4 89.7 30.2
## 2    2 5.1 55.7  9.9
## 3    3 4.5 52.3 11.5
## 4    4 3.5 47.0 11.2
## 5    5 5.9 42.7  7.0
## 6    6 5.1 30.6  6.9
#Calcularemos la media y mediana de dicha base de datos

Medianas <-  apply(acciones[,2:4],2,median)
Medias   <- apply(acciones[, 2:4], 2, mean)
Tendencia <- rbind(Medias,Medianas)
round(Tendencia,2)
##            X1    X2   X3
## Medias   9.42 69.53 9.10
## Medianas 7.05 61.45 7.35

Comparación

La variable X1 y X3 aparentan tener valores muy similares,con la media y la mediana estando muy cerca entre las dos variables. Por otro lado la variable X2 aparenta tener una diferencia significativa con las otras variables esto pudiendo significar que la variable X2 tiene valores extremos (outliers) o una distribución asimétrica.Podemos llegar a esta conclusión ya que hay una diferencia notable entre la media (69.53) y la mediana (61.45) de la variable X2. La mediana sigue siendo una medida útil para variables como X2, donde los valores extremos afectan la media, mientras que la media sigue siendo una buena medida cuando no hay grandes outliers o si queremos conocer el valor promedio considerando todos los datos.

2. Se dispone de 3 indicadores económicos x1,x2,x3, que se miden en cuatro países, con los resultados siguientes. Calcula todas las medidas descriptivas vistas y comenta sobre ellas:

#Crear data

Indicadores <- data.frame(
  
  x1 = c(2,1,2,3),
  x2 = c(3,5,2,3),
  x3 = c(-1,-2,1,1)
)

print(Indicadores)
##   x1 x2 x3
## 1  2  3 -1
## 2  1  5 -2
## 3  2  2  1
## 4  3  3  1
#1. Medias

Medias <- apply(Indicadores[1:3],2,mean)
Medias
##    x1    x2    x3 
##  2.00  3.25 -0.25

La media de X1 nos dice que en promedio los indicadores de los cuatro paises es dos. Analizando los datos podemos ver que los numeros son cercanos, dandonos una media que es un entero, queriendo decir que no hay mucha variabilidad en estos datos (confirmaremos si es cierto cuando calculemos la desviación estandar). La media en el indicador X2 es 3.25, dándonos a entender que los valores de este indicador son un poco más altos que los de X1. X3 al ser una media negativa nos da a entender que los valores de X3 son en promedio negativos o por debajo de cero.

#2. Mediana

Medianas <- apply(Indicadores[1:3],2, median)
Medianas
## x1 x2 x3 
##  2  3  0

El indicador X1 tiene una mediana igual a la media, lo que indica que la distribución es simétrica y los valores son cercanos.Utilizando la misma lógica, podemos decir que la media y la mediana del indicador X2 están muy cercanos. No obstante hay una ligera diferencia, significando que no es simétrica del todo y está un poco sesgada. El indicador X3, con una mediana de cero y una media negativa muestra que los valores están sesgados negatívamente.

#3. Distribución estandar

DS <- apply(Indicadores,2, sd)
DS
##        x1        x2        x3 
## 0.8164966 1.2583057 1.5000000

Con el indicador X1, confirmamos que los valores en el indicador son todos cercanos al tener una desviación estandar relatívamente baja. Nuevamente, vemos que la desviación de X2 es mayor que la de X1, dandonos a entender que existe una variabilidad en este indicador.Y en el indicador X3 al ser la desviación estandar más alta, podemos concluir que los valores en este indicador son los más dispersos comparados que los otros indicadores.

#4. Asimería

Asimetria <- apply(Indicadores, 2, skewness)
Asimetria
##         x1         x2         x3 
##  0.0000000  0.6520237 -0.2138334

El indicador X1 no tiene asimetría ya que se encuentra exactamente en cero. Por otro lado X2 y X3 si parecen tener cierto grado de asimetría, X2 siendo positivo por lo cual se sesga hacia la derecha y X3 siendo negativo por lo que se sesga hacia la izquierda.

#5. Curtosis

Curtosis <- apply(Indicadores,2,kurtosis)
Curtosis
##       x1       x2       x3 
## 2.000000 2.096953 1.279835

Los tres indicadores se encuentran por debajo de tres, dando a entender que las distribuciones tienen colas cortas y picos planos (en gráficas campanas).

#6. Coeficiente de varianza

CV <- DS/Medias
CV
##         x1         x2         x3 
##  0.4082483  0.3871710 -6.0000000

Aquí podemos observar como X1 y X2 tienen variabilidades moderadas mientras que X3 es una dispersión extrema en comparación con la media. Esto se debe a que la media de X3 es negativa y aparenta tener valores dispersos.

# Observemos los calculos descriptivos 

Descriptivas <- rbind(Medias,Medianas,DS,Asimetria,Curtosis,CV)
round(Descriptivas,2)
##             x1   x2    x3
## Medias    2.00 3.25 -0.25
## Medianas  2.00 3.00  0.00
## DS        0.82 1.26  1.50
## Asimetria 0.00 0.65 -0.21
## Curtosis  2.00 2.10  1.28
## CV        0.41 0.39 -6.00

3. A partir de los tres indicadores económicos anteriores x1, x2, x3, se construyen dos nuevos indicadores:

#Dos nuevos indicadores Y1 y Y2

x1 <- c(2,1,2,3)
x2 <- c(3,5,2,3)
x3 <- c(-1,-2,1,1)

y1 <- (x1+x2+x3)/3
y2 <- x1-(x2+x3)/2

#Creamos vector

y <- cbind(y1,y2)
round(y,2)
##        y1   y2
## [1,] 1.33  1.0
## [2,] 1.33 -0.5
## [3,] 1.67  0.5
## [4,] 2.33  1.0
yt <-t(round(y,2))
#Y1

Medias <- apply(y,2,mean)
Medias
##       y1       y2 
## 1.666667 0.500000
Mediana <- apply(y,2,median)
Mediana
##   y1   y2 
## 1.50 0.75
DS <- apply(y,2,sd)
DS
##        y1        y2 
## 0.4714045 0.7071068
Asimetria <- apply(y,2,skewness)
Asimetria
##         y1         y2 
##  0.8164966 -0.8164966
Curtosis <- apply(y,2,kurtosis)
Curtosis
## y1 y2 
##  2  2
CV <- DS/Medias
CV
##        y1        y2 
## 0.2828427 1.4142136
Descriptivas <- rbind(Medias,Mediana,DS,Asimetria,Curtosis,CV)
round(Descriptivas,2)
##             y1    y2
## Medias    1.67  0.50
## Mediana   1.50  0.75
## DS        0.47  0.71
## Asimetria 0.82 -0.82
## Curtosis  2.00  2.00
## CV        0.28  1.41

Comparación

  1. En la media ambos son postivos. Los valores de y1 se acercan a 1.67 y los valores de y2 se acercan a 0.50.
  2. En y2 en particular podemos ver que la mediana es mayor que la media, indicandonos posibles valores negativos o pequeños que reducen la media.
  3. La SD en y2 indica que los datos están más dispersos que en y1.
  4. En y1 los datos están sesgados positivamente mientras que en y2 están sesgado de manera negativa.
  5. La cortosis ambos indicadores aparentan estar cercana a una distribución normal.
  6. En y11 podemos observar un coeficiente de variación relativamente bajo indicando una variabilidad bajita en comparación al indicador y2, que aparenta ser una variabilidad alta.