Descripción de la base de datos

CA: Cátedra
CG: Contabilidad general
FA: Fundamentos de administración
INI: Introducción a los negocios internacionales
M: Matemáticas
Me: Métodos de estudio
Promedio fallas: Fallas promedio de las asignaturas

Punto 1

Vector de medias

data=Actividad1[,1:7]
vec_medias <- apply(data,2,mean)
vec_medias
##              CA              CG              FA             INI               M 
##        3.948315        3.546067        4.105618        3.947191        3.903371 
##              ME Promedio Fallas 
##        3.735955        0.594382

Del vetor de medias se puede interpretar que la asignatura con mejores deseñepeños es Fundamentos de administración y la que tiene peores desempeños es Contabilidad general.

Matriz de covarianzas

S=round(var(data),2)
round(apply(data,2,var),2)
##              CA              CG              FA             INI               M 
##            1.42            0.50            0.82            0.52            0.52 
##              ME Promedio Fallas 
##            1.06            3.94

Matriz de correlación

library(corrplot)
## corrplot 0.92 loaded
R=round(cor(data),2)
R
##                    CA    CG    FA   INI     M    ME Promedio Fallas
## CA               1.00  0.38  0.45  0.47  0.31  0.40           -0.41
## CG               0.38  1.00  0.52  0.51  0.44  0.45           -0.61
## FA               0.45  0.52  1.00  0.55  0.50  0.31           -0.50
## INI              0.47  0.51  0.55  1.00  0.35  0.53           -0.55
## M                0.31  0.44  0.50  0.35  1.00  0.29           -0.41
## ME               0.40  0.45  0.31  0.53  0.29  1.00           -0.43
## Promedio Fallas -0.41 -0.61 -0.50 -0.55 -0.41 -0.43            1.00
corrplot(R)

De la matriz de correlación podemos observar que la relación negativas más fuerte se presenta entre Promedio de fallas y Contabilidad General, esto se explica a que mayor calificación menor promedio de fallas y viceversa, por esta razón no existen muchas correlaciones positivas.

2 Gráficos.

Matriz de diagramas de dispersión
pairs(data)

Diagrama de estrellas
### Muestreo aleatorio simple sin reemplazo
n <- ceiling(nrow(Actividad1)*0.20)
n
## [1] 18
set.seed(1234)
i <- sample(1:nrow(Actividad1),n)
i
##  [1] 28 80 22  9  5 38 16  4 70 79 78 14 56 62 82 75 21 40
sample.Actividad <- Actividad1[i,1:7]
View(sample.Actividad)
palette(rainbow(12, s = 0.6, v = 0.75))

stars(sample.Actividad[, 1:7], len = 0.8, key.loc = c(12, 1.5),
      main = "Calificaciones", draw.segments = TRUE)

Caras de Chernof
library(aplpack)
windows()
faces(sample.Actividad)

## effect of variables:
##  modified item       Var              
##  "height of face   " "CA"             
##  "width of face    " "CG"             
##  "structure of face" "FA"             
##  "height of mouth  " "INI"            
##  "width of mouth   " "M"              
##  "smiling          " "ME"             
##  "height of eyes   " "Promedio Fallas"
##  "width of eyes    " "CA"             
##  "height of hair   " "CG"             
##  "width of hair   "  "FA"             
##  "style of hair   "  "INI"            
##  "height of nose  "  "M"              
##  "width of nose   "  "ME"             
##  "width of ear    "  "Promedio Fallas"
##  "height of ear   "  "CA"
curvas de Andrews
library(pracma)
class(Actividad1)
## [1] "tbl_df"     "tbl"        "data.frame"
df = as.data.frame(Actividad1)
A <- as.matrix(df[, 1:7])
f <- as.factor(df[, 8])
andrewsplot(A, f, style = "cart")

#### Análisis de las gráficas

Respecto a la matriz de dispersión se ven resultados no lienales y especialmente en la variable fallas se ve un comportamiento atipico de la disperción en comparación con la otra variables.

Respecto al diagrama de estrellas y las caras de Chernof, lo más relevantes es que en la muestra tenemos dos datos atípicos, el resto de datos se comportan más o menos de forma similar en las diferentes variables.

3. Población normal multivariada

library(MVN)
result <- mvn(data = Actividad1, mvnTest = "mardia")
result$multivariateNormality

Análisis de normalidad.

Lo que podemos inferir del resultados de la prueba de Mardia es que los datos nos son normales, teniendo en cuenta las dos pruebas, tanto Skewness y Kurtosis.