PREGUNTAS.

1.- Calcular las siguientes operaciones y estadísticos con los siguientes vectores.

# Se tiene los vectores a, b y d.
a<-c(rep(c(1:8), 6, 5), seq(9, by=3, length.out = 100), 4:20)
b<-c(seq(100, 300, by=0.8))
d<-c(1:50, rep(3:9, 10,6), seq(3, 100, by=0.9))

Calcular el tamaño de los tres vectores.
Calcular el coeficiente de variación de cada vector e indicar cual es el mejor estadístico ¿la media o la mediana?, para cada uno de los casos.
Separar el vector a en elementos pares e impares, con lo cual obtendrá dos vectores a los cuales tiene que llamarlos: pares e impares

2.- Calcular el error de predicción del siguiente modelo lineal.

# Teniendo las siguientes matrices. 
X<-matrix(c(rep(1,10), seq(0.3, 0.9, length.out = 10), 3,5,3,2,7,3.2,4.1,1.5,8,4), nrow = 10, ncol = 3)

Y<-matrix(c(6,4,9,12,3,15,8,4,3,7))

Recordar que para encontrar los betas del modelo lineal tiene que recurrir a la fórmula siguiente:

\[\widehat{\beta}=(X'X)^{-1}X'Y\]

Una vez conseguido los betas que serán 3 (una constante y dos tendencias) calcular el error de predicción, es decir, la diferencia entre el Y real y el Y predicho. El Y real ya lo tiene, sólo le falta el Y predicho. Para lo cual lo puede calcular con la siguiente fórmula.

\[\widehat{Y}=X\widehat{\beta} \]

Una vez calculado los Y predichos, para calcular los errores sólo tiene que restar el Y real y el Y predicho de la siguiente manera:

\[\widehat{\varepsilon}=Y-\widehat{Y} \]

Y de esa manera podrá encontrar los errores. Por último, si desea puede realizar un histograma de estos errores con la función hist() en donde dentro de los paréntesis tendrá que especificar el vector de errores. Y así poder determinar si estos se distribuyen como una normal. Repito, si lo desea.

3.- Hallar la tabla de niveles de satisfacción.

A 222 personas de un trabajo les preguntaron sobre su nivel de satisfacción respecto a su trabajo, sus compañeros y el comedor. Esto se muestra en la base de datos llamada satisfaccion.csv. Para cargar esta base lo puede hacer como se explico en clase, o usar la siguiente sintaxis.

df<-read.csv("F:/satisfaccion.csv", header = T)

Recuerde que tiene que especificar la ruta, en función en donde o que lugar haya guardado el archivo. A lo que tendrá un archivo similar al siguiente:

En esta base de datos usted encontrará tres columnas las cuales se llaman: En el trabajo, Con tus compañeros y En el comedor. Asimismo, cada pregunta tiene distintos niveles: Muy insatisfecho, Insatisfecho, Ligeramente insatisfecho, Ni insatisfecho ni satisfecho, Ligeramente satisfecho, Satisfecho, Muy satisfecho. Es decir, responden por el nivel de satisfacción en su trabajo, con sus compañeros y con el comedor.

Se sabe además que la opción Muy insatisfecho es la que tiene menor valor cuantificable así que se le asignará el valor de 1, seguido de insatisfecho que se le asigna el valor de 2 y así sucesivamente hasta Muy satisfecho que tomará el valor de 7.

Entonces, lo que tiene que hacer es convertir cada pregunta en un factor ordenado. Una vez que lo haya hecho realizar una tabla de cada pregunta con la función table(). Por último, si desea puede aplicar la siguiente función a cada columna as.numeric() con lo cual las columnas dejan de ser factores para convertirse en números y así poder realizar operaciones matemáticas para saber la sumatoria de puntaje de las tres columnas. Vuelvo a repetir, si lo desea.

Ya saben cualquier duda, me lo pueden hacer llegar al whatsapp.

Primer Examen del Curso de Programación y Menejo de base de datos con R

César Anderson Huamaní Ninahuanca

DAT COMPANY

05 de Febrero del 2020

INDICACIONES GENERALES.

PREGUNTAS.

1.- Calcular las siguientes operaciones y estadísticos con los siguientes vectores.

2.- Calcular el error de predicción del siguiente modelo lineal.

3.- Hallar la tabla de niveles de satisfacción.