INDICACIONES GENERALES.

El examen tiene una duración de 2 días desde las 10 de la noche del miércoles 05/02/2020 hasta las 10 de la noche del viernes 07/02/2020. Consta de tres preguntas, sólo la pregunta 3 contiene una base de datos que podrá descargar desde el siguiente enlace enlace para descargar el archivo

Una vez terminado tiene que enviar el script al siguiente correo: . La sintaxis de cada pregunta debe ser clara, si es posible agregar comentarios, con el fin de poder distinguir en donde se encuentra tal o cual pregunta.

Por último, recuerde que el certificado especificará el orden de mérito, esto es muy importante y considerado de valor por los reclutadores.

PREGUNTAS.

1.- Calcular las siguientes operaciones y estadísticos con los siguientes vectores.

  1. Calcular el tamaño de los tres vectores.
  2. Calcular el coeficiente de variación de cada vector e indicar cual es el mejor estadístico ¿la media o la mediana?, para cada uno de los casos.
  3. Separar el vector a en elementos pares e impares, con lo cual obtendrá dos vectores a los cuales tiene que llamarlos: pares e impares

2.- Calcular el error de predicción del siguiente modelo lineal.

Recordar que para encontrar los betas del modelo lineal tiene que recurrir a la fórmula siguiente:

\[\widehat{\beta}=(X'X)^{-1}X'Y\]

Una vez conseguido los betas que serán 3 (una constante y dos tendencias) calcular el error de predicción, es decir, la diferencia entre el Y real y el Y predicho. El Y real ya lo tiene, sólo le falta el Y predicho. Para lo cual lo puede calcular con la siguiente fórmula.

\[\widehat{Y}=X\widehat{\beta} \]

Una vez calculado los Y predichos, para calcular los errores sólo tiene que restar el Y real y el Y predicho de la siguiente manera:

\[\widehat{\varepsilon}=Y-\widehat{Y} \]

Y de esa manera podrá encontrar los errores. Por último, si desea puede realizar un histograma de estos errores con la función hist() en donde dentro de los paréntesis tendrá que especificar el vector de errores. Y así poder determinar si estos se distribuyen como una normal. Repito, si lo desea.

3.- Hallar la tabla de niveles de satisfacción.

A 222 personas de un trabajo les preguntaron sobre su nivel de satisfacción respecto a su trabajo, sus compañeros y el comedor. Esto se muestra en la base de datos llamada satisfaccion.csv. Para cargar esta base lo puede hacer como se explico en clase, o usar la siguiente sintaxis.

Recuerde que tiene que especificar la ruta, en función en donde o que lugar haya guardado el archivo. A lo que tendrá un archivo similar al siguiente:

Imagen de la base de datos


En esta base de datos usted encontrará tres columnas las cuales se llaman: En el trabajo, Con tus compañeros y En el comedor. Asimismo, cada pregunta tiene distintos niveles: Muy insatisfecho, Insatisfecho, Ligeramente insatisfecho, Ni insatisfecho ni satisfecho, Ligeramente satisfecho, Satisfecho, Muy satisfecho. Es decir, responden por el nivel de satisfacción en su trabajo, con sus compañeros y con el comedor.

Se sabe además que la opción Muy insatisfecho es la que tiene menor valor cuantificable así que se le asignará el valor de 1, seguido de insatisfecho que se le asigna el valor de 2 y así sucesivamente hasta Muy satisfecho que tomará el valor de 7.

Entonces, lo que tiene que hacer es convertir cada pregunta en un factor ordenado. Una vez que lo haya hecho realizar una tabla de cada pregunta con la función table(). Por último, si desea puede aplicar la siguiente función a cada columna as.numeric() con lo cual las columnas dejan de ser factores para convertirse en números y así poder realizar operaciones matemáticas para saber la sumatoria de puntaje de las tres columnas. Vuelvo a repetir, si lo desea.

Ya saben cualquier duda, me lo pueden hacer llegar al whatsapp.