🎯Objetivo

Este taller tiene como objetivo que los estudiantes practiquen la generación de estadísticas descriptivas de bases de datos en R.

📌Instrucciones

El informe final debe ser un documento PDF o Word con los resultados, los resultados que considere necesarios, el Script usado y la terminal de R.

El documento debe incluir pantallazos del código utilizado y los resultados obtenidos.

Incluir capturas de pantalla de: a) la instalación de R y RStudio, capturas de pantalla de la creación de proyectos y scripts en R.

El taller tambien debe incluir los fragmentos de código usados, y el análisis de estos.

La entrega del taller se realizara por medio de los entornos virtuales, no se recibirá ni calificara si se entrega por otro medio.

Es un taller individual.

Fecha de presentación: viernes, 21 de febrero 11:59 p.m. en las aulas virtuales

Recuerde que existe este tutorial que puede ayudarlo. https://rpubs.com/Julieth_ZorroM/Primeros_pasos_R

🔢 Paso a paso

  1. Instale y cargue los siguientes paquetes

    1. car

    2. carData

  1. Cargue la base de datos Salaries

    🔎Pista: Recuerde asignar la base de datos a un objeto de R

  2. Busque información sobre la base de datos Salaries

    1. ¿Cuál es el nombre completo de la base de datos?
    2. ¿A qué años corresponde la información?
    3. ¿A qué corresponden las variables: yrs.since.phd, yrs.service,salary
  3. Cuales son los 6 primeros registros de la base de datos Salaries

  4. Describa la base de datos Salariesy las variables que la conforman.

    1. ¿Cuántos registros tiene?
    2. ¿Cuántas variables?
    3. ¿Cuáles son los nombres de estas variables?
    4. ¿Que variables son factores?
    5. ¿Qué variables son caracteres?
    6. ¿Qué variables son númericas?
    7. ¿Qué función (paquete) uso para conocer esta información?
    8. ¿Se podría con otra función? ¿Cuál?
  5. Usando la función Abstract(df) describa cuales son los niveles de las variables rank, discipline, y sex.

  6. ¿La base de datos tiene datos en blanco (NA)?

  7. Utilice la función summary() y analice los resultados para cada variable.

  8. Analice las gráficas generadas por el paquete Desc(df) para las variables rankysalary.
    ¿Con la información que arroja esta función en la consola puede construir dichas gráficas?

  9. Utilice la función dfSummary() e interprete los resultados.

  10. ¿Qué destaca de cada una de las funciones utilizadas para hacer analisis descriptivo de la información? ¿Cuál(es) prefiere usar? ¿Cuáles resultados le parecen importantes?

  11. Si tuviera que dar cinco conclusiones acerca de esta base de datos ¿cuales serían?