Integrantes:

-Karina Morán Villalba

-Eduardo Jair Jiménez Castañeda

-Jose Ramón Tuiran Rangel

-Alfonso Aguilar Duarte

-David A. Martinez Figueroa

-Arreola Silva Edna Marisol

Practica: Parte I
El objetivo de esta practica es crear una función para identificar el tipo de datos en una base, ver el porcentaje de datos faltantes y sacar histogramas para las columnas base. Esto servirá para analizar la información en un conjunto de datos.

#install.packages("DataExplorer")
#install.packages("data.table")
require(DataExplorer)
## Loading required package: DataExplorer
require(data.table)
## Loading required package: data.table
info <- function(datos){
  #divide entre discreto y continuo
  j <- split_columns(datos)
  #Falta unificar estas graficas
  config <- configure_report(
    add_plot_qq = FALSE,
    add_plot_correlation = FALSE,
    add_plot_prcomp = FALSE,
    add_plot_boxplot = FALSE,
    add_plot_scatterplot = FALSE,
    add_plot_intro = FALSE,
    global_ggtheme = quote(theme_minimal(base_size = 14))
  )
  
  if(j$num_discrete == 0){
    config <- configure_report(
      add_plot_qq = FALSE,
      add_plot_correlation = FALSE,
      add_plot_prcomp = FALSE,
      add_plot_boxplot = FALSE,
      add_plot_scatterplot = FALSE,
      add_plot_intro = FALSE,
      add_plot_bar = FALSE,
      global_ggtheme = quote(theme_minimal(base_size = 14))
    )
    
    create_report(datos, config = config)
    return(j$continuous)
    
  }
  
  if(j$num_continuous == 0){
    config <- configure_report(
      add_plot_qq = FALSE,
      add_plot_correlation = FALSE,
      add_plot_prcomp = FALSE,
      add_plot_boxplot = FALSE,
      add_plot_scatterplot = FALSE,
      add_plot_intro = FALSE,
      add_plot_histogram  = FALSE,
      global_ggtheme = quote(theme_minimal(base_size = 14))
    )
    
    create_report(datos, config = config)
    return(j$discrete)
    
  }
  
  
  create_report(datos, config = config)
  return(j)
} 

Probaremos esta función con las siguientes bases de datos obtenidas de R

info(cars)
info(airquality)
info(trees)

Los resultados se mostrarán en documentos html, además la función crea un reporte almacenado.

Los ejemplos anteriores muestran los resultados para cualquier tipode bases, incluso las que sólo tienen datos continuos o discretos.