UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO
Modelos no paramétricos y de regresión
Integrantes:
-Karina Morán Villalba
-Eduardo Jair Jiménez Castañeda
-Jose Ramón Tuiran Rangel
-Alfonso Aguilar Duarte
-David A. Martinez Figueroa
-Arreola Silva Edna Marisol
Practica: Parte I
El objetivo de esta practica es crear una función para identificar el tipo de datos en una base, ver el porcentaje de datos faltantes y sacar histogramas para las columnas base. Esto servirá para analizar la información en un conjunto de datos.
#install.packages("DataExplorer")
#install.packages("data.table")
require(DataExplorer)
## Loading required package: DataExplorer
require(data.table)
## Loading required package: data.table
info <- function(datos){
#divide entre discreto y continuo
j <- split_columns(datos)
#Falta unificar estas graficas
config <- configure_report(
add_plot_qq = FALSE,
add_plot_correlation = FALSE,
add_plot_prcomp = FALSE,
add_plot_boxplot = FALSE,
add_plot_scatterplot = FALSE,
add_plot_intro = FALSE,
global_ggtheme = quote(theme_minimal(base_size = 14))
)
if(j$num_discrete == 0){
config <- configure_report(
add_plot_qq = FALSE,
add_plot_correlation = FALSE,
add_plot_prcomp = FALSE,
add_plot_boxplot = FALSE,
add_plot_scatterplot = FALSE,
add_plot_intro = FALSE,
add_plot_bar = FALSE,
global_ggtheme = quote(theme_minimal(base_size = 14))
)
create_report(datos, config = config)
return(j$continuous)
}
if(j$num_continuous == 0){
config <- configure_report(
add_plot_qq = FALSE,
add_plot_correlation = FALSE,
add_plot_prcomp = FALSE,
add_plot_boxplot = FALSE,
add_plot_scatterplot = FALSE,
add_plot_intro = FALSE,
add_plot_histogram = FALSE,
global_ggtheme = quote(theme_minimal(base_size = 14))
)
create_report(datos, config = config)
return(j$discrete)
}
create_report(datos, config = config)
return(j)
}
Probaremos esta función con las siguientes bases de datos obtenidas de R
info(cars)
info(airquality)
info(trees)
Los resultados se mostrarán en documentos html, además la función crea un reporte almacenado.
Los ejemplos anteriores muestran los resultados para cualquier tipode bases, incluso las que sólo tienen datos continuos o discretos.