Se considera el vector con los datos de las temperaturas de deflexión bajo carga del primer tipo de tubo de plástico.
temp_defl_1<-c(206,188,205,187,194,193,207,185,189,213,192,210,194,178,205)
Con el fin de comparar la distribución empírica y varias distribuciones paramétricas ajustadas en un mismo conjunto de datos, estas distribuciones deben ser llamadas con un primer argumento correspondiente a una lista de objetos de clase \(\texttt{fitdist}\) de la librería \(\texttt{fitdistrplus}\).
En el siguiente ejemplo, se compara el ajuste de una distribución weibull, una distribución normal y una distribución gamma para el conjunto de datos de temperaturas de deflexión.
library(fitdistrplus)
fw <- fitdist(temp_defl_1, "weibull")
fn <- fitdist(temp_defl_1, "norm")
fg <- fitdist(temp_defl_1, "gamma")
par(mfrow = c(2, 2))
plot.legend <- c("Weibull", "Normal", "Gamma")
denscomp(list(fw, fn, fg), legendtext = plot.legend)
qqcomp(list(fw, fn, fg), legendtext = plot.legend)
cdfcomp(list(fw, fn, fg), legendtext = plot.legend)
ppcomp(list(fw, fn, fg), legendtext = plot.legend)
La función \(\texttt{denscomp}\) compara la función de probabildiad empírica de los datos contra las densidades teóricas de cada modelo. La función \(\texttt{qqcomp}\) hace la comparación por cuantiles, la función \(\texttt{cdfcomp}\) hace la comparación con las funciones de distribución acumulada y la función \(\texttt{ppcomp}\) compara las probabilidades.
De este primer diagnóstico gráfico se puede apreciar que la normal y la gamma ofrecen un mejor ajuste que la weibull.
Aunque estos diagramas son buenos, una prueba estadística da un resultado más robusto a las comparaciones. El cálculo de diferentes estadísticas de bondad de ajuste se proponen en el paquete \(\texttt{fitdistrplus}\) para comparar aún más las distribuciones ajustadas. El propósito de las estadísticas de bondad de ajuste es medir la distancia entre la distribución paramétrica ajustada y la distribución empírica: por ejemplo, la distancia entre la función de distribución acumulada ajustada \(F\) y la función de distribución empírica \(F_n\).
Cuando se ajustan distribuciones continuas, se consideran clásicamente tres estadísticas de bondad de ajuste: las estadísticas de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling. Se pueden calcular usando la función \(\texttt{gofstat}\) de la librería \(\texttt{fitdistrplus}\).
gofstat(list(fw, fn, fg), fitnames = c("weibull", "norm", "gamma"))
## Goodness-of-fit statistics
## weibull norm gamma
## Kolmogorov-Smirnov statistic 0.2352609 0.20217614 0.2035476
## Cramer-von Mises statistic 0.1165691 0.09546624 0.0916262
## Anderson-Darling statistic 0.5893475 0.50534515 0.4915783
##
## Goodness-of-fit criteria
## weibull norm gamma
## Akaike's Information Criterion 116.8207 116.0171 115.9962
## Bayesian Information Criterion 118.2368 117.4332 117.4123
Los resultados de la bondad de ajuste muestran que bajo la prueba Kolmogorov-Smirnov, la normal muestra un mejor ajuste (máxima diferencia entre \(F\) y \(F_n\) más chica), mientras que bajo Cramer-Von-Mises y Anderson-Darling, la gamma muestra el mejor ajuste.
Los criterios de bondad de ajuste (AIC y BIC) funcionan de manera similar y dan preferencia a la gamma como el mejor ajuste.
citation("fitdistrplus")
##
## To cite fitdistrplus in publications use:
##
## Marie Laure Delignette-Muller, Christophe Dutang (2015).
## fitdistrplus: An R Package for Fitting Distributions. Journal of
## Statistical Software, 64(4), 1-34. DOI 10.18637/jss.v064.i04.
##
## A BibTeX entry for LaTeX users is
##
## @Article{,
## title = {{fitdistrplus}: An {R} Package for Fitting Distributions},
## author = {Marie Laure Delignette-Muller and Christophe Dutang},
## journal = {Journal of Statistical Software},
## year = {2015},
## volume = {64},
## number = {4},
## pages = {1--34},
## doi = {10.18637/jss.v064.i04},
## }
##
## Please cite both the package and R when using them for data analysis.
## See also 'citation()' for citing R.