El presente trabajo pretende mostrar y comparar la importancia de los diferentes métodos para la selección del número de clases en la construcción de tablas de frecuencias y como dicho resultado puede influir en la representación gráfica de la distribución de un conjunto de datos, para tal fin construiremos tablas de frecuencias para datos agrupados y sus respectivos histogramas, polígonos y ojivas utilizando los métodos de “Sturges” , Scott y Freedman- Diaconis.Del mismo modo responderemos los interrogantes acerca de la aceptación de la regla de Surges ante las alternativas que ofrecen Scott y Freedman- Diaconis y por ultimo daremos nuestras conclusiones de lo observado al trabajar con las tres reglas dando a conocer con cual preferimos trabajar justificando el porqué.
En estadística la construcción de tablas de frecuencia para datos agrupados con sus respectivos histogramas es de suma importancia, debido a que se pude realizar una caracterización inicial del tipo de distribución que sigue la información tabulada, por ello es de suma importancia para el analista de la información la escogencia de un método eficiente que le permita la selección optima del número de clases en las que se agrupará la información y es en este punto donde surgen diferentes posturas y dudas en cuanto a la técnica a escoger, actualmente para tal fin son utilizados teorías de diversos autores que conducen a resultados diversos debido a que responden a variables como tamaño de los datos, atipicidad y variabilidad en otros aspectos. Ante esta situación de incertidumbre en cuanto a la técnica de calcular el número de clases planteamos el siguiente interrogante como hilo conductor de este ensayo ¿Existen diferencias significativas en cuanto al número de clases cuando se aplican las de técnicas de Surges, Scott y Freedman- Diaconis a una misma muestras?
Distribución de frecuencia
Según Cabrera (2008) La distribución de frecuencia es “una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, de acuerdo a la frecuencia de cada dato” (p. 8)
Distribuciones de frecuencias agrupadas
Uno de los tipos de distribuciones existentes es la de frecuencias agrupadas. Teniendo en cuenta esto Cabrera (2008) da a conocer un concepto de esta distribución en el cual menciona que es: “la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia en cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.” (p.10)
Regla de Sturges
Llinas y Rojas (2015) mencionan que esta regla permite establecer el número de clases necesarias para la construcción de una tabla de frecuencia agrupada, en donde aproximadamente, c=3,3(logan )+1
Donde n es el número de salidas y logan es el logaritmo de n en base 1. El valor de c es común redondearlo al entero más cercano. (p.16)
Freedman–Diaconis rule
Una de las reglas alternativas es la de Freedman–Diaconis, la cual permite la construcción de histogramas y nace como respuesta a los problemas que presenta la regla de Sturges. Para el ancho de clases Freedman y Diaconis (1981) establecen que: h=2IQn^(-1/3) Donde IQ es el intervalo intercuartil de la muestra.
Scott’s rule
Otra de las reglas alternativas para la construcción de histogramas es la que define Scott´s (1979) en donde da a conocer que para el ancho de clase: h=3.5sn^(-1/3) Donde s es la desviación estándar de la muestra, es sencillo de utilizar asi como la regla de Sturges pero esta se encuentra mejor fundamentada en la teoría de la estadística.
Es una rutina diseñada para que a partir de una muestra aleatoria de datos no agrupados de un vector, genere una tabla de frecuencias para datos agrupados, el histograma con su respectivo poligono de frecuencias asi como tambien el gráfico de Ojiva. Esta rutina calcula el número de clases a partir del método de Sturges y la muestra es redondeada a una cifra decimal.
TFH7=function(N){
x=round(N,1) ## vector aleatorio
n=length(x) ## tamaño
M=round(max(x),1) ## valor maximo
m=round(min(x),1) ## valor minimo
R=round((M-m),1) ## rango inicial
c=nclass.Sturges(x) ## numero de clases
w=ceiling(R/c) ## ancho de clases
Ra=c*w ## rango ampliado
d=(Ra-R) ## diferencia media de rangos
li=round((m),1) ## limite inferior
ls=round((li + Ra + 0.0001),1) ## limite superior
y0=round(seq(li,ls,by=w),1) ## secuencia para limites de clases
y1=round(seq(li,ls-w,by=w),1) ## secuencia para limites inferiores
y2=round(seq(li+w,ls,by=w),1) ## secuencia para limites superiores
y3=round((y1+y2)/2,1) ## secuencia para marcas de clases
y4=rep(NA,c) ## secuencia vector nulo
for(i in 0:c){
y4[i]=length(x[x>=y1[i]&x<y2[i]]) ## secuencia para frecuencias absolutas
}
y5=round(cumsum(y4),2) ## secuencia frecuencias absolutas acumuladas
y6=round((y4/n),2) ## secuencia frecuencias relativas
y7=round((y5/n),2) ## secuencia frecuencia relativa acumulada
y8=c("Lim-inf.","Lim-sup.","Marca-clase.","Frec-Abs.","Frec-Abs-Acum.","frec-Rel","Frec- Rel-Acum")
tabla.frec=data.frame(y1,y2,y3,y4,y5,y6,y7)
colnames(tabla.frec)=y8 ## asignacion nombres a columnas tabla de frecuencias
y9=c(li,y2) ## valores eje x para OJIVA
y10=c(0,y5) ## valores eje y para OJIVA
cat("n=",n,"\t","max=",M,"\t","min=",m,"\t","Rango=",R,"\t","clases=",c,"\t","Amplitud=",w,"\t","Rango ampliado=",Ra,"\n","\n")
print(tabla.frec)
y20<-hist(x, breaks=y0,xaxp=round(c(li,ls,c),1),labels = T,main="HISTOGRAMA VS POLIGONO DE FRECUENCIAS",col="green",xlab = "Clases",ylab="Frecuencias Absolutas",sub="Sturges")
lines(c(min(y20$breaks),y20$mids,max(y20$breaks)),c(0,y20$counts,0),type = "b",col="red",lwd=3)
plot(x=y9,y=y10,type="b",xaxp=round(c(li,ls,c),1),ylim=c(0,n),main="OJIVA",col="blue",lty=1,lwd=3,xlab = "clases",ylab = "Frecuencia Absoluta Acumulada",sub="Sturges")
}
Es una rutina diseñada para que a partir de una muestra aleatoria de datos no agrupados de un vector, genere una tabla de frecuencias para datos agrupados, el histograma con su respectivo poligono de frecuencias asi como tambien el gráfico de Ojiva. Esta rutina calcula el número de clases a partir del método de Scott y la muestra es redondeada a una cifra decimal.
TFH8=function(N){
x=round(N,1) ## vector aleatorio
n=length(x) ## tamaño
M=round(max(x),1) ## valor maximo
m=round(min(x),1) ## valor minimo
R=round((M-m),1) ## rango inicial
c=nclass.scott(x) ## numero de clases
w=ceiling(R/c) ## ancho de clases
Ra=c*w ## rango ampliado
d=(Ra-R) ## diferencia media de rangos
li=round((m),1) ## limite inferior
ls=round((li + Ra + 0.0001),1) ## limite superior
y0=round(seq(li,ls,by=w),1) ## secuencia para limites de clases
y1=round(seq(li,ls-w,by=w),1) ## secuencia para limites inferiores
y2=round(seq(li+w,ls,by=w),1) ## secuencia para limites superiores
y3=round((y1+y2)/2,1) ## secuencia para marcas de clases
y4=rep(NA,c) ## secuencia vector nulo
for(i in 0:c){
y4[i]=length(x[x>=y1[i]&x<y2[i]]) ## secuencia para frecuencias absolutas
}
y5=round(cumsum(y4),2) ## secuencia frecuencias absolutas acumuladas
y6=round((y4/n),2) ## secuencia frecuencias relativas
y7=round((y5/n),2) ## secuencia frecuencia relativa acumulada
y8=c("Lim-inf.","Lim-sup.","Marca-clase.","Frec-Abs.","Frec-Abs-Acum.","frec-Rel","Frec- Rel-Acum")
tabla.frec=data.frame(y1,y2,y3,y4,y5,y6,y7)
colnames(tabla.frec)=y8 ## asignacion nombres a columnas tabla de frecuencias
y9=c(li,y2) ## valores eje x para OJIVA
y10=c(0,y5) ## valores eje y para OJIVA
cat("n=",n,"\t","max=",M,"\t","min=",m,"\t","Rango=",R,"\t","clases=",c,"\t","Amplitud=",w,"\t","Rango ampliado=",Ra,"\n","\n")
print(tabla.frec)
y20<-hist(x, breaks=y0,xaxp=round(c(li,ls,c),1),labels = T,main="HISTOGRAMA VS POLIGONO DE FRECUENCIAS",col="green",xlab = "Clases",ylab="Frecuencias Absolutas",sub="Scott")
lines(c(min(y20$breaks),y20$mids,max(y20$breaks)),c(0,y20$counts,0),type = "b",col="red",lwd=3)
plot(x=y9,y=y10,type="b",xaxp=round(c(li,ls,c),1),ylim=c(0,n),main="OJIVA",col="blue",lty=1,lwd=3,xlab = "clases",ylab = "Frecuencia Absoluta Acumulada",sub="Scott")
}
Es una rutina diseñada para que a partir de una muestra aleatoria de datos no agrupados de un vector, genere una tabla de frecuencias para datos agrupados, el histograma con su respectivo poligono de frecuencias asi como tambien el gráfico de Ojiva. Esta rutina calcula el número de clases a partir del método de FREEDMAN - DIACONIS y la muestra es redondeada a una cifra decimal.
TFH9=function(N){
x=round(N,1) ## vector aleatorio
n=length(x) ## tamaño
M=round(max(x),1) ## valor maximo
m=round(min(x),1) ## valor minimo
R=round((M-m),1) ## rango inicial
c=nclass.FD(x) ## numero de clases
w=ceiling(R/c) ## ancho de clases
Ra=c*w ## rango ampliado
d=(Ra-R) ## diferencia media de rangos
li=round((m),1) ## limite inferior
ls=round((li + Ra + 0.0001),1) ## limite superior
y0=round(seq(li,ls,by=w),1) ## secuencia para limites de clases
y1=round(seq(li,ls-w,by=w),1) ## secuencia para limites inferiores
y2=round(seq(li+w,ls,by=w),1) ## secuencia para limites superiores
y3=round((y1+y2)/2,1) ## secuencia para marcas de clases
y4=rep(NA,c) ## secuencia vector nulo
for(i in 0:c){
y4[i]=length(x[x>=y1[i]&x<y2[i]]) ## secuencia para frecuencias absolutas
}
y5=round(cumsum(y4),2) ## secuencia frecuencias absolutas acumuladas
y6=round((y4/n),2) ## secuencia frecuencias relativas
y7=round((y5/n),2) ## secuencia frecuencia relativa acumulada
y8=c("Lim-inf.","Lim-sup.","Marca-clase.","Frec-Abs.","Frec-Abs-Acum.","frec-Rel","Frec- Rel-Acum")
tabla.frec=data.frame(y1,y2,y3,y4,y5,y6,y7)
colnames(tabla.frec)=y8 ## asignacion nombres a columnas tabla de frecuencias
y9=c(li,y2) ## valores eje x para OJIVA
y10=c(0,y5) ## valores eje y para OJIVA
cat("n=",n,"\t","max=",M,"\t","min=",m,"\t","Rango=",R,"\t","clases=",c,"\t","Amplitud=",w,"\t","Rango ampliado=",Ra,"\n","\n")
print(tabla.frec)
y20<-hist(x, breaks=y0,xaxp=round(c(li,ls,c),1),labels = T,main="HISTOGRAMA VS POLIGONO DE FRECUENCIAS",col="green",xlab = "Clases",ylab="Frecuencias Absolutas",sub="Freedman- Diaconis")
lines(c(min(y20$breaks),y20$mids,max(y20$breaks)),c(0,y20$counts,0),type = "b",col="red",lwd=3)
plot(x=y9,y=y10,type="b",xaxp=round(c(li,ls,c),1),ylim=c(0,n),main="OJIVA",col="blue",lty=1,lwd=3,xlab = "clases",ylab = "Frecuencia Absoluta Acumulada",sub = "Freedman- Diaconis")
}
A continuacion se procede a generar todas las muestras que se utilizarán para la comprobacion de cada una de las rutinas:
Nombre :N1
Tamaño :20
Media :20
Desviación :5
Distribución :Normal
set.seed(1000)
N1=round(rnorm(20,20,5),1);N1
## [1] 17.8 14.0 20.2 23.2 16.1 18.1 17.6 23.6 19.9 13.1 15.1 17.2 20.6 19.4
## [15] 13.3 20.9 20.8 20.1 9.8 21.1
Nombre :N2
Tamaño :30
Media :20
Desviación :5
Distribución :Normal
set.seed(2000)
N2=round(rnorm(30,20,5),1);N2
## [1] 15.7 18.2 24.5 28.7 24.6 14.1 10.3 30.5 21.1 25.9 29.5 24.2 26.7 19.0
## [15] 21.0 25.4 14.2 21.0 14.2 19.0 22.3 11.2 22.2 23.7 21.9 19.7 12.7 11.5
## [29] 20.2 25.8
Nombre :N3
Tamaño :50
Media :20
Desviación :5
Distribución :Normal
set.seed(3000)
N3=round(rnorm(50,20,5),1);N3
## [1] 26.3 23.2 22.3 23.9 18.9 18.2 16.8 13.7 11.5 10.8 15.9 11.9 21.5 27.5
## [15] 20.1 17.2 22.3 23.0 25.5 10.2 19.8 25.0 16.7 17.7 14.8 16.3 22.9 17.2
## [29] 13.7 16.8 18.3 22.2 24.8 15.8 25.2 19.8 18.3 19.6 8.8 24.0 7.6 26.4
## [43] 22.5 27.2 16.7 14.9 18.9 16.8 21.6 16.0
Nombre :N4
Tamaño :100
Media :20
Desviación :5
Distribución :Normal
set.seed(4000)
N4=round(rnorm(100,20,5),1);N4
## [1] 16.2 12.1 18.8 8.6 23.3 25.9 24.8 12.8 13.8 20.2 12.5 19.2 24.8 16.2
## [15] 23.8 23.8 26.9 11.9 21.7 13.7 18.0 23.3 15.4 17.4 19.1 18.3 30.6 18.5
## [29] 21.5 31.4 22.6 18.8 22.8 23.8 25.5 17.1 15.7 13.9 22.7 24.9 19.7 19.5
## [43] 23.3 26.8 23.8 20.0 19.4 15.9 18.0 20.0 16.4 25.2 37.1 16.0 24.4 18.6
## [57] 11.9 26.0 9.6 17.0 19.5 12.5 17.1 25.5 16.8 14.9 24.4 23.5 16.3 25.5
## [71] 32.3 23.2 20.5 14.4 21.4 17.1 23.6 22.4 11.8 15.3 25.1 24.3 12.5 26.5
## [85] 29.9 20.2 18.0 19.3 24.6 10.8 20.7 26.0 11.6 27.4 19.5 24.0 15.7 19.1
## [99] 19.7 16.1
Esta muestra se genera agregando un valor atipico a la muestra N1
set.seed(5000)
N5=round(c(N1,70.1),1);N5
## [1] 17.8 14.0 20.2 23.2 16.1 18.1 17.6 23.6 19.9 13.1 15.1 17.2 20.6 19.4
## [15] 13.3 20.9 20.8 20.1 9.8 21.1 70.1
Esta muestra se genera agregando un valor atipico a la muestra N2
set.seed(6000)
N6=round(c(N2,70.1),1);N6
## [1] 15.7 18.2 24.5 28.7 24.6 14.1 10.3 30.5 21.1 25.9 29.5 24.2 26.7 19.0
## [15] 21.0 25.4 14.2 21.0 14.2 19.0 22.3 11.2 22.2 23.7 21.9 19.7 12.7 11.5
## [29] 20.2 25.8 70.1
Esta muestra se genera agregando un valor atipico a la muestra N3
set.seed(7000)
N7=round(c(N3,70.1),1);N7
## [1] 26.3 23.2 22.3 23.9 18.9 18.2 16.8 13.7 11.5 10.8 15.9 11.9 21.5 27.5
## [15] 20.1 17.2 22.3 23.0 25.5 10.2 19.8 25.0 16.7 17.7 14.8 16.3 22.9 17.2
## [29] 13.7 16.8 18.3 22.2 24.8 15.8 25.2 19.8 18.3 19.6 8.8 24.0 7.6 26.4
## [43] 22.5 27.2 16.7 14.9 18.9 16.8 21.6 16.0 70.1
Esta muestra se genera agregando un valor atipico a la muestra N4
set.seed(8000)
N8=round(c(N4,70.1),1);N8
## [1] 16.2 12.1 18.8 8.6 23.3 25.9 24.8 12.8 13.8 20.2 12.5 19.2 24.8 16.2
## [15] 23.8 23.8 26.9 11.9 21.7 13.7 18.0 23.3 15.4 17.4 19.1 18.3 30.6 18.5
## [29] 21.5 31.4 22.6 18.8 22.8 23.8 25.5 17.1 15.7 13.9 22.7 24.9 19.7 19.5
## [43] 23.3 26.8 23.8 20.0 19.4 15.9 18.0 20.0 16.4 25.2 37.1 16.0 24.4 18.6
## [57] 11.9 26.0 9.6 17.0 19.5 12.5 17.1 25.5 16.8 14.9 24.4 23.5 16.3 25.5
## [71] 32.3 23.2 20.5 14.4 21.4 17.1 23.6 22.4 11.8 15.3 25.1 24.3 12.5 26.5
## [85] 29.9 20.2 18.0 19.3 24.6 10.8 20.7 26.0 11.6 27.4 19.5 24.0 15.7 19.1
## [99] 19.7 16.1 70.1
library(MASS)
names(Melanoma)
## [1] "time" "status" "sex" "age" "year" "thickness"
## [7] "ulcer"
set.seed(9000)
N9=Melanoma$thickness
N9
## [1] 6.76 0.65 1.34 2.90 12.08 4.84 5.16 3.22 12.88 7.41 4.19
## [12] 0.16 3.87 4.84 2.42 12.56 5.80 7.06 5.48 7.73 13.85 2.34
## [23] 4.19 4.04 4.84 0.32 8.54 2.58 3.56 3.54 0.97 4.83 1.62
## [34] 6.44 14.66 2.58 3.87 3.54 1.34 2.24 3.87 3.54 17.42 1.29
## [45] 3.22 1.29 4.51 8.38 1.94 0.16 2.58 1.29 0.16 1.62 1.29
## [56] 2.10 0.32 0.81 1.13 5.16 1.62 1.37 0.24 0.81 1.29 1.29
## [67] 0.97 1.13 5.80 1.29 0.48 1.62 2.26 0.58 0.97 2.58 0.81
## [78] 3.54 0.97 1.78 1.94 1.29 3.22 1.53 1.29 1.62 1.62 0.32
## [89] 4.84 1.29 0.97 3.06 3.54 1.62 2.58 1.94 0.81 7.73 0.97
## [100] 12.88 2.58 4.09 0.64 0.97 3.22 1.62 3.87 0.32 0.32 3.22
## [111] 2.26 3.06 2.58 0.65 1.13 0.81 0.97 1.76 1.94 0.65 0.97
## [122] 5.64 9.66 0.10 5.48 2.26 4.83 0.97 0.97 5.16 0.81 2.90
## [133] 3.87 1.94 0.16 0.64 2.26 1.45 4.82 1.29 7.89 0.81 3.54
## [144] 1.29 0.64 3.22 1.45 0.48 1.94 0.16 0.16 1.29 1.94 3.54
## [155] 0.81 0.65 7.09 0.16 1.62 1.62 1.29 6.12 0.48 0.64 3.22
## [166] 1.94 2.58 2.58 0.81 0.81 3.22 0.32 3.22 2.74 4.84 1.62
## [177] 0.65 1.45 0.65 1.29 1.62 3.54 3.22 0.65 1.03 7.09 1.29
## [188] 0.65 1.78 12.24 8.06 0.81 2.10 3.87 0.65 1.94 0.65 2.10
## [199] 1.94 1.13 7.06 6.12 0.48 2.26 2.90
TFH7(N1)
## n= 20 max= 23.6 min= 9.8 Rango= 13.8 clases= 6 Amplitud= 3 Rango ampliado= 18
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 9.8 12.8 11.3 1 1 0.05
## 2 12.8 15.8 14.3 4 5 0.20
## 3 15.8 18.8 17.3 5 10 0.25
## 4 18.8 21.8 20.3 8 18 0.40
## 5 21.8 24.8 23.3 2 20 0.10
## 6 24.8 27.8 26.3 0 20 0.00
## Frec- Rel-Acum
## 1 0.05
## 2 0.25
## 3 0.50
## 4 0.90
## 5 1.00
## 6 1.00
TFH8(N1)
## n= 20 max= 23.6 min= 9.8 Rango= 13.8 clases= 3 Amplitud= 5 Rango ampliado= 15
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 9.8 14.8 12.3 4 4 0.20
## 2 14.8 19.8 17.3 7 11 0.35
## 3 19.8 24.8 22.3 9 20 0.45
## Frec- Rel-Acum
## 1 0.20
## 2 0.55
## 3 1.00
TFH9(N1)
## n= 20 max= 23.6 min= 9.8 Rango= 13.8 clases= 4 Amplitud= 4 Rango ampliado= 16
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 9.8 13.8 11.8 3 3 0.15
## 2 13.8 17.8 15.8 5 8 0.25
## 3 17.8 21.8 19.8 10 18 0.50
## 4 21.8 25.8 23.8 2 20 0.10
## Frec- Rel-Acum
## 1 0.15
## 2 0.40
## 3 0.90
## 4 1.00
TFH7(N2)
## n= 30 max= 30.5 min= 10.3 Rango= 20.2 clases= 6 Amplitud= 4 Rango ampliado= 24
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 10.3 14.3 12.3 7 7 0.23
## 2 14.3 18.3 16.3 2 9 0.07
## 3 18.3 22.3 20.3 9 18 0.30
## 4 22.3 26.3 24.3 8 26 0.27
## 5 26.3 30.3 28.3 3 29 0.10
## 6 30.3 34.3 32.3 1 30 0.03
## Frec- Rel-Acum
## 1 0.23
## 2 0.30
## 3 0.60
## 4 0.87
## 5 0.97
## 6 1.00
TFH8(N2)
## n= 30 max= 30.5 min= 10.3 Rango= 20.2 clases= 4 Amplitud= 6 Rango ampliado= 24
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 10.3 16.3 13.3 8 8 0.27
## 2 16.3 22.3 19.3 10 18 0.33
## 3 22.3 28.3 25.3 9 27 0.30
## 4 28.3 34.3 31.3 3 30 0.10
## Frec- Rel-Acum
## 1 0.27
## 2 0.60
## 3 0.90
## 4 1.00
TFH9(N2)
## n= 30 max= 30.5 min= 10.3 Rango= 20.2 clases= 4 Amplitud= 6 Rango ampliado= 24
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 10.3 16.3 13.3 8 8 0.27
## 2 16.3 22.3 19.3 10 18 0.33
## 3 22.3 28.3 25.3 9 27 0.30
## 4 28.3 34.3 31.3 3 30 0.10
## Frec- Rel-Acum
## 1 0.27
## 2 0.60
## 3 0.90
## 4 1.00
TFH7(N3)
## n= 50 max= 27.5 min= 7.6 Rango= 19.9 clases= 7 Amplitud= 3 Rango ampliado= 21
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 7.6 10.6 9.1 3 3 0.06
## 2 10.6 13.6 12.1 3 6 0.06
## 3 13.6 16.6 15.1 8 14 0.16
## 4 16.6 19.6 18.1 13 27 0.26
## 5 19.6 22.6 21.1 10 37 0.20
## 6 22.6 25.6 24.1 9 46 0.18
## 7 25.6 28.6 27.1 4 50 0.08
## Frec- Rel-Acum
## 1 0.06
## 2 0.12
## 3 0.28
## 4 0.54
## 5 0.74
## 6 0.92
## 7 1.00
TFH8(N3)
## n= 50 max= 27.5 min= 7.6 Rango= 19.9 clases= 5 Amplitud= 4 Rango ampliado= 20
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 7.6 11.6 9.6 5 5 0.10
## 2 11.6 15.6 13.6 5 10 0.10
## 3 15.6 19.6 17.6 17 27 0.34
## 4 19.6 23.6 21.6 13 40 0.26
## 5 23.6 27.6 25.6 10 50 0.20
## Frec- Rel-Acum
## 1 0.10
## 2 0.20
## 3 0.54
## 4 0.80
## 5 1.00
TFH9(N3)
## n= 50 max= 27.5 min= 7.6 Rango= 19.9 clases= 6 Amplitud= 4 Rango ampliado= 24
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 7.6 11.6 9.6 5 5 0.10
## 2 11.6 15.6 13.6 5 10 0.10
## 3 15.6 19.6 17.6 17 27 0.34
## 4 19.6 23.6 21.6 13 40 0.26
## 5 23.6 27.6 25.6 10 50 0.20
## 6 27.6 31.6 29.6 0 50 0.00
## Frec- Rel-Acum
## 1 0.10
## 2 0.20
## 3 0.54
## 4 0.80
## 5 1.00
## 6 1.00
TFH7(N4)
## n= 100 max= 37.1 min= 8.6 Rango= 28.5 clases= 8 Amplitud= 4 Rango ampliado= 32
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 8.6 12.6 10.6 11 11 0.11
## 2 12.6 16.6 14.6 17 28 0.17
## 3 16.6 20.6 18.6 29 57 0.29
## 4 20.6 24.6 22.6 22 79 0.22
## 5 24.6 28.6 26.6 16 95 0.16
## 6 28.6 32.6 30.6 4 99 0.04
## 7 32.6 36.6 34.6 0 99 0.00
## 8 36.6 40.6 38.6 1 100 0.01
## Frec- Rel-Acum
## 1 0.11
## 2 0.28
## 3 0.57
## 4 0.79
## 5 0.95
## 6 0.99
## 7 0.99
## 8 1.00
TFH8(N4)
## n= 100 max= 37.1 min= 8.6 Rango= 28.5 clases= 8 Amplitud= 4 Rango ampliado= 32
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 8.6 12.6 10.6 11 11 0.11
## 2 12.6 16.6 14.6 17 28 0.17
## 3 16.6 20.6 18.6 29 57 0.29
## 4 20.6 24.6 22.6 22 79 0.22
## 5 24.6 28.6 26.6 16 95 0.16
## 6 28.6 32.6 30.6 4 99 0.04
## 7 32.6 36.6 34.6 0 99 0.00
## 8 36.6 40.6 38.6 1 100 0.01
## Frec- Rel-Acum
## 1 0.11
## 2 0.28
## 3 0.57
## 4 0.79
## 5 0.95
## 6 0.99
## 7 0.99
## 8 1.00
TFH9(N4)
## n= 100 max= 37.1 min= 8.6 Rango= 28.5 clases= 9 Amplitud= 4 Rango ampliado= 36
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 8.6 12.6 10.6 11 11 0.11
## 2 12.6 16.6 14.6 17 28 0.17
## 3 16.6 20.6 18.6 29 57 0.29
## 4 20.6 24.6 22.6 22 79 0.22
## 5 24.6 28.6 26.6 16 95 0.16
## 6 28.6 32.6 30.6 4 99 0.04
## 7 32.6 36.6 34.6 0 99 0.00
## 8 36.6 40.6 38.6 1 100 0.01
## 9 40.6 44.6 42.6 0 100 0.00
## Frec- Rel-Acum
## 1 0.11
## 2 0.28
## 3 0.57
## 4 0.79
## 5 0.95
## 6 0.99
## 7 0.99
## 8 1.00
## 9 1.00
para la muestra N1 con tamaño =20, media = 20 y desviacion = 5 el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFH9(F- D) : clases= 4 Amplitud= 4 Rango ampliado= 16
En la informacion previa se puede observar que la rutina TFH7 es la unica que proporciona un numero de clases ajustado al rango recomendado de acuerdo a la teoria estadistica el cual debe ser minino 5 y maximo 20 clases.
Desde el punto de vista grafico los tres metodos tienden a presentar poligonos de frecuencias con sesgo a la izquierda
Para la muestra N2 con tamaño =30, media = 20 y desviacion = 5 el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFH9(F- D) : clases= 4 Amplitud= 6 Rango ampliado= 24
En la informacion previa se puede observar que la rutina TFH7 a pesar del aumento en el tamño de la muestra es la unica que suigue proporcionando un numero de clases ajustado al rango recomendado.
Desde el punto de vista grafico los tres metodos tienden a presentar poligonos de frecuencias con datos ajustandose en torno a la media.
Para la muestra N3 con tamaño =50, media = 20 y desviacion = 5 el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFHT(F- D) : clases= 6 Amplitud= 4 Rango ampliado= 24
En la informacion previa se puede observar que al aumentar el tamaño de la muestra de 30 a 50 la rutina TFH7 muestra menor variabilidad en cuanto al cambio en el numero de clases al incrementarse en una unidad, mientras que las rutinas TFH8 y TFH9 lo hacen en dos unidades.Es de anotar que las tres rutinas generan numero de clases dentro del rango recomendado.
Desde el punto de vista grafico los tres metodos suiguen presentando poligonos de frecuencias con datos ajustandos en torno a la media.
Para la muestra N4 con tamaño =100, media = 20 y desviacion = 5 el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFH9(F- D) : clases= 9 Amplitud= 4 Rango ampliado= 36
En la informacion previa se puede observar que al aumentar el tamaño de la muestra de 50 a 100 la rutina TFH7 suigue mostrando menor variabilidad en cuanto al incremento del numero de clases al incrementarse en una unidad, mientras que las rutinas TFH8 y TFH9 incrementan en tres unidades. Es de anotar que las tres rutinas se mantienen dentro del rango recomendado para el número de clases.
Desde el punto de vista grafico los tres metodos presentan sesgo hacia la derecha.
TFH7(N5)
## n= 21 max= 70.1 min= 9.8 Rango= 60.3 clases= 6 Amplitud= 11 Rango ampliado= 66
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 9.8 20.8 15.3 15 15 0.71
## 2 20.8 31.8 26.3 5 20 0.24
## 3 31.8 42.8 37.3 0 20 0.00
## 4 42.8 53.8 48.3 0 20 0.00
## 5 53.8 64.8 59.3 0 20 0.00
## 6 64.8 75.8 70.3 1 21 0.05
## Frec- Rel-Acum
## 1 0.71
## 2 0.95
## 3 0.95
## 4 0.95
## 5 0.95
## 6 1.00
TFH8(N5)
## n= 21 max= 70.1 min= 9.8 Rango= 60.3 clases= 5 Amplitud= 13 Rango ampliado= 65
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 9.8 22.8 16.3 18 18 0.86
## 2 22.8 35.8 29.3 2 20 0.10
## 3 35.8 48.8 42.3 0 20 0.00
## 4 48.8 61.8 55.3 0 20 0.00
## 5 61.8 74.8 68.3 1 21 0.05
## Frec- Rel-Acum
## 1 0.86
## 2 0.95
## 3 0.95
## 4 0.95
## 5 1.00
TFH9(N5)
## n= 21 max= 70.1 min= 9.8 Rango= 60.3 clases= 18 Amplitud= 4 Rango ampliado= 72
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 9.8 13.8 11.8 3 3 0.14
## 2 13.8 17.8 15.8 5 8 0.24
## 3 17.8 21.8 19.8 10 18 0.48
## 4 21.8 25.8 23.8 2 20 0.10
## 5 25.8 29.8 27.8 0 20 0.00
## 6 29.8 33.8 31.8 0 20 0.00
## 7 33.8 37.8 35.8 0 20 0.00
## 8 37.8 41.8 39.8 0 20 0.00
## 9 41.8 45.8 43.8 0 20 0.00
## 10 45.8 49.8 47.8 0 20 0.00
## 11 49.8 53.8 51.8 0 20 0.00
## 12 53.8 57.8 55.8 0 20 0.00
## 13 57.8 61.8 59.8 0 20 0.00
## 14 61.8 65.8 63.8 0 20 0.00
## 15 65.8 69.8 67.8 0 20 0.00
## 16 69.8 73.8 71.8 1 21 0.05
## 17 73.8 77.8 75.8 0 21 0.00
## 18 77.8 81.8 79.8 0 21 0.00
## Frec- Rel-Acum
## 1 0.14
## 2 0.38
## 3 0.86
## 4 0.95
## 5 0.95
## 6 0.95
## 7 0.95
## 8 0.95
## 9 0.95
## 10 0.95
## 11 0.95
## 12 0.95
## 13 0.95
## 14 0.95
## 15 0.95
## 16 1.00
## 17 1.00
## 18 1.00
TFH7(N6)
## n= 31 max= 70.1 min= 10.3 Rango= 59.8 clases= 6 Amplitud= 10 Rango ampliado= 60
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 10.3 20.3 15.3 13 13 0.42
## 2 20.3 30.3 25.3 16 29 0.52
## 3 30.3 40.3 35.3 1 30 0.03
## 4 40.3 50.3 45.3 0 30 0.00
## 5 50.3 60.3 55.3 0 30 0.00
## 6 60.3 70.3 65.3 1 31 0.03
## Frec- Rel-Acum
## 1 0.42
## 2 0.94
## 3 0.97
## 4 0.97
## 5 0.97
## 6 1.00
TFH8(N6)
## n= 31 max= 70.1 min= 10.3 Rango= 59.8 clases= 6 Amplitud= 10 Rango ampliado= 60
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 10.3 20.3 15.3 13 13 0.42
## 2 20.3 30.3 25.3 16 29 0.52
## 3 30.3 40.3 35.3 1 30 0.03
## 4 40.3 50.3 45.3 0 30 0.00
## 5 50.3 60.3 55.3 0 30 0.00
## 6 60.3 70.3 65.3 1 31 0.03
## Frec- Rel-Acum
## 1 0.42
## 2 0.94
## 3 0.97
## 4 0.97
## 5 0.97
## 6 1.00
TFH9(N6)
## n= 31 max= 70.1 min= 10.3 Rango= 59.8 clases= 12 Amplitud= 5 Rango ampliado= 60
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 10.3 15.3 12.8 7 7 0.23
## 2 15.3 20.3 17.8 6 13 0.19
## 3 20.3 25.3 22.8 10 23 0.32
## 4 25.3 30.3 27.8 6 29 0.19
## 5 30.3 35.3 32.8 1 30 0.03
## 6 35.3 40.3 37.8 0 30 0.00
## 7 40.3 45.3 42.8 0 30 0.00
## 8 45.3 50.3 47.8 0 30 0.00
## 9 50.3 55.3 52.8 0 30 0.00
## 10 55.3 60.3 57.8 0 30 0.00
## 11 60.3 65.3 62.8 0 30 0.00
## 12 65.3 70.3 67.8 1 31 0.03
## Frec- Rel-Acum
## 1 0.23
## 2 0.42
## 3 0.74
## 4 0.94
## 5 0.97
## 6 0.97
## 7 0.97
## 8 0.97
## 9 0.97
## 10 0.97
## 11 0.97
## 12 1.00
TFH7(N7)
## n= 51 max= 70.1 min= 7.6 Rango= 62.5 clases= 7 Amplitud= 9 Rango ampliado= 63
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 7.6 16.6 12.1 14 14 0.27
## 2 16.6 25.6 21.1 32 46 0.63
## 3 25.6 34.6 30.1 4 50 0.08
## 4 34.6 43.6 39.1 0 50 0.00
## 5 43.6 52.6 48.1 0 50 0.00
## 6 52.6 61.6 57.1 0 50 0.00
## 7 61.6 70.6 66.1 1 51 0.02
## Frec- Rel-Acum
## 1 0.27
## 2 0.90
## 3 0.98
## 4 0.98
## 5 0.98
## 6 0.98
## 7 1.00
TFH8(N7)
## n= 51 max= 70.1 min= 7.6 Rango= 62.5 clases= 8 Amplitud= 8 Rango ampliado= 64
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 7.6 15.6 11.6 10 10 0.20
## 2 15.6 23.6 19.6 30 40 0.59
## 3 23.6 31.6 27.6 10 50 0.20
## 4 31.6 39.6 35.6 0 50 0.00
## 5 39.6 47.6 43.6 0 50 0.00
## 6 47.6 55.6 51.6 0 50 0.00
## 7 55.6 63.6 59.6 0 50 0.00
## 8 63.6 71.6 67.6 1 51 0.02
## Frec- Rel-Acum
## 1 0.20
## 2 0.78
## 3 0.98
## 4 0.98
## 5 0.98
## 6 0.98
## 7 0.98
## 8 1.00
TFH9(N7)
## n= 51 max= 70.1 min= 7.6 Rango= 62.5 clases= 18 Amplitud= 4 Rango ampliado= 72
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 7.6 11.6 9.6 5 5 0.10
## 2 11.6 15.6 13.6 5 10 0.10
## 3 15.6 19.6 17.6 17 27 0.33
## 4 19.6 23.6 21.6 13 40 0.25
## 5 23.6 27.6 25.6 10 50 0.20
## 6 27.6 31.6 29.6 0 50 0.00
## 7 31.6 35.6 33.6 0 50 0.00
## 8 35.6 39.6 37.6 0 50 0.00
## 9 39.6 43.6 41.6 0 50 0.00
## 10 43.6 47.6 45.6 0 50 0.00
## 11 47.6 51.6 49.6 0 50 0.00
## 12 51.6 55.6 53.6 0 50 0.00
## 13 55.6 59.6 57.6 0 50 0.00
## 14 59.6 63.6 61.6 0 50 0.00
## 15 63.6 67.6 65.6 0 50 0.00
## 16 67.6 71.6 69.6 1 51 0.02
## 17 71.6 75.6 73.6 0 51 0.00
## 18 75.6 79.6 77.6 0 51 0.00
## Frec- Rel-Acum
## 1 0.10
## 2 0.20
## 3 0.53
## 4 0.78
## 5 0.98
## 6 0.98
## 7 0.98
## 8 0.98
## 9 0.98
## 10 0.98
## 11 0.98
## 12 0.98
## 13 0.98
## 14 0.98
## 15 0.98
## 16 1.00
## 17 1.00
## 18 1.00
TFH7(N8)
## n= 101 max= 70.1 min= 8.6 Rango= 61.5 clases= 8 Amplitud= 8 Rango ampliado= 64
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 8.6 16.6 12.6 28 28 0.28
## 2 16.6 24.6 20.6 51 79 0.50
## 3 24.6 32.6 28.6 20 99 0.20
## 4 32.6 40.6 36.6 1 100 0.01
## 5 40.6 48.6 44.6 0 100 0.00
## 6 48.6 56.6 52.6 0 100 0.00
## 7 56.6 64.6 60.6 0 100 0.00
## 8 64.6 72.6 68.6 1 101 0.01
## Frec- Rel-Acum
## 1 0.28
## 2 0.78
## 3 0.98
## 4 0.99
## 5 0.99
## 6 0.99
## 7 0.99
## 8 1.00
TFH8(N8)
## n= 101 max= 70.1 min= 8.6 Rango= 61.5 clases= 12 Amplitud= 6 Rango ampliado= 72
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 8.6 14.6 11.6 16 16 0.16
## 2 14.6 20.6 17.6 41 57 0.41
## 3 20.6 26.6 23.6 35 92 0.35
## 4 26.6 32.6 29.6 7 99 0.07
## 5 32.6 38.6 35.6 1 100 0.01
## 6 38.6 44.6 41.6 0 100 0.00
## 7 44.6 50.6 47.6 0 100 0.00
## 8 50.6 56.6 53.6 0 100 0.00
## 9 56.6 62.6 59.6 0 100 0.00
## 10 62.6 68.6 65.6 0 100 0.00
## 11 68.6 74.6 71.6 1 101 0.01
## 12 74.6 80.6 77.6 0 101 0.00
## Frec- Rel-Acum
## 1 0.16
## 2 0.56
## 3 0.91
## 4 0.98
## 5 0.99
## 6 0.99
## 7 0.99
## 8 0.99
## 9 0.99
## 10 0.99
## 11 1.00
## 12 1.00
TFH9(N8)
## n= 101 max= 70.1 min= 8.6 Rango= 61.5 clases= 19 Amplitud= 4 Rango ampliado= 76
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 8.6 12.6 10.6 11 11 0.11
## 2 12.6 16.6 14.6 17 28 0.17
## 3 16.6 20.6 18.6 29 57 0.29
## 4 20.6 24.6 22.6 22 79 0.22
## 5 24.6 28.6 26.6 16 95 0.16
## 6 28.6 32.6 30.6 4 99 0.04
## 7 32.6 36.6 34.6 0 99 0.00
## 8 36.6 40.6 38.6 1 100 0.01
## 9 40.6 44.6 42.6 0 100 0.00
## 10 44.6 48.6 46.6 0 100 0.00
## 11 48.6 52.6 50.6 0 100 0.00
## 12 52.6 56.6 54.6 0 100 0.00
## 13 56.6 60.6 58.6 0 100 0.00
## 14 60.6 64.6 62.6 0 100 0.00
## 15 64.6 68.6 66.6 0 100 0.00
## 16 68.6 72.6 70.6 1 101 0.01
## 17 72.6 76.6 74.6 0 101 0.00
## 18 76.6 80.6 78.6 0 101 0.00
## 19 80.6 84.6 82.6 0 101 0.00
## Frec- Rel-Acum
## 1 0.11
## 2 0.28
## 3 0.56
## 4 0.78
## 5 0.94
## 6 0.98
## 7 0.98
## 8 0.99
## 9 0.99
## 10 0.99
## 11 0.99
## 12 0.99
## 13 0.99
## 14 0.99
## 15 0.99
## 16 1.00
## 17 1.00
## 18 1.00
## 19 1.00
para la muestra N1 con tamaño =21 y un dato atipico el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFH9(F- D) : clases= 6 Amplitud= 10 Rango ampliado= 60
En la informacion previa se puede observar que la rutina TFH8 es altamente sensible a datos atipicos hasta el punto que presenta un incremento inapropiado en el numero de clases a pesar de que el tamaño de la muestra es relativamente pequeño.en cuanto a las otras dos rutinas tienden a realizar un aumento significativo en la amplitud de las clases para absorver el dato atipico
Desde el punto de vista grafico los tres metodos tienden a presentar poligonos de frecuencias con sesgo pronuciado hacia la derecha.
Para la muestra N6 con tamaño =31 el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFH9(F- D) : clases= 12 Amplitud= 5 Rango ampliado= 60
En la informacion previa se puede observar que la rutina TFH7 presenta un comportamiento estable en cuanto a la variacion en el numero de clases el cual fue de 1 unidad pasando de 5 a 6, a diferencia de las otras que registran cambios de 18 a 12 y de 6 a 12 clases respectivamente.
Desde el punto de vista grafico los tres metodos siguen presentando sesgo hacia la derecha.
Para la muestra N7 con tamaño =51 el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFH9(F- D) : clases= 18 Amplitud= 4 Rango ampliado= 72
En la informacion previa se puede observar que al aumentar el tamaño de la muestra de 31 a 51 la rutina TFH7 muestra menor variabilidad en cuanto al cambio en el numero de clases al incrementarse en una unidad, mientras que las rutinas TFH8 y TFH9 lo hacen en dos y sies unidades respectivamente.
Desde el punto de vista grafico los tres metodos suiguen presentando poligonos de frecuencias con datos sesgados hacia la derecha.
Para la muestra N4 con tamaño =101, media = 20 y desviacion = 5 el comportamiento presentado por cada rutina en cuanto al numero y amplitud de clases es el suiguiente:
Rutina TFH9(F- D) : clases= 19 Amplitud= 4 Rango ampliado= 76
En la informacion previa se puede observar que al aumentar el tamaño de la muestra de 51 a 101 la rutina FH7 suigue mostrando menor variabilidad en cuanto al incremento del numero de clases al incrementarse en una unidad.
Desde el punto de vista grafico los tres metodos siguen presentando un sesgo marcado hacia la derecha.
TFH7(N9)
## n= 205 max= 17.4 min= 0.1 Rango= 17.3 clases= 9 Amplitud= 2 Rango ampliado= 18
##
## Lim-inf. Lim-sup. Marca-clase. Frec-Abs. Frec-Abs-Acum. frec-Rel
## 1 0.1 2.1 1.1 109 109 0.53
## 2 2.1 4.1 3.1 52 161 0.25
## 3 4.1 6.1 5.1 20 181 0.10
## 4 6.1 8.1 7.1 12 193 0.06
## 5 8.1 10.1 9.1 4 197 0.02
## 6 10.1 12.1 11.1 0 197 0.00
## 7 12.1 14.1 13.1 6 203 0.03
## 8 14.1 16.1 15.1 1 204 0.00
## 9 16.1 18.1 17.1 1 205 0.00
## Frec- Rel-Acum
## 1 0.53
## 2 0.79
## 3 0.88
## 4 0.94
## 5 0.96
## 6 0.96
## 7 0.99
## 8 1.00
## 9 1.00
1.¿Por qué después de aproximadamente 90 años los libros de estadística y profesores de estadística siguen empleando “Sturges” en la actualidad?
Consideramos que es debido a lo sencillo que resulta emplear la regla de “Sturges”, antes las otras reglas con la que hemos trabajado a lo largo de este reto, del mismo modo cuando trabajamos con muestras pequeñas notamos que los histogramas elaborados mediante este método presentan un número de clases ajustado al rango recomendado entre 5 y 20, cosa diferente ocurre cuando empleamos a Scoot y Freedman- Diaconis.
2.¿Será que los trabajos de Scott y Freedman Diaconis no han sido muy aceptados por la comunidad de estadísticos? ¿Será que son completamente desconocidos dentro de nuestra sociedad de estadísticos (Latinoamérica)? ¿Sus algoritmos son más complejos para su ejecución?
Creemos que no han sido muy aceptados al notar que la mayoria de los paquetes estadísticos usan la regla de Sturges (o una extensión de ella) para seleccionar El número de clases al construir un histograma, del mismo modo la regla de Sturges casi siempre esta recomendada en los libros de texto estadísticos introductorios y esto como producto de que los histrogramas elaborados por los metodos de Scoot y Freedman- Diaconis, son altamente sensibles a datos atipicos y por su forma de determinar el numero de clases en la construcion de un histograma. Y al parecer la mayoria de estadistico prefieren trabajar con formulas que solo tenga encuenta el numero total de datos que con la cuasidesviación típica o el rango intercuartílico.
con el desarrollo de esta trabajo se pueden establecer las siguientes conclusiones:
cuando se trabajan con muestras pequeñas los histogramas elaborados mediante el método de Sturges presentan un número de clases ajustado al rango recomendado entre 5 y 20,mientras que los elaborados por los metodos de Scoot y Freedman- Diaconis generan numero de clases menores a la cantidad minima recomendada.
El método de Sturgues responde con estabilidad ante incrementos significativos en el tamaño de la muestra debido a que se basa en el teorema central del limite, aumentando la densidad de las clases cercanas a la media en vez de aumentar significativmente el número total de clases.
los histrogramas elaborados por los metodos de Scoot y Freedman- Diaconis, son altamente sensibles a datos atipicos debido a que sus calculos se basan en medidas de variabilidad como el rango intercuartilico y la desviacion.
Cabrera. S (2008) Estadística Descriptiva. Distribución de frecuencia. Extraído de https://wwwyyy.files.wordpress.com/2008/08/estadistica-generalteoria.pdf
Freedman, D. and Diaconis, P. (1981) On this histogram as a density estimator: L2 theory. Zeit. Wahr. ver. Geb., 57, 453–476.
Llinás, H., Rojas, C. (2015). Estadística Descriptiva y Distribuciones de Probabilidad. Ediciones Uninorte. Barranquilla.