A continuación se presenta el objetivo general de la práctica:
A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:
Cargar las librerías adecuadas del caso correspondiente.
Presentar el contexto de las variables aleatorias continuas.
Presentar La tabla de distribución a través de clases.
Representar visualmente los histogramas y la funcion de la densidad.
Presentar el desarrollo del caso realizado.
La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.
Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.
Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.
La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):
Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.
Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:
Variable Cuantitativa: Son variables que se expresan numéricamente.
Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.
Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.
Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.
Variable Ordinal: Expresa diferentes niveles y orden.
Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.
La definición propia de una variable cuantitativa continua es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):
Una variable aleatoria es continua, siempre y cuando la función de distribución que se encuentra asociada a ella sea continua.
Una variable aleatoria continua, por tanto, es un tipo de variable aleatoria. Como variable aleatoria, es una función matemática que muestra los resultados de un experimento aleatorio. Ahora bien, la característica que hace que sea continua es, precisamente, que, dentro del intervalo de resultados, esta puede tomar cualquier valor.
En otras palabras, pensemos en una variable aleatoria que tome valores enteros.
Cabe ser preciso, así como recalcar que una variable continua es un tipo de variable cuantitativa, o lo que es lo mismo, que se puede expresar mediante cifras. De esta forma, a parte de estos datos se pueden realizar análisis estadísticos y operaciones matemáticas.
Hemos dicho en la definición que una variable aleatoria se considera de tipo continua, siempre y cuando su función de distribución sea continua. Hasta ahora hemos visto una explicación intuitiva del concepto. Pero, se hace necesario realizar una explicación más detallada de ello.
La función de distribución de una variable aleatoria continua , la distribución de probabilidad es la integral de la función de densidad:
F(x) = P[X ≤ x],∀x ∈ R
Es decir, dada una variable aleatoria que llamamos X, su función de distribución se define como la fórmula anterior. La cual indica la probabilidad de que un valor determinado sea menor o igual que X.
install.packages("pander")
install.packages("xtable")
install.packages("fdth")
library(pander)
library(xtable)
library(fdth)
Ejemplo extraído de: [@quintela2019], se debe instalar la librería “pander”. install.packages(“pander”) y xtable install.packages(“xtable”).
Se inicializan datos en una variable llamada numeros con valores flotantes que denotan tal vez una variable continua.
Se construye una tabla de distribución con siete clases.
numeros=c(2, 3, 4, 4.5, 4.5, 5.6, 5.7, 5.8, 6, 6.1, 6.5, 7, 7, 7, 7.5, 7.5, 7.5, 8.3, 9, 10.2, 10.4, 11, 11.1, 11.5, 12, 13)
div<-table(cut(numeros,breaks=7))
tabla1 <- data.frame(div)
names(tabla1) <- c("Intervalos", "Frecuencias ($n_i$)" )
x<- xtable(tabla1)
pander(x)
Intervalos | Frecuencias (\(n_i\)) |
---|---|
(1.99,3.57] | 2 |
(3.57,5.14] | 3 |
(5.14,6.71] | 6 |
(6.71,8.29] | 6 |
(8.29,9.86] | 2 |
(9.86,11.4] | 4 |
(11.4,13] | 3 |
Esta clasificación o tabla de distribución denota las clases y el intervalo o rango de valores que hay en cada categoría. El indicar los intervalos de la forma \((a,b]\) indica que el dato \(a\) de una siguiente clase no se cuenta en esta clase pero si en la clase anterior, y sí se cuenta el dato \(b\).
Como alternativa, se puede emplear otro paquete llamado fdth utilizado en casos anteriores para representar tablas de distribución, generando intervalos o clases similares.
library(fdth)
tabla2 <- fdt(numeros, k = 7)
tabla2
## Class limits f rf rf(%) cf cf(%)
## [1.98,3.5729) 2 0.08 7.69 2 7.69
## [3.5729,5.1657) 3 0.12 11.54 5 19.23
## [5.1657,6.7586) 6 0.23 23.08 11 42.31
## [6.7586,8.3514) 7 0.27 26.92 18 69.23
## [8.3514,9.9443) 1 0.04 3.85 19 73.08
## [9.9443,11.537) 5 0.19 19.23 24 92.31
## [11.537,13.13) 2 0.08 7.69 26 100.00
El gráfico para representar una variable continua con sus clases y sus frecuencia es el histograma.
Enla instrucción geom_histogram(aes(x = numeros), bins = 7), se representa el histograma en donde el argumento bins representa los cortes y numeros son los valores de la variable aleatoria continua inicialziada con anticipación.
library(ggplot2)
ggplot() +
geom_histogram(aes(x = numeros), bins = 7, fill = "royalblue3") +
labs(title="Histograma de los números ", x="Clases", y="Frecuencia")
Los conceptos de variable aleatoria continua y de función de densidad se definen a partir de la noción de probabilidad. Como una mera aproximación, se dice que la función de densidad sería el polígono de frecuencias que se construiría si se tuviese un conjunto infinito de datos.
En este caso, el polígono tendría la forma de una función matemática continua y derivable.
\[ \hat{f}_{h}(x_0)=\dfrac{1}{nh}\sum_{i=1}^{n}K\left( \dfrac{x_0-x_{i}}{h} \right) \]
\(K\) es una función (llamada núcleo o kernel) continua y derivable, y \(h\) es un parámetro llamado ventana (bandwidth), que ejerce un papel equivalente al del ancho de los intervalos en el histograma (o, equivalentemente, el número de intervalos). Se presenta el gráfico de densidad
ggplot() +
geom_density(aes(x = numeros), col= 'royalblue3') +
labs(title="Densidad de los números ", x="Clases", y="Densidad")
o bien convirtiendo las variable numeros a un dataframe y dibujando el histograma con la densidad al mismo tiempo y definiendo el ancho de clase a partir de tabla2breaks[3] que sería como restar \(3.5729 - 1.98 = 1.5929\) el valor de la primera clase en la tabla2, o la resta de los intervalos de cualquier otra clase en la propia tabla.
ancho <- tabla2$breaks[3]
datos <- data.frame(x = numeros)
ggplot(data = datos, aes(x = x)) +
geom_histogram(aes(y = ..density..), binwidth = ancho, fill = "royalblue3") + geom_density(col='green3')
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
En este caso se representó un histograma para una serie de datos simulados que representan precisamente variables aleatorias continuas.