Los Objetivos De La Práctica

* El Objetivo General De La Práctica

A continuación se presenta el objetivo general de la práctica:

  • Explorar el contexto de las variables aleatorias continuas y su representación gráfica de histograma y la función de densidad.

* Los Objetivos Específicos De La Práctica

A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:

  • Cargar las librerías adecuadas del caso correspondiente.

  • Presentar el contexto de las variables aleatorias continuas.

  • Presentar La tabla de distribución a través de clases.

  • Representar visualmente los histogramas y la funcion de la densidad.

  • Presentar el desarrollo del caso realizado.

* Investigaciones Pertinentes

* La Probabilidad

La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.

Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.

Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.

* Las Variables Estadísticas

La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):

Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.

Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.

  • También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría medido en dólares. Las variables son del tipo cuantitativo (se expresan con un número)

Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.

  • Así, otra variable que podríamos encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa. Es decir, no se expresa con número.

Los Tipos De Variables Estadísticas

Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:

  • Variable Cuantitativa: Son variables que se expresan numéricamente.

    • Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.

    • Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.

  • Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.

    • Variable Ordinal: Expresa diferentes niveles y orden.

    • Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.

* Las Variables Cuantitativas Continuas

La definición propia de una variable cuantitativa continua es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):

Una variable aleatoria es continua, siempre y cuando la función de distribución que se encuentra asociada a ella sea continua.

Una variable aleatoria continua, por tanto, es un tipo de variable aleatoria. Como variable aleatoria, es una función matemática que muestra los resultados de un experimento aleatorio. Ahora bien, la característica que hace que sea continua es, precisamente, que, dentro del intervalo de resultados, esta puede tomar cualquier valor.

En otras palabras, pensemos en una variable aleatoria que tome valores enteros.

  • Por ejemplo, 1, 2 o 3. En este caso, la variable aleatoria no sería continua. Solo puede tomar el valor 1, el valor 2 o el valor 3. No puede, por ejemplo, tomar el valor 2,5 o 2,53. Si se tratara de una variable aleatoria continua, podría tomar cualquier valor en el intervalo de datos [1,3]. Por ejemplo, 1,02 o 2,067.

Cabe ser preciso, así como recalcar que una variable continua es un tipo de variable cuantitativa, o lo que es lo mismo, que se puede expresar mediante cifras. De esta forma, a parte de estos datos se pueden realizar análisis estadísticos y operaciones matemáticas.

La Función De Distribución De Una Variable Continua

Hemos dicho en la definición que una variable aleatoria se considera de tipo continua, siempre y cuando su función de distribución sea continua. Hasta ahora hemos visto una explicación intuitiva del concepto. Pero, se hace necesario realizar una explicación más detallada de ello.

La función de distribución de una variable aleatoria continua , la distribución de probabilidad es la integral de la función de densidad:

F(x) = P[X ≤ x],∀x ∈ R

Es decir, dada una variable aleatoria que llamamos X, su función de distribución se define como la fórmula anterior. La cual indica la probabilidad de que un valor determinado sea menor o igual que X.

* Desarrollo Metodológico De La Práctica

* Actividad No. 1 - Importar E Implementar Las Librerias

install.packages("pander")
install.packages("xtable")
install.packages("fdth")
library(pander)
library(xtable)
library(fdth)

* Actividad No. 2 - Los Valores Flotates (Ejemplo-Actividad)

* La Tabla De Distribución

Ejemplo extraído de: [@quintela2019], se debe instalar la librería “pander”. install.packages(“pander”) y xtable install.packages(“xtable”).

Se inicializan datos en una variable llamada numeros con valores flotantes que denotan tal vez una variable continua.

Se construye una tabla de distribución con siete clases.

numeros=c(2, 3, 4, 4.5, 4.5, 5.6, 5.7, 5.8, 6, 6.1, 6.5, 7, 7, 7, 7.5, 7.5, 7.5, 8.3, 9, 10.2, 10.4, 11, 11.1, 11.5, 12, 13)
div<-table(cut(numeros,breaks=7))
tabla1 <- data.frame(div)
names(tabla1) <- c("Intervalos", "Frecuencias ($n_i$)" )
x<- xtable(tabla1)
pander(x)
Intervalos Frecuencias (\(n_i\))
(1.99,3.57] 2
(3.57,5.14] 3
(5.14,6.71] 6
(6.71,8.29] 6
(8.29,9.86] 2
(9.86,11.4] 4
(11.4,13] 3

Esta clasificación o tabla de distribución denota las clases y el intervalo o rango de valores que hay en cada categoría. El indicar los intervalos de la forma \((a,b]\) indica que el dato \(a\) de una siguiente clase no se cuenta en esta clase pero si en la clase anterior, y sí se cuenta el dato \(b\).

Como alternativa, se puede emplear otro paquete llamado fdth utilizado en casos anteriores para representar tablas de distribución, generando intervalos o clases similares.

library(fdth)
tabla2 <- fdt(numeros, k = 7)
tabla2
##     Class limits f   rf rf(%) cf  cf(%)
##    [1.98,3.5729) 2 0.08  7.69  2   7.69
##  [3.5729,5.1657) 3 0.12 11.54  5  19.23
##  [5.1657,6.7586) 6 0.23 23.08 11  42.31
##  [6.7586,8.3514) 7 0.27 26.92 18  69.23
##  [8.3514,9.9443) 1 0.04  3.85 19  73.08
##  [9.9443,11.537) 5 0.19 19.23 24  92.31
##   [11.537,13.13) 2 0.08  7.69 26 100.00

* El Histograma

El gráfico para representar una variable continua con sus clases y sus frecuencia es el histograma.

Enla instrucción geom_histogram(aes(x = numeros), bins = 7), se representa el histograma en donde el argumento bins representa los cortes y numeros son los valores de la variable aleatoria continua inicialziada con anticipación.

library(ggplot2)
ggplot() +
  geom_histogram(aes(x = numeros), bins = 7, fill = "royalblue3") +
  labs(title="Histograma de los números ", x="Clases", y="Frecuencia") 

* La Densidad

Los conceptos de variable aleatoria continua y de función de densidad se definen a partir de la noción de probabilidad. Como una mera aproximación, se dice que la función de densidad sería el polígono de frecuencias que se construiría si se tuviese un conjunto infinito de datos.

En este caso, el polígono tendría la forma de una función matemática continua y derivable.

\[ \hat{f}_{h}(x_0)=\dfrac{1}{nh}\sum_{i=1}^{n}K\left( \dfrac{x_0-x_{i}}{h} \right) \]

\(K\) es una función (llamada núcleo o kernel) continua y derivable, y \(h\) es un parámetro llamado ventana (bandwidth), que ejerce un papel equivalente al del ancho de los intervalos en el histograma (o, equivalentemente, el número de intervalos). Se presenta el gráfico de densidad

ggplot() +
  geom_density(aes(x = numeros), col= 'royalblue3') +
    labs(title="Densidad de los números ", x="Clases", y="Densidad")

o bien convirtiendo las variable numeros a un dataframe y dibujando el histograma con la densidad al mismo tiempo y definiendo el ancho de clase a partir de tabla2breaks[3] que sería como restar \(3.5729 - 1.98 = 1.5929\) el valor de la primera clase en la tabla2, o la resta de los intervalos de cualquier otra clase en la propia tabla.

ancho <- tabla2$breaks[3]
datos <- data.frame(x = numeros) 
ggplot(data = datos, aes(x = x)) +
    geom_histogram(aes(y = ..density..), binwidth = ancho, fill = "royalblue3") + geom_density(col='green3') 
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

* Análisis Crítico De Los Datos Obtenidos

* Interpretación De La Práctica

En este caso se representó un histograma para una serie de datos simulados que representan precisamente variables aleatorias continuas.