Al finalizar la clase, los estudiantes podrán entender y utilizar las principales funciones en R para el análisis de variables discretas. También podrán interpretar los resultados obtenidos y aplicarlos en contextos estadísticos.
1. Introducción Teórica
¿Qué son las variables discretas?
Las variables discretas son aquellas que toman un número finito o contable de valores. Estas suelen representar conteos o categorías con valores enteros, como el número de hijos, la cantidad de autos en un garaje, etc.
Ejemplos: - Número de estudiantes en un aula. - Veces que se lanza un dado. - Aprobados en un examen.
En el contexto estadístico, el análisis de variables discretas incluye la utilización de distribuciones como la binomial, la de Poisson, y otras. En R, existen varias funciones que permiten trabajar con estas distribuciones y variables.
2. Funciones para Variables Discretas en R
A continuación, se describen algunas de las funciones más útiles para trabajar con variables discretas en R:
a) Distribución Binomial
La distribución binomial es útil para modelar experimentos donde hay dos posibles resultados (éxito o fracaso).
dbinom(5, 10, 0.3)# Calcula la probabilidad de obtener exactamente `x` éxitos en `size` intentos, donde cada intento tiene una probabilidad `prob` de éxito.
[1] 0.1029193
pbinom(5, 10, 0.3)# Calcula la probabilidad acumulada de obtener hasta `q` éxitos.
[1] 0.952651
rbinom(5, 10, 0.3)# Genera una muestra aleatoria de `n` valores que siguen una distribución binomial.
[1] 0 3 2 5 0
Ejemplo: # Probabilidad de obtener exactamente 3 éxitos en 10 intentos con una probabilidad de éxito de 0.5 dbinom(3, size = 10, prob = 0.5)
b) Distribución de Poisson
La distribución de Poisson modela la probabilidad de un número de eventos en un intervalo de tiempo o espacio.
dpois(x, lambda): Calcula la probabilidad de observar x eventos, dado un valor promedio lambda.
ppois(q, lambda): Calcula la probabilidad acumulada de observar hasta q eventos.
rpois(n, lambda): Genera una muestra aleatoria de n valores que siguen una distribución de Poisson.
Ejemplo:
# Probabilidad de observar exactamente 2 eventos con una tasa promedio de 3 #eventos por intervalodpois(2, lambda =3)
[1] 0.2240418
c) Otras Funciones Útiles
table(): Crea una tabla de frecuencias para una variable discreta.
factor(): Convierte una variable categórica en un factor.
barplot(): Permite graficar las frecuencias de variables categóricas.
Ejemplo:
# Crear una variable discreta con categoríasx <-c('A', 'B', 'A', 'C', 'B', 'A', 'C')table(x)
x
A B C
3 2 2
# Convertir a factor y graficarx_factor <-factor(x)barplot(table(x_factor))
3. Ejemplos Prácticos
A continuación, se presentan algunos ejemplos de cómo aplicar las funciones discutidas:
Ejemplo 1: Distribución Binomial
Supón que se realiza un experimento donde se lanza una moneda 10 veces. Queremos calcular la probabilidad de obtener exactamente 4 caras (éxito) y también la probabilidad acumulada de obtener hasta 4 caras.
# Probabilidad de exactamente 4 carasdbinom(4, size =10, prob =0.5)
[1] 0.2050781
# Probabilidad acumulada de hasta 4 caraspbinom(4, size =10, prob =0.5)
[1] 0.3769531
Ejemplo 2: Distribución de Poisson
Un cajero automático tiene un promedio de 5 clientes por hora. ¿Cuál es la probabilidad de que lleguen exactamente 3 clientes en una hora?
# Probabilidad de que lleguen exactamente 3 clientesdpois(3, lambda =5)
[1] 0.1403739
Ejemplo 3: Tabla de Frecuencias
Dada una encuesta sobre las preferencias de color de 10 personas, queremos crear una tabla de frecuencias y representarla gráficamente.
# Datos de la encuestacolores <-c("Rojo", "Azul", "Rojo", "Verde", "Azul", "Azul", "Rojo", "Verde", "Azul", "Rojo")# Tabla de frecuenciasfrecuencias <-table(colores)# Graficar la tabla de frecuenciasbarplot(frecuencias, main='colores',col=c('blue','red','green'))
4. Ejercicios Propuestos
Para practicar, resuelve los siguientes ejercicios utilizando R:
Ejercicio 1:
Simula 20 lanzamientos de un dado y calcula la probabilidad de que el número 6 salga exactamente 5 veces. Usa la distribución binomial.
Ejercicio 2:
En una fábrica, el número promedio de defectos en una línea de producción es de 2 por hora. Usa la distribución de Poisson para calcular la probabilidad de que en una hora haya exactamente 1 defecto.
Ejercicio 3:
Dado un conjunto de datos que representa las preferencias de 15 personas por distintas marcas de café (marca A, B, C), crea una tabla de frecuencias y grafícala en un diagrama de barras.