funciones para variables discretas.

Objetivo:

Al finalizar la clase, los estudiantes podrán entender y utilizar las principales funciones en R para el análisis de variables discretas. También podrán interpretar los resultados obtenidos y aplicarlos en contextos estadísticos.

1. Introducción Teórica

¿Qué son las variables discretas?

Las variables discretas son aquellas que toman un número finito o contable de valores. Estas suelen representar conteos o categorías con valores enteros, como el número de hijos, la cantidad de autos en un garaje, etc.

Ejemplos: - Número de estudiantes en un aula. - Veces que se lanza un dado. - Aprobados en un examen.

En el contexto estadístico, el análisis de variables discretas incluye la utilización de distribuciones como la binomial, la de Poisson, y otras. En R, existen varias funciones que permiten trabajar con estas distribuciones y variables.

2. Funciones para Variables Discretas en R

A continuación, se describen algunas de las funciones más útiles para trabajar con variables discretas en R:

a) Distribución Binomial

La distribución binomial es útil para modelar experimentos donde hay dos posibles resultados (éxito o fracaso).

dbinom(5, 10, 0.3)# Calcula la probabilidad de obtener exactamente `x` éxitos en `size` intentos, donde cada intento tiene una probabilidad `prob` de éxito.
[1] 0.1029193
pbinom(5, 10, 0.3)# Calcula la probabilidad acumulada de obtener hasta `q` éxitos.
[1] 0.952651
rbinom(5, 10, 0.3)# Genera una muestra aleatoria de `n` valores que siguen una distribución binomial.
[1] 0 3 2 5 0

Ejemplo: # Probabilidad de obtener exactamente 3 éxitos en 10 intentos con una probabilidad de éxito de 0.5 dbinom(3, size = 10, prob = 0.5)

b) Distribución de Poisson

La distribución de Poisson modela la probabilidad de un número de eventos en un intervalo de tiempo o espacio.

  • dpois(x, lambda): Calcula la probabilidad de observar x eventos, dado un valor promedio lambda.
  • ppois(q, lambda): Calcula la probabilidad acumulada de observar hasta q eventos.
  • rpois(n, lambda): Genera una muestra aleatoria de n valores que siguen una distribución de Poisson.

Ejemplo:

# Probabilidad de observar exactamente 2 eventos con una tasa promedio de 3 #eventos por intervalo
dpois(2, lambda = 3)
[1] 0.2240418

c) Otras Funciones Útiles

  • table(): Crea una tabla de frecuencias para una variable discreta.
  • factor(): Convierte una variable categórica en un factor.
  • barplot(): Permite graficar las frecuencias de variables categóricas.

Ejemplo:

# Crear una variable discreta con categorías
x <- c('A', 'B', 'A', 'C', 'B', 'A', 'C')
table(x)
x
A B C 
3 2 2 
# Convertir a factor y graficar
x_factor <- factor(x)
barplot(table(x_factor))


3. Ejemplos Prácticos

A continuación, se presentan algunos ejemplos de cómo aplicar las funciones discutidas:

Ejemplo 1: Distribución Binomial

Supón que se realiza un experimento donde se lanza una moneda 10 veces. Queremos calcular la probabilidad de obtener exactamente 4 caras (éxito) y también la probabilidad acumulada de obtener hasta 4 caras.

# Probabilidad de exactamente 4 caras
dbinom(4, size = 10, prob = 0.5)
[1] 0.2050781
# Probabilidad acumulada de hasta 4 caras
pbinom(4, size = 10, prob = 0.5)
[1] 0.3769531

Ejemplo 2: Distribución de Poisson

Un cajero automático tiene un promedio de 5 clientes por hora. ¿Cuál es la probabilidad de que lleguen exactamente 3 clientes en una hora?

# Probabilidad de que lleguen exactamente 3 clientes
dpois(3, lambda = 5)
[1] 0.1403739

Ejemplo 3: Tabla de Frecuencias

Dada una encuesta sobre las preferencias de color de 10 personas, queremos crear una tabla de frecuencias y representarla gráficamente.

# Datos de la encuesta
colores <- c("Rojo", "Azul", "Rojo", "Verde", "Azul", "Azul", "Rojo", "Verde", "Azul", "Rojo")

# Tabla de frecuencias
frecuencias <- table(colores)

# Graficar la tabla de frecuencias
barplot(frecuencias, main='colores',col=c('blue','red','green'))


4. Ejercicios Propuestos

Para practicar, resuelve los siguientes ejercicios utilizando R:

Ejercicio 1:

Simula 20 lanzamientos de un dado y calcula la probabilidad de que el número 6 salga exactamente 5 veces. Usa la distribución binomial.

Ejercicio 2:

En una fábrica, el número promedio de defectos en una línea de producción es de 2 por hora. Usa la distribución de Poisson para calcular la probabilidad de que en una hora haya exactamente 1 defecto.

Ejercicio 3:

Dado un conjunto de datos que representa las preferencias de 15 personas por distintas marcas de café (marca A, B, C), crea una tabla de frecuencias y grafícala en un diagrama de barras.