Objetivo

Descripción

1.- Cargar librerias.

library(ggplot2)
library(stringr)
library(stringi)
library(gtools)
library(dplyr)
library(knitr)

2.- Ejercicios.

Para cada ejercicio realizar lo siguiente:

  • Describir y definir el contexo del ejercicio, poner la referencia (enlace) del mismo.
  • Elaborar su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
  • En algunos ejercicios trae consigo el espacio muestral de preferencia incorporarlo en el documento
  • Identificar a diferencia del caso 14:
    • ¿Cuál es el valor de la media de la distribución?
    • ¿Cuál es el valor de la varianza de la distribución?
    • ¿Cuál es el valor de desviación de la distribución?

2.1 Ejercicio 1 (ejemplo)

  • Ejercicio de ejemplo proporcionado por el profesor.
  • Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)
discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,50)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
              casos = casos,
              f.prob.x = probabilidades,
              F.acum.x = acumulada,
              x.f.prob.x = (discretas * probabilidades))
kable(tabla, caption = "Tabla de probabilidad con la columna para valor esperado")
Tabla de probabilidad con la columna para valor esperado
x casos f.prob.x F.acum.x x.f.prob.x
0 4997 0.9994 0.9994 0.00
1 50 0.0100 1.0094 0.01

VA Valor esperado (Media de la distribucion)

Su formula es:

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 0.01

Varianza

  • Su formula es: \[\alpha^2 = \sum(x-\mu)^2P(x)\]
  • Agregamos tabla con sus datos previamente generados.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x casos f.prob.x F.acum.x x.f.prob.x VE x-VE.cuad.f.prob.x
0 4997 0.9994 0.9994 0.00 0.01 0.0000999
1 50 0.0100 1.0094 0.01 0.01 0.0098010
Varianza <- sum((tabla$x - VE) ^ 2 * tabla$f.prob.x)
Varianza
## [1] 0.00990094

Desviacion Estandar

\[\sqrt{ \alpha^2}\]

desEstandar <- sqrt(Varianza)
desEstandar
## [1] 0.09950347

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )
Tabla de datos final
x casos f.prob.x F.acum.x x.f.prob.x VE x-VE.cuad.f.prob.x DesEstandar
0 4997 0.9994 0.9994 0.00 0.01 0.0000999 0.0995035
1 50 0.0100 1.0094 0.01 0.01 0.0098010 0.0995035

2.2 Ejercicio 2

discretas <- c(1,2,3)  ## o nada  1 primer premio  2 segundo
n <- c(3000, 2000, 1000)
casos <- c(0.001,0.003,0.01)
probabilidades <- casos / n * 100
acumulada <- cumsum(probabilidades)

tabla <- data.frame(x = discretas,
                    Casos = casos,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   x Casos     f.prob.x     f.acum.x
## 1 1 0.001 3.333333e-05 3.333333e-05
## 2 2 0.003 1.500000e-04 1.833333e-04
## 3 3 0.010 1.000000e-03 1.183333e-03

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 0.003333333

Varianza

  • Agregamos tabla con sus datos previamente generados.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x Casos f.prob.x f.acum.x VE x-VE.cuad.f.prob.x
1 0.001 3.33e-05 0.0000333 0.0033333 3.31e-05
2 0.003 1.50e-04 0.0001833 0.0033333 5.98e-04
3 0.010 1.00e-03 0.0011833 0.0033333 8.98e-03
Varianza <- sum((tabla$x - VE) ^ 2 * tabla$f.prob.x)
Varianza
## [1] 0.009611124

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar
## [1] 0.09803634

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )
Tabla de datos final
x Casos f.prob.x f.acum.x VE x-VE.cuad.f.prob.x DesEstandar
1 0.001 3.33e-05 0.0000333 0.0033333 3.31e-05 0.0980363
2 0.003 1.50e-04 0.0001833 0.0033333 5.98e-04 0.0980363
3 0.010 1.00e-03 0.0011833 0.0033333 8.98e-03 0.0980363

2.3 Ejercicio 3

dato <- data.frame(X = c(0,1,2,3,4,5), probabilidades = c(0.1,0.2,0.1,0.4,0.1,0.1))
kable(dato, caption = "Tabla de datos del ejercicio")
Tabla de datos del ejercicio
X probabilidades
0 0.1
1 0.2
2 0.1
3 0.4
4 0.1
5 0.1

Solucion y procedimientos

discretas <- 0:5  ## o nada  1 primer premio  2 segundo
casos <- c(0.1,0.2,0.1,0.4,0.1,0.1)
probabilidades <- casos 
acumulada <- cumsum(probabilidades)

tabla <- data.frame(x = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   x f.prob.x f.acum.x
## 1 0      0.1      0.1
## 2 1      0.2      0.3
## 3 2      0.1      0.4
## 4 3      0.4      0.8
## 5 4      0.1      0.9
## 6 5      0.1      1.0

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$x * tabla$f.prob.x)

VE
## [1] 2.5

Varianza

  • Agregamos tabla con sus datos previamente generados.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$x - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
x f.prob.x f.acum.x VE x-VE.cuad.f.prob.x
0 0.1 0.1 2.5 0.625
1 0.2 0.3 2.5 0.450
2 0.1 0.4 2.5 0.025
3 0.4 0.8 2.5 0.100
4 0.1 0.9 2.5 0.225
5 0.1 1.0 2.5 0.625
Varianza <- sum((tabla$x - VE) ^ 2 * tabla$f.prob.x)
Varianza
## [1] 2.05

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar
## [1] 1.431782

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )
Tabla de datos final
x f.prob.x f.acum.x VE x-VE.cuad.f.prob.x DesEstandar
0 0.1 0.1 2.5 0.625 1.431782
1 0.2 0.3 2.5 0.450 1.431782
2 0.1 0.4 2.5 0.025 1.431782
3 0.4 0.8 2.5 0.100 1.431782
4 0.1 0.9 2.5 0.225 1.431782
5 0.1 1.0 2.5 0.625 1.431782

2.4 Ejercicio 4

discretas <- 0:3  ## o nada  1 primer premio  2 segun
n <- 8
casos <- c(1,3,3,1)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)

tabla <- data.frame(Caras_X = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   Caras_X f.prob.x f.acum.x
## 1       0    0.125    0.125
## 2       1    0.375    0.500
## 3       2    0.375    0.875
## 4       3    0.125    1.000

Grafica de barra

ggplot(data = tabla, aes(x = Caras_X, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = Caras_X, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$Caras_X * tabla$f.prob.x)

VE
## [1] 1.5

Varianza

  • Agregamos tabla con sus datos previamente generados.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$Caras_X - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
Caras_X f.prob.x f.acum.x VE x-VE.cuad.f.prob.x
0 0.125 0.125 1.5 0.28125
1 0.375 0.500 1.5 0.09375
2 0.375 0.875 1.5 0.09375
3 0.125 1.000 1.5 0.28125
Varianza <- sum((tabla$Caras_X - VE) ^ 2 * tabla$f.prob.x)
Varianza
## [1] 0.75

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar
## [1] 0.8660254

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )
Tabla de datos final
Caras_X f.prob.x f.acum.x VE x-VE.cuad.f.prob.x DesEstandar
0 0.125 0.125 1.5 0.28125 0.8660254
1 0.375 0.500 1.5 0.09375 0.8660254
2 0.375 0.875 1.5 0.09375 0.8660254
3 0.125 1.000 1.5 0.28125 0.8660254

2.5 Ejercicio 5

dato <- data.frame(hijos = c(0,1,2,3,4,5,7), Parejas = c(15,40,23,10,7,4,1))
kable(dato, caption = "Datos iniciales")
Datos iniciales
hijos Parejas
0 15
1 40
2 23
3 10
4 7
5 4
7 1

Solucion y procedimiento

discretas <- c(0,1,2,3,4,5,7)  ## o nada  1 primer premio  2 segun
n <- 100
casos <- c(15,40,23,10,7,4,1)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)

tabla <- data.frame(X = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   X f.prob.x f.acum.x
## 1 0     0.15     0.15
## 2 1     0.40     0.55
## 3 2     0.23     0.78
## 4 3     0.10     0.88
## 5 4     0.07     0.95
## 6 5     0.04     0.99
## 7 7     0.01     1.00

Grafica de barra

ggplot(data = tabla, aes(x = X, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = X, y=f.acum.x)) +
    geom_point() + 
  geom_line()

VA Valor esperado (Media de la distribucion)

VE <- sum(tabla$X * tabla$f.prob.x)

VE
## [1] 1.71

Varianza

  • Agregamos tabla con sus datos previamente generados.
tabla <- cbind(tabla, 'VE' = VE, 'x-VE.cuad.f.prob.x' = (tabla$X - VE)^2 * tabla$f.prob.x)

kable(tabla, caption = "Tabla de probabilidad con valor esperado y columnas para varianza")
Tabla de probabilidad con valor esperado y columnas para varianza
X f.prob.x f.acum.x VE x-VE.cuad.f.prob.x
0 0.15 0.15 1.71 0.438615
1 0.40 0.55 1.71 0.201640
2 0.23 0.78 1.71 0.019343
3 0.10 0.88 1.71 0.166410
4 0.07 0.95 1.71 0.367087
5 0.04 0.99 1.71 0.432964
7 0.01 1.00 1.71 0.279841
Varianza <- sum((tabla$X - VE) ^ 2 * tabla$f.prob.x)
Varianza
## [1] 1.9059

Desviacion Estandar

desEstandar <- sqrt(Varianza)
desEstandar
## [1] 1.380543

Tabla de datos final

tabla <- cbind(tabla, 'DesEstandar' = desEstandar)
kable(tabla, caption = "Tabla de datos final" )
Tabla de datos final
X f.prob.x f.acum.x VE x-VE.cuad.f.prob.x DesEstandar
0 0.15 0.15 1.71 0.438615 1.380543
1 0.40 0.55 1.71 0.201640 1.380543
2 0.23 0.78 1.71 0.019343 1.380543
3 0.10 0.88 1.71 0.166410 1.380543
4 0.07 0.95 1.71 0.367087 1.380543
5 0.04 0.99 1.71 0.432964 1.380543
7 0.01 1.00 1.71 0.279841 1.380543

3.- Interpretacion del caso

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto?

  • La variable aleatoria se define por el numero de eventos que hay en el ejercicio.

3.2. ¿Qué valores puede tomar la variable aleatoria?

  • Culaquier valor numerico

3.3. ¿Cuál es el espacio muestral?

  • Una pequeña parte de todas los datos disponibles.

3.4. ¿Cuántos elementos hay en espacio muestral (S)?

  • puede varia dependiendo de cada quien, pero lo mas normar seria un 10% de todo la poblacion.

3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria?

  • En total hay 5 casos.

3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria?

  • la probabilidad mas grande de la variable aleatoria es de 40%

3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias.

3.7.1. Que sea exactamente igual a un valor de variable aleatoria

  • hay graficasos podemos identificar facilmente el porcentaje al momento de elegir exactamente una variable como en el ejemplo 3, la probabilidad de que salga cara en 2 monedas es del 37.5%

3.7.2. Qué sea menor o igual

  • Para este pregunta que sea menor o igual a cierto numero o porcentaje, saldria un porsenataje mayor ya que son en grupos. *por ejemplo en el ejercicio 5 la probabilidad de tener 2 o menos hijos es del 78%

3.7.3. Que sea mayor o igual

  • lo mismo que en lo anterior tomando de ejemplo el ejercicio 5 la probabilidad de tener 4 o mas hijos es del 5%.

3.7.4. Alguna otra pregunta del caso.

  • tomando como referencia el ejercicio 4 Cual seria la probabilidad de no obtener caras es del 12.5%

3.8. ¿Qué significado tiene el gráfico de barra?

  • En el podemos identificar cual caso o opciones que tenemos es la mas probable de todos o menos probable.

3.9. ¿Qué significado tiene el gráfico lineal acumulado?

  • Aqui podemos ver si las probabilidades estan correctas y ver cual tiene mas probabilidad de todas en forma lineal.

3.10. ¿Cuál es el valor de de la media de la distribución y qué significa?

  • Es el valor promedio de un conjunto de datos numéricos. El valor de la media de la distribucion es la suma de los casos por la probabilidad de estos mismos como en el ejemplo 5 nos da resultado un 1.7.

3.11. ¿Cuál es el valor de la varianza de la distribución y qué significa?

  • calcula la suma de los residuos elevados al cuadrado y divididos entre el total de observaciones, y esta es una medida de dispersion.

3.12. ¿Cuál es el valor de desviación de la distribución y qué significa?

  • Mide la dispersión, entre más dispersa está una distribución de datos, más grande es su desviación estándar. por ejemplo en el caso 3 tenemos una desviacion de 1.4 la mas grande en nuestros ejercicios.