Objetivo

Descripcion

1.- Cargar librerias.

library(ggplot2)
library(stringr)  # String
library(stringi)  # String
library(gtools)
library(dplyr)
library(knitr)

2.- Ejercicios a realizar

2.1. Ejercicio 1 (ejemplo)

  • Ejercicio de ejemplo proporcionado por el profesor.
  • Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)
discretas <- c(0,1)   # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,3)
probabilidades <- casos / n

acumulada <- cumsum(probabilidades)   # Acumulada

tabla <- data.frame(x=discretas, 
                    casos = casos,
                    f.prob.x = probabilidades,
                    F.acum.x = acumulada)
tabla
##   x casos f.prob.x F.acum.x
## 1 0  4997   0.9994   0.9994
## 2 1     3   0.0006   1.0000

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
    geom_point() + 
  geom_line()

2.2 Ejercicio 2

discretas <- c(1,2,3)  ## o nada  1 primer premio  2 segundo
n <- c(3000, 2000, 1000)
casos <- c(0.001,0.003,0.01)
probabilidades <- casos / n * 100
acumulada <- cumsum(probabilidades)

tabla <- data.frame(x = discretas,
                    Casos = casos,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   x Casos     f.prob.x     f.acum.x
## 1 1 0.001 3.333333e-05 3.333333e-05
## 2 2 0.003 1.500000e-04 1.833333e-04
## 3 3 0.010 1.000000e-03 1.183333e-03

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=f.acum.x)) +
    geom_point() + 
  geom_line()

2.3 Ejercicio 3

dato <- data.frame(X = c(0,1,2,3,4,5), probabilidades = c(0.1,0.2,0.1,0.4,0.1,0.1))
kable(dato, caption = "Tabla de datos del ejercicio")
Tabla de datos del ejercicio
X probabilidades
0 0.1
1 0.2
2 0.1
3 0.4
4 0.1
5 0.1

Solucion y procedimientos

discretas <- 0:5  ## o nada  1 primer premio  2 segundo
casos <- c(0.1,0.2,0.1,0.4,0.1,0.1)
probabilidades <- casos 
acumulada <- cumsum(probabilidades)

tabla <- data.frame(x = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   x f.prob.x f.acum.x
## 1 0      0.1      0.1
## 2 1      0.2      0.3
## 3 2      0.1      0.4
## 4 3      0.4      0.8
## 5 4      0.1      0.9
## 6 5      0.1      1.0

Grafica de barra

ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = x, y=f.acum.x)) +
    geom_point() + 
  geom_line()

2.4 Ejercicio 4

discretas <- 0:3  ## o nada  1 primer premio  2 segun
n <- 8
casos <- c(1,3,3,1)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)

tabla <- data.frame(Caras_X = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   Caras_X f.prob.x f.acum.x
## 1       0    0.125    0.125
## 2       1    0.375    0.500
## 3       2    0.375    0.875
## 4       3    0.125    1.000

Grafica de barra

ggplot(data = tabla, aes(x = Caras_X, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = Caras_X, y=f.acum.x)) +
    geom_point() + 
  geom_line()

2.5 Ejercicio 5

1.- En la siguiente tabla se presenta la distribución del número de hijos de un grupo de 100 parejas:

dato <- data.frame(hijos = c(0,1,2,3,4,5,7), Parejas = c(15,40,23,10,7,4,1))
kable(dato, caption = "Datos iniciales")
Datos iniciales
hijos Parejas
0 15
1 40
2 23
3 10
4 7
5 4
7 1

Solucion y procedimiento

discretas <- c(0,1,2,3,4,5,7)  ## o nada  1 primer premio  2 segun
n <- 100
casos <- c(15,40,23,10,7,4,1)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)

tabla <- data.frame(X = discretas,
                    f.prob.x = probabilidades,
                    f.acum.x = acumulada)
tabla
##   X f.prob.x f.acum.x
## 1 0     0.15     0.15
## 2 1     0.40     0.55
## 3 2     0.23     0.78
## 4 3     0.10     0.88
## 5 4     0.07     0.95
## 6 5     0.04     0.99
## 7 7     0.01     1.00

Grafica de barra

ggplot(data = tabla, aes(x = X, y=f.prob.x)) +
  geom_bar(stat="identity")

Grafica lineal acumulada

ggplot(data = tabla, aes(x = X, y=f.acum.x)) +
    geom_point() + 
  geom_line()

3.- Interpretacion del caso

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto?

  • La variable aleatoria se define por el numero de eventos que hay en el ejercicio.

3.2. ¿Qué valores puede tomar la variable aleatoria?

  • Culaquier valor numerico

3.3. ¿Cuál es el espacio muestral?

  • Una pequeña parte de todas los datos disponibles.

3.4. ¿Cuántos elementos hay en espacio muestral (S)?

  • puede varia dependiendo de cada quien, pero lo mas normar seria un 10% de todo la poblacion.

3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria?

  • En total hay 5 casos.

3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria?

  • la probabilidad mas grande de la variable aleatoria es de 40%

3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias.

3.7.1. Que sea exactamente igual a un valor de variable aleatoria

  • hay graficasos podemos identificar facilmente el porcentaje al momento de elegir exactamente una variable como en el ejemplo 3, la probabilidad de que salga cara en 2 monedas es del 37.5%

3.7.2. Qué sea menor o igual

  • Para este pregunta que sea menor o igual a cierto numero o porcentaje, saldria un porsenataje mayor ya que son en grupos. *por ejemplo en el ejercicio 5 la probabilidad de tener 2 o menos hijos es del 78%

3.7.3. Que sea mayor o igual

  • lo mismo que en lo anterior tomando de ejemplo el ejercicio 5 la probabilidad de tener 4 o mas hijos es del 5%.

3.7.4. Alguna otra pregunta del caso.

  • tomando como referencia el ejercicio 4 Cual seria la probabilidad de no obtener caras es del 12.5%

3.8. ¿Qué significado tiene el gráfico de barra?

  • En el podemos identificar cual caso o opciones que tenemos es la mas probable de todos o menos probable.

3.9. ¿Qué significado tiene el gráfico lineal acumulado?

  • Aqui podemos ver si las probabilidades estan correctas y ver cual tiene mas probabilidad de todas en forma lineal.