library(ggplot2)
library(stringr) # Este dato es String
library(stringi) # Este dato es String
library(gtools)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
Para cada ejercicio, se describe y define el contexo
Se construye su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)
discretas <- c(0,1) # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,3)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 0 4997 0.9994 0.9994
## 2 1 3 0.0006 1.0000
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(color="black") +
geom_line(color="red")
Durante los últimos 300 días de operación, los datos de ventas muestran que hubo54 días en los que no se vendió ningún automóvil,117 días en los que se vendió 1 automóvil,72 días en los que se vendieron 2 automóviles,42 días en los que se vendieron 3 automóviles,12 días en los que se vendieron 4 automóviles y3 días en los que se vendieron 5 automóviles. ¿Cuál es la probabilida de que se venda exactamente un automoviles? ¿Cuál es la la probabilidad de que se venda al menos 2 automóviles? discretas <- 0:5 # c(0,1,2,3,4,5) n <- 300
Fuente: https://www.academia.edu/19264480/Estadistica_Distribucion_discreta
casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos /n
acumulada <- cumsum(probabilidades)
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 0 54 0.0108 0.0108
## 2 1 117 0.0234 0.0342
## 3 0 72 0.0144 0.0486
## 4 1 42 0.0084 0.0570
## 5 0 12 0.0024 0.0594
## 6 1 3 0.0006 0.0600
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
#geom_bar(stat="identity")
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point() +
geom_line()
Se lanza 3 moneda al aire. numero de caras obtenidas al lanzarlas
Fuente: http://www.mat.uda.cl/hsalinas/cursos/2010/eyp/tema4-variables-aleatorias.pdf
lanzadas <- c(0,1,2,3)
n <- 8
casos <- c(1,3,3,1)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades)
tabla <- data.frame(x=lanzadas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 0 1 0.125 0.125
## 2 1 3 0.375 0.500
## 3 2 3 0.375 0.875
## 4 3 1 0.125 1.000
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point(color="black") +
geom_line(color="red")
Con este caso comenzamos la unidad 3, estamos trabajando con las variables aleatorias discretas, en este caso en especial trabajamos con muchas graficas, mas que nada para poder tener una vsita un tanto diferente y poder interpretar de mejor manera los resultados y sobre todo poder observar lo mas importante del caso, se nos hizo las siguientes preguntas en las cuales plasmamos los resultados de nuestro caso:
Una variable aleatoria discreta es aquella cuya función de distribución es escalonada y en este caso son:
Ejercicio 1: 4997, 3 Ejercicio 2: 40, 39, 42, 38, 42, 39 Ejercicio 3: 1,3,3,1
Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores aleatorios como valores lógicos, funciones o cualquier tipo de elementos, y en este caso serian:
Ejercicio 1: toma los valores: 4997, 3 Ejercicio 2: toma los valores: 40, 39, 42, 38, 42, 39 Ejercicio 3: toma los valores: 1, 3, 3, 1
Ejercicio 1: 5000 boletos Ejercicio 2: 240 lanzamientos Ejercicio 3: 3 lanzamientos
Ejercicio 1: 2 elementos Ejercicio 2: 6 elementos Ejercicio 3: 4 elementos
Ejercicio 1: 2 casos Ejercicio 2: 6 casos Ejercicio 3: 4 casos
Ejercicio 1: 99.94%, 0.06% Ejercicio 2: 16.66%, 16.25%, 17.5%, 15.83%, 17.5%, 16.25% Ejercicio 3: 12.5%, 37.5%, 37.5%, 12.5%
La pobabilidad de que se vendan 3 juegos es 0.26
La probabilidad de que se vendan 5 juegos es 0.01
La probabilidad de que la moneda caiga en cara es 0.125
Es la forma de representar gráficamente el conjunto de datos mediante barras rectangulares de longitud proporcional a los valores representados.
Con este grafico podemos comprobar rápidamente el cambio de tendencia de los datos.