library(ggplot2)
library(stringr)
## Warning: package 'stringr' was built under R version 4.0.3
library(stringi)
## Warning: package 'stringi' was built under R version 4.0.3
library(gtools)
## Warning: package 'gtools' was built under R version 4.0.3
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
Para cada ejercicio realizar lo siguiente:
Describir y definir el contexo del ejercicio, poner la referencia (enlace) del mismo.
Elaborar su tabla de probabilidad que contenga los valores de la variable aleatoria, la función de probabilidad y su función acumulada, la gráfica de barra de los valores de las variables aleatoria y la gráfica lineal de la función acumulada.
En algunos ejercicios trae consigo el espacio muestral de preferencia incorporarlo en el documento
Se venden 5000 billetes para una rifa a 1 euro cada uno. Existe un único premio de cierta cantidad, calcular los valores de las variables aleatorias y sus probabilidades para 0 para no gana y 1 para si gana cuando un comprador adquiere tres billetes. (Hero, n.d.)
Tabla de probabilidad
discretas <- c(0,1) # 0 Que no gane, 1 que gane
n <- 5000
casos <- c(4997,3)
probabilidades <- casos / n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 0 4997 0.9994 0.9994
## 2 1 3 0.0006 1.0000
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point() +
geom_line()
Las ventas de automóviles de una empresa
Durante los últimos 300 días de operación, los datos de ventas muestran que hubo
54 días en los que no se vendió ningún automóvil,
117 días en los que se vendió 1 automóvil,
72 días en los que se vendieron 2 automóviles,
42 días en los que se vendieron 3 automóviles,
12 días en los que se vendieron 4 automóviles y
3 días en los que se vendieron 5 automóviles.
¿Cuál es la probabilida de que se venda exactamente un automoviles?
¿Cuál es la la probabilidad de que se venda al menos 2 automóviles?
Tabla de probabilidad o Contingencia
discretas <- 0:5 # c(0,1,2,3,4,5)
n <- 300
casos <- c(54, 117, 72, 42, 12, 3)
probabilidades <- casos /n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 0 54 0.18 0.18
## 2 1 117 0.39 0.57
## 3 2 72 0.24 0.81
## 4 3 42 0.14 0.95
## 5 4 12 0.04 0.99
## 6 5 3 0.01 1.00
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
#geom_bar(stat="identity")
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point() +
geom_line()
En Estados Unidos un porcentaje de los niños de cuarto grado no pueden leer un libro adecuado a su edad. La tabla siguiente muestra, de acuerdo con las edades de entre 6 y 14 años, el número de niños que tienen problemas de lectura. La mayoría de estos niños tienen problemas de lectura que debieron ser detectados y corregidos antes del tercer grado.(Anderson et al., 2008)
discretas <- 6:14
#n <- '?'
casos <- c(37369, 87436, 160840,239719,286719,306533,310787,302604,289168)
n <- sum(casos)
probabilidades <- casos /n
acumulada <- cumsum(probabilidades) # Acumulada
tabla <- data.frame(x=discretas,
casos = casos,
f.prob.x = probabilidades,
F.acum.x = acumulada)
tabla
## x casos f.prob.x F.acum.x
## 1 6 37369 0.01848875 0.01848875
## 2 7 87436 0.04325998 0.06174874
## 3 8 160840 0.07957747 0.14132621
## 4 9 239719 0.11860378 0.25992999
## 5 10 286719 0.14185758 0.40178757
## 6 11 306533 0.15166079 0.55344837
## 7 12 310787 0.15376551 0.70721387
## 8 13 302604 0.14971687 0.85693075
## 9 14 289168 0.14306925 1.00000000
¿Cuál es la probabilida de elegir alumnos que tienen problemas de exactamente 10 años? es: 14.18%
¿Cuál es la probabilidad de encontrar alumnos por de 11 años o menos? 55.34%
ggplot(data = tabla, aes(x = x, y=f.prob.x)) +
geom_bar(stat="identity")
ggplot(data = tabla, aes(x = x, y=F.acum.x)) +
geom_point() +
geom_line()
3.1. ¿Cuál es la variable aleatoria y su significado en el contexto? 3.2. ¿Qué valores puede tomar la variable aleatoria? 3.3. ¿Cuál es el espacio muestral?, todos los elementos 3.4. ¿Cuántos elementos hay en espacio muestral (S)? 3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria? 3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria? 3.7. Resolver lo que se solicita encontrando al menos dos probabilidades de variables aleatorias. 3.7.1. Que sea exactamente igual a un valor de variable aleatoria 3.7.2. Qué sea menor o igual 3.7.3. Que sea mayor o igual 3.7.4. Alguna otra pregunta del caso. 3.8. ¿Qué significado tiene el gráfico de barra? 3.9. ¿Qué significado tiene el gráfico lineal acumulado?
**En el Caso número 14 se explicarán lo que es las variables aleatorias discretas, es un campo de variación que esta constituido por un conjunto finito o infinito numerable de valores posibles. Hablaremos de 3 ejercicios que se explican a continuación
En el ejercicio 1: trata sobre 5000 billetes para una rifa el cual valen 1 euro, en donde hay un único premio de cierta cantidad claramente, exactamente cuando un comprador adquiere 3 billetes y pues la probabilidad de que dicha persona pierda la rifa es del 99.94% ya que se dividen los boletos restantes que son 4997/5000 que en el denominador son el total de los boletos. Y la probabilidad de que gane es del 0.06% es ovio que las probabilidades de ganar son muy nulas
A continuación, unas preguntas:
¿Cuál es la variable aleatoria y su significado en el contexto? Es la que tiene como nombre casos ya que contiene los valores posibles que son el 4997 y el 3.
¿Qué valores puede tomar la variable aleatoria? A lo que se son los números reales. En este ejercicio son 49997 y 3.
¿Cuál es el espacio muestral?, todos los elementos. En este ejercicio es la n que contiene los 5000 billetes.
¿Cuántos elementos hay en espacio muestral (S)? son 2 elementos.
¿Cuántos casos hay de cada valor de cada variable aleatoria? Hay 2 casos.
¿Cuáles son las probabilidades más altas de cada variable aleatoria? Caso 1 son: 99.94%, y en el Caso 2 es: 0.06%.
¿Qué significado tiene el gráfico de barra? Es la forma de representar las probabilidades de ambos casos.
¿Qué significado tiene el gráfico lineal acumulado? Es lo mismo que el grafico de barras, pero este es representado en líneas y con puntos.
Ejercicio 2: en este ejercicio se trata sobre las ventas de automóviles de una empresa en los últimos 300 días de operación en el que en 54 días no se vendió ningún automóvil, en 117 días se vendió 1 automóvil, en 72 días se vendieron 2 automóviles, en 42 días se vendieron 3 automóviles, en 12 días se vendieron 4 automóviles y en 3 días fueron 5 automóviles, se desea saber ¿La probabilidad de que se venda exactamente un automóvil? Que fue de: 39% y la otra pregunta es ¿la probabilidad de que se venda al menos 2 automóviles? Y es del 24%.
¿Cuál es la variable aleatoria y su significado en el contexto? Es la que tiene como nombre casos y contiene los valores posibles que son el 54,117,72,42,12,3.
¿Qué valores puede tomar la variable aleatoria? En este ejercicio son 54,117,72,42,12,3.
¿Cuál es el espacio muestral?, todos los elementos. n que contiene los 300.
¿Cuántos elementos hay en espacio muestral (S)? son 6 elementos.
¿Cuántos casos hay de cada valor de cada variable aleatoria? Hay 6.
¿Cuáles son las probabilidades más altas de cada variable aleatoria? Caso 1 son: 18%, en el Caso 2 es: 39%, en el caso 3 es: 24%, en el 4 es: 14%, en el 5 es: .04% y en el caso 6 es del .01%.
Ejercicio 3: en el ejercicio 3 habla sobre los niños que no pueden leer libros de cuarto grado de acuerdo con las edades entre 6 y 14 años, ¿Cuál es la probabilidad de elegir alumnos que tienen problemas de exactamente 10 años? Y es el 14.18% y la que esta por de 11 años o menos es del 55.34%.
¿Cuál es la variable aleatoria y su significado en el contexto? Es la que tiene como nombre casos y contiene los valores posibles que son 37369,87436,160840,239719,306533,310787,302604,289168.
¿Qué valores puede tomar la variable aleatoria? En este ejercicio son 37369,87436,160840,239719,306533,310787,302604,289168.
¿Cuál es el espacio muestral?, todos los elementos. n que contiene los 2021175.
¿Cuántos elementos hay en espacio muestral (S)? son 9 elementos.
¿Cuántos casos hay de cada valor de cada variable aleatoria? Hay 9 casos.
¿Cuáles son las probabilidades más altas de cada variable aleatoria? Caso 1 son: .018%, en el Caso 2 es: .043%, en el caso 3 es: .079%, en el 4 es: 11%, en el 5 es: 14% y en el caso 6 es del 15%, en el 7 es del: 15%, en el 8 es del 14% y en el 9 es del 14%. **