# Load packages
library(bayesrules)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(janitor)
##
## Attaching package: 'janitor'
##
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
# posibles árboles: infectados y no infectados
Infected_data <- data.frame(Infected = c("Yes","No"))
#probabilidades a priori para árboles infectados y no infectados
prior <- c(0.18, 0.82)
#Simulación con muestra tamaño n de árboles infectados
#y no infectados para las probabilidades a priori correspondientes
set.seed(1384)
n <- 10000
Infected_data_sim<-sample_n(Infected_data,weight = prior, size = n, replace = TRUE)
#Conteo y porcentaje de categorías de árboles infectados (Yes , No)
Infected_data_sim %>%
tabyl(Infected) %>%
adorn_totals("row")
## Infected n percent
## No 8220 0.822
## Yes 1780 0.178
## Total 10000 1.000
El porcentaje de árboles infectados es 0.178 para el total de la muestra realizada.
#Para el caso de la especie maple tenemos los datos de P(M/I)=0.8 y P(M/Ic)=0.1
Infected_data_sim <- Infected_data_sim %>%
mutate(data_model = case_when(Infected == "Yes" ~ 0.8,
Infected == "No" ~ 0.1))
#Definición si es maple o no es maple el árbol
data_maple <- c("Other", "Maple")
#Simulación para árboles maples y otros
Infected_data_sim<- Infected_data_sim %>%
group_by(1:n()) %>%
mutate(usage = sample(data_maple, size = 1,
prob = c(1 - data_model, data_model)))
#Conteo de árboles infectados y no infectados según sean o no maples
Infected_data_sim %>%
tabyl(usage, Infected) %>%
adorn_totals(c("col","row"))
## usage No Yes Total
## Maple 852 1454 2306
## Other 7368 326 7694
## Total 8220 1780 10000
#ggplot
ggplot(Infected_data_sim, aes(x = Infected, fill = usage)) +
geom_bar(position = "fill")
ggplot(Infected_data_sim, aes(x = Infected)) +
geom_bar()
#Conteo y porcentajes de árboles maples infectados y no infectados
Infected_data_sim %>%
filter(usage == "Maple") %>%
tabyl(Infected) %>%
adorn_totals("row")
## Infected n percent
## No 852 0.3694709
## Yes 1454 0.6305291
## Total 2306 1.0000000
El porcentaje de árboles infectados dentro de la especie “Maples” es 0.6305291 para la muestra realizada.