# Load packages
library(bayesrules)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(janitor)
## 
## Attaching package: 'janitor'
## 
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
# posibles árboles: infectados y no infectados 
Infected_data <- data.frame(Infected =  c("Yes","No"))

#probabilidades a priori para árboles infectados y no infectados
prior <- c(0.18, 0.82)

#Simulación con muestra tamaño n de árboles infectados 
#y no infectados para las probabilidades a priori correspondientes
set.seed(1384)
n <- 10000

Infected_data_sim<-sample_n(Infected_data,weight = prior, size = n, replace = TRUE)

#Conteo y porcentaje de categorías de árboles infectados (Yes , No) 
Infected_data_sim %>% 
  tabyl(Infected) %>% 
  adorn_totals("row")
##  Infected     n percent
##        No  8220   0.822
##       Yes  1780   0.178
##     Total 10000   1.000

El porcentaje de árboles infectados es 0.178 para el total de la muestra realizada.

#Para el caso de la especie maple tenemos los datos de P(M/I)=0.8 y P(M/Ic)=0.1
Infected_data_sim <- Infected_data_sim %>% 
  mutate(data_model = case_when(Infected == "Yes" ~ 0.8,
                                Infected == "No" ~ 0.1))

#Definición si es maple o no es maple el árbol
data_maple <- c("Other", "Maple")

#Simulación para árboles maples y otros
Infected_data_sim<- Infected_data_sim %>%
  group_by(1:n()) %>% 
  mutate(usage = sample(data_maple, size = 1, 
                        prob = c(1 - data_model, data_model)))

#Conteo de árboles infectados y no infectados según sean o no maples
Infected_data_sim %>% 
  tabyl(usage, Infected) %>% 
  adorn_totals(c("col","row"))
##  usage   No  Yes Total
##  Maple  852 1454  2306
##  Other 7368  326  7694
##  Total 8220 1780 10000
#ggplot
ggplot(Infected_data_sim, aes(x = Infected, fill = usage)) + 
  geom_bar(position = "fill")

ggplot(Infected_data_sim, aes(x = Infected)) + 
  geom_bar()

#Conteo y porcentajes de árboles maples infectados y no infectados 
Infected_data_sim %>% 
  filter(usage == "Maple") %>% 
  tabyl(Infected) %>% 
  adorn_totals("row")
##  Infected    n   percent
##        No  852 0.3694709
##       Yes 1454 0.6305291
##     Total 2306 1.0000000

El porcentaje de árboles infectados dentro de la especie “Maples” es 0.6305291 para la muestra realizada.