# install.packages("hrbrthemes", repos = "https://cinc.rud.is")
# remotes::install_github("hrbrmstr/hrbrthemes")
library(hrbrthemes)

Packages

# if (!require("pacman")) install.packages("pacman") # run in a new installation
pacman::p_load(tidyverse,  # for data science
               janitor    # for data cleaning 
                   )

Dataset

df <- read_csv("https://docs.google.com/spreadsheets/d/e/2PACX-1vRC_e2ZXPRKKpS0vKvvYthexz3YE9jNbBCSS4AjyZ3t7h7wEDDEVnKc2AtBr5vkXdERasonE8sYubwj/pub?gid=833410854&single=true&output=csv")
df <- df %>% 
  janitor::clean_names() %>% 
  janitor::remove_empty(which = c("rows", "cols"))
df <- df %>% 
  select(-marca_temporal)

EDA

head(df)
## # A tibble: 6 x 8
##   genero  edad lado  longitud_desde_… longitud_desde_… longitud_desde_…
##   <chr>  <dbl> <chr>            <dbl>            <dbl>            <dbl>
## 1 Mascu…    43 Dere…            25.0              6.04             4.82
## 2 Mascu…    43 Izqu…            23.1              5.18             3.95
## 3 Femen…    30 Dere…            18.9              5.59             4.77
## 4 Femen…    30 Izqu…             4.97             4.68             6.04
## 5 Femen…    37 Dere…            18.3              3.37             4.05
## 6 Femen…    37 Izqu…            19.8              4.68             5.56
## # … with 2 more variables:
## #   longitud_desde_base_mandibular_de_canino_a_mic <dbl>,
## #   ubicacion_tercio <chr>

Ubicacion tercio y genero

df %>% 
  with(mosaicplot(table(genero, ubicacion_tercio), shade = T))

chisq.test(table(df$genero, df$ubicacion_tercio))
## 
##  Pearson's Chi-squared test
## 
## data:  table(df$genero, df$ubicacion_tercio)
## X-squared = 4.9482, df = 2, p-value = 0.08424

Longitud y edad

df %>% 
  select(edad, longitud_desde_reborde_alveolar_de_canino_a_mic:longitud_desde_base_mandibular_de_canino_a_mic) %>% 
  pivot_longer(longitud_desde_reborde_alveolar_de_canino_a_mic:longitud_desde_base_mandibular_de_canino_a_mic, 
               names_to = "longitud", 
               values_to = "valor") %>% 
  mutate(longitud = str_replace(longitud, "longitud_desde_", ""), 
         longitud = str_replace_all(longitud, "[_]", " "), 
         longitud = str_to_sentence(longitud)) %>% 
  ggplot(aes(x = edad, y = valor, color = longitud)) + 
  geom_point(alpha = .5) +
  geom_smooth() + 
  theme_ipsum_rc() +
  labs(title = "Longitud por edad", 
       x = "Edad", 
       y = "Longitud (mm)", 
       color = "Tipo de Long", 
       caption="Datos Tesis Tito")