itle: “2017_Secuelas en denticion permanente a partir de TDA denticion temporal”
utput: html_notebook

Los paquetes: Library “tidyverse”, “forcats”, “stringr”, “broom”, “ggthemes”

library("tidyverse")
## Loading tidyverse: ggplot2
## Loading tidyverse: tibble
## Loading tidyverse: tidyr
## Loading tidyverse: readr
## Loading tidyverse: purrr
## Loading tidyverse: dplyr
## Warning: package 'dplyr' was built under R version 3.4.2
## Conflicts with tidy packages ----------------------------------------------
## filter(): dplyr, stats
## lag():    dplyr, stats
library("ggthemes")
library("forcats")

cargo datos

Pacientes_TDA <- read_csv("~/Documents/R/2017_consecuencia TDA permanentes/Pacientes TDA.csv")
## Parsed with column specification:
## cols(
##   Edad = col_integer(),
##   Sexo = col_character(),
##   `Temporal afectado` = col_number(),
##   `diagnostico temporal` = col_character(),
##   `diagnostico permanente` = col_character(),
##   `Consecuencia en permanente` = col_character()
## )
summary(Pacientes_TDA)
##       Edad            Sexo           Temporal afectado
##  Min.   : 0.000   Length:67          Min.   :51.00    
##  1st Qu.: 2.000   Class :character   1st Qu.:51.00    
##  Median : 3.000   Mode  :character   Median :51.00    
##  Mean   : 3.373                      Mean   :56.37    
##  3rd Qu.: 4.500                      3rd Qu.:61.00    
##  Max.   :13.000                      Max.   :82.00    
##  diagnostico temporal diagnostico permanente Consecuencia en permanente
##  Length:67            Length:67              Length:67                 
##  Class :character     Class :character       Class :character          
##  Mode  :character     Mode  :character       Mode  :character          
##                                                                        
##                                                                        
## 

Agrupo datos (estos son categoricos)

Pacientes_TDA %>% 
  group_by(Sexo) %>% 
  summarise(n=n()) %>% 
  ungroup()
## # A tibble: 2 x 2
##        Sexo     n
##       <chr> <int>
## 1  Femenino    24
## 2 Masculino    43

Agrupo por Sexo y calculo promedio, sd y mediana de edad

Pacientes_TDA %>% 
  group_by(Sexo) %>% 
  summarise(n=n(), Promedio = mean(Edad), DE = sd(Edad), mediana=median(Edad)) %>% 
  ungroup()
## # A tibble: 2 x 5
##        Sexo     n Promedio       DE mediana
##       <chr> <int>    <dbl>    <dbl>   <dbl>
## 1  Femenino    24 3.625000 2.481453       3
## 2 Masculino    43 3.232558 2.147393       3
df2 <- Pacientes_TDA %>% 
  group_by(Sexo, `Consecuencia en permanente`) %>% 
  summarise(suma = n())   

Grafico para Sexo y consecuencia en permanente

df2 %>% 
  ggplot(aes(x = fct_reorder(Sexo, suma), 
             y = suma,  
             fill = `Consecuencia en permanente`, 
             label = suma)) + # le agrego la etiqueta que luego colocaré
  geom_col() +
  scale_fill_grey(start = .9, end = .7) + 
  geom_text(size = 3, position = position_stack(vjust = 0.5)) + # esta es la etiqueta
  labs(title = "Casos de secuela segun Sexo", 
       y = "Casos", 
       x = "Genero") + 
  theme_minimal() + # a menos que lo pidan explicitamente, ocupa el tema normal, mínimo o blanco y negro 
  theme(legend.position="right") +
  scale_fill_manual(values=c("lightblue", "indianred1"), name="Secuela")
## Scale for 'fill' is already present. Adding another scale for 'fill',
## which will replace the existing scale.

#Diferencias para diagnostico temporal y consencuencia en permanente ???

chisq <- table(Pacientes_TDA$`diagnostico temporal`,Pacientes_TDA$`Consecuencia en permanente`)
chisq.test(chisq)
## Warning in chisq.test(chisq): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  chisq
## X-squared = 5.3337, df = 7, p-value = 0.6193

Diferencias por diente temporal afectado y diagnostico temporal

chisq.test(Pacientes_TDA$`Temporal afectado`,Pacientes_TDA$`diagnostico temporal`)
## Warning in chisq.test(Pacientes_TDA$`Temporal afectado`, Pacientes_TDA
## $`diagnostico temporal`): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  Pacientes_TDA$`Temporal afectado` and Pacientes_TDA$`diagnostico temporal`
## X-squared = 42.069, df = 49, p-value = 0.7479

Existe diferencia entre edad y las consecuencias en el permanente???

chisq.test(Pacientes_TDA$Edad,Pacientes_TDA$`Consecuencia en permanente`)
## Warning in chisq.test(Pacientes_TDA$Edad, Pacientes_TDA$`Consecuencia en
## permanente`): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  Pacientes_TDA$Edad and Pacientes_TDA$`Consecuencia en permanente`
## X-squared = 14.793, df = 9, p-value = 0.09679

Leo el df

df <- read.csv("Pacientes TDA.csv")

Sumo las consecuencias (secuelas) por df en temporal

df %>% 
  group_by(diagnostico.temporal, Consecuencia.en.permanente) %>% 
  summarise(suma = n())   
## # A tibble: 15 x 3
## # Groups:   diagnostico.temporal [?]
##                diagnostico.temporal Consecuencia.en.permanente  suma
##                              <fctr>                     <fctr> <int>
##  1                        Avulsión                         si     1
##  2                       Extrusión                         no     1
##  3                       Extrusión                         si     1
##  4    Fractura coronaria complicada                         no     1
##  5    Fractura coronaria complicada                         si     6
##  6 Fractura coronaria no complicada                         no     2
##  7 Fractura coronaria no complicada                         si     5
##  8                   Fractura raíz                         no     4
##  9                   Fractura raíz                         si     3
## 10                       Intrusión                         no     2
## 11                       Intrusión                         si     4
## 12                Luxación lateral                         no     6
## 13                Luxación lateral                         si     8
## 14                     Subluxación                         no    12
## 15                     Subluxación                         si    11

Creo objeto df1

df1 <- df %>% 
  group_by(diagnostico.temporal, Consecuencia.en.permanente) %>% 
  summarise(suma = n())   

Grafico

df1 %>% 
ggplot(aes(x = fct_reorder(diagnostico.temporal, suma), # todos los gráficos de barra tienen un orden
             y = suma,  
             fill = Consecuencia.en.permanente, 
             label = suma)) + # le agrego la etiqueta que luego colocaré
  geom_col() + 
  scale_fill_grey(start = .9, end = .7) + 
  coord_flip() +
  geom_text(size = 3, position = position_stack(vjust = 0.5)) + # esta es la etiqueta
  labs(title = "Casos de secuela segun diagnostico TDA", # los títulos, mucho más sencillo
       y = "Casos", 
       x = "Diagnostico TDA") + 
  theme_minimal() + 
  theme(legend.position="right") +
  scale_fill_manual(values=c("lightblue", "indianred1"), name="Secuela")
## Scale for 'fill' is already present. Adding another scale for 'fill',
## which will replace the existing scale.

#ahora lo de edad

df3 <- df %>% 
  group_by(Edad, Consecuencia.en.permanente) %>% 
  summarise(suma = n()) 

Grafico para edad y consecuencia en permanente

df3 %>% 
ggplot(aes(x = Edad, 
             y = suma,  
             fill = Consecuencia.en.permanente, 
             label = suma)) + # le agrego la etiqueta que luego colocaré
  geom_col() +
  scale_fill_grey(start = .9, end = .7) + 
  geom_text(size = 3, position = position_stack(vjust = 0.5)) + # esta es la etiqueta
  labs(title = "Numero de casos segun Edad", # los títulos, mucho más sencillo
       y = "Casos", 
       x = "Edad") + 
  theme_minimal() + 
  theme(legend.position="right") +
  scale_fill_manual(values=c("lightblue", "indianred1"), name="Secuela") +
   scale_y_continuous(limit = c(0,15))
## Scale for 'fill' is already present. Adding another scale for 'fill',
## which will replace the existing scale.