1 Gráfico de líneas

El gráfico de serie de tiempo se puede elaborar a través de un gráfico de líneas. Spotify es un conjunto de valores que se distribuye a lo largo del tiempo, un gráfico de línea o serie de tiempo es lo ideal para visualizarlo. Se puede apreciar que la canción “Despacito” fue la que mayor cantidad de reproducciones obtuvo, alcanzando el pico de 20M de reproducciones en Junio de 2017.

2 Gráfico de caja

Cuando se desea observar la variación que existe en una variable, el boxplot permite visualizar fácilmente la ubicación de los cuartiles, así como la existencia (o no) de puntos atípicos más allá de los “bigotes”. Basándonos en la mediana, Parece que Toyota es la marca que tiene más kilómetros recorridos antes de su primer re-venta, cabe señalar que es la que más variación presenta entre sus datos, teniendo además casi 10 valores muy atípicos por encima del 3er cuartil.

3 Gráficos de barras

Los gráficos de barra son ideales para visualizar variable categóricas. Cuando se emplea el apilado, es importante que no haya más de 3 categorías pues son complejos de analizar luego de observar la categoría de la base, este es útil para mostrar totales. Para hacer comparativas, suele ser más funcional el gráfico de barras agrupado. Existen dos funciones básicas: geom_bar es utilizado para hacer conteo de casos, geom_col representa las alturas de la barra en función de alguna variable.

4 Gráficos de barras con facet_wrap

La función facet_wrap permite segmentar gráficos de acuerdo a los niveles de una variable cualitativa

5 Gráficos de línea/pendiente

Para representar de forma simple la relación entre dos variables cualitativas, el gráfico de líneas o pendiente es una alternativa adecuada, sobre todo cuando las variables (factores) se pueden arreglar por niveles.

## # A tibble: 12 × 3
## # Groups:   Product_Category [3]
##    Product_Category Region    Sales
##    <chr>            <chr>     <dbl>
##  1 Furniture        Central 155294.
##  2 Furniture        East    196332.
##  3 Furniture        South   113067.
##  4 Furniture        West    196011.
##  5 Office Supplies  Central 115120.
##  6 Office Supplies  East    211784.
##  7 Office Supplies  South   112566.
##  8 Office Supplies  West    111898.
##  9 Technology       Central 177871.
## 10 Technology       East    184055.
## 11 Technology       South   131472.
## 12 Technology       West    218868.

6 Ejercicios individuales

A continuación se presentan 3 ejercicios de visualización presentados en clase sobre la base de datos ‘Super Store, iniciando con ’Total de ventas por Categoría de Producto según el Segmento del Cliente’ ## Total de ventas por Categoría de Producto según el Segmento del Cliente

## List of 136
##  $ line                            :List of 6
##   ..$ colour       : chr "black"
##   ..$ linewidth    : num 0.5
##   ..$ linetype     : num 1
##   ..$ lineend      : chr "butt"
##   ..$ arrow        : logi FALSE
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_line" "element"
##  $ rect                            :List of 5
##   ..$ fill         : chr "white"
##   ..$ colour       : chr "black"
##   ..$ linewidth    : num 0.5
##   ..$ linetype     : num 1
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_rect" "element"
##  $ text                            :List of 11
##   ..$ family       : chr ""
##   ..$ face         : chr "plain"
##   ..$ colour       : chr "black"
##   ..$ size         : num 11
##   ..$ hjust        : num 0.5
##   ..$ vjust        : num 0.5
##   ..$ angle        : num 0
##   ..$ lineheight   : num 0.9
##   ..$ margin       : 'margin' num [1:4] 0points 0points 0points 0points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : logi FALSE
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ title                           : NULL
##  $ aspect.ratio                    : NULL
##  $ axis.title                      : NULL
##  $ axis.title.x                    :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : NULL
##   ..$ vjust        : num 1
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 2.75points 0points 0points 0points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.title.x.top                :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : NULL
##   ..$ vjust        : num 0
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 0points 0points 2.75points 0points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.title.x.bottom             : NULL
##  $ axis.title.y                    :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : NULL
##   ..$ vjust        : num 1
##   ..$ angle        : num 90
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 0points 2.75points 0points 0points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.title.y.left               : NULL
##  $ axis.title.y.right              :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : NULL
##   ..$ vjust        : num 1
##   ..$ angle        : num -90
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 0points 0points 0points 2.75points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.text                       :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : chr "grey30"
##   ..$ size         : 'rel' num 0.8
##   ..$ hjust        : NULL
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : NULL
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.text.x                     :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : NULL
##   ..$ vjust        : num 1
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 2.2points 0points 0points 0points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.text.x.top                 :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : NULL
##   ..$ vjust        : num 0
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 0points 0points 2.2points 0points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.text.x.bottom              : NULL
##  $ axis.text.y                     :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : num 1
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 0points 2.2points 0points 0points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.text.y.left                : NULL
##  $ axis.text.y.right               :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : num 0
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 0points 0points 0points 2.2points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.text.theta                 : NULL
##  $ axis.text.r                     :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : num 0.5
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : 'margin' num [1:4] 0points 2.2points 0points 2.2points
##   .. ..- attr(*, "unit")= int 8
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ axis.ticks                      : list()
##   ..- attr(*, "class")= chr [1:2] "element_blank" "element"
##  $ axis.ticks.x                    : NULL
##  $ axis.ticks.x.top                : NULL
##  $ axis.ticks.x.bottom             : NULL
##  $ axis.ticks.y                    : NULL
##  $ axis.ticks.y.left               : NULL
##  $ axis.ticks.y.right              : NULL
##  $ axis.ticks.theta                : NULL
##  $ axis.ticks.r                    : NULL
##  $ axis.minor.ticks.x.top          : NULL
##  $ axis.minor.ticks.x.bottom       : NULL
##  $ axis.minor.ticks.y.left         : NULL
##  $ axis.minor.ticks.y.right        : NULL
##  $ axis.minor.ticks.theta          : NULL
##  $ axis.minor.ticks.r              : NULL
##  $ axis.ticks.length               : 'simpleUnit' num 2.75points
##   ..- attr(*, "unit")= int 8
##  $ axis.ticks.length.x             : NULL
##  $ axis.ticks.length.x.top         : NULL
##  $ axis.ticks.length.x.bottom      : NULL
##  $ axis.ticks.length.y             : NULL
##  $ axis.ticks.length.y.left        : NULL
##  $ axis.ticks.length.y.right       : NULL
##  $ axis.ticks.length.theta         : NULL
##  $ axis.ticks.length.r             : NULL
##  $ axis.minor.ticks.length         : 'rel' num 0.75
##  $ axis.minor.ticks.length.x       : NULL
##  $ axis.minor.ticks.length.x.top   : NULL
##  $ axis.minor.ticks.length.x.bottom: NULL
##  $ axis.minor.ticks.length.y       : NULL
##  $ axis.minor.ticks.length.y.left  : NULL
##  $ axis.minor.ticks.length.y.right : NULL
##  $ axis.minor.ticks.length.theta   : NULL
##  $ axis.minor.ticks.length.r       : NULL
##  $ axis.line                       : list()
##   ..- attr(*, "class")= chr [1:2] "element_blank" "element"
##  $ axis.line.x                     : NULL
##  $ axis.line.x.top                 : NULL
##  $ axis.line.x.bottom              : NULL
##  $ axis.line.y                     : NULL
##  $ axis.line.y.left                : NULL
##  $ axis.line.y.right               : NULL
##  $ axis.line.theta                 : NULL
##  $ axis.line.r                     : NULL
##  $ legend.background               : list()
##   ..- attr(*, "class")= chr [1:2] "element_blank" "element"
##  $ legend.margin                   : 'margin' num [1:4] 5.5points 5.5points 5.5points 5.5points
##   ..- attr(*, "unit")= int 8
##  $ legend.spacing                  : 'simpleUnit' num 11points
##   ..- attr(*, "unit")= int 8
##  $ legend.spacing.x                : NULL
##  $ legend.spacing.y                : NULL
##  $ legend.key                      : list()
##   ..- attr(*, "class")= chr [1:2] "element_blank" "element"
##  $ legend.key.size                 : 'simpleUnit' num 1.2lines
##   ..- attr(*, "unit")= int 3
##  $ legend.key.height               : NULL
##  $ legend.key.width                : NULL
##  $ legend.key.spacing              : 'simpleUnit' num 5.5points
##   ..- attr(*, "unit")= int 8
##  $ legend.key.spacing.x            : NULL
##  $ legend.key.spacing.y            : NULL
##  $ legend.frame                    : NULL
##  $ legend.ticks                    : NULL
##  $ legend.ticks.length             : 'rel' num 0.2
##  $ legend.axis.line                : NULL
##  $ legend.text                     :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : 'rel' num 0.8
##   ..$ hjust        : NULL
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : NULL
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ legend.text.position            : NULL
##  $ legend.title                    :List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : NULL
##   ..$ hjust        : num 0
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : NULL
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi TRUE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ legend.title.position           : NULL
##  $ legend.position                 : chr "right"
##  $ legend.position.inside          : NULL
##  $ legend.direction                : NULL
##  $ legend.byrow                    : NULL
##  $ legend.justification            : chr "center"
##  $ legend.justification.top        : NULL
##  $ legend.justification.bottom     : NULL
##  $ legend.justification.left       : NULL
##  $ legend.justification.right      : NULL
##  $ legend.justification.inside     : NULL
##  $ legend.location                 : NULL
##  $ legend.box                      : NULL
##  $ legend.box.just                 : NULL
##  $ legend.box.margin               : 'margin' num [1:4] 0cm 0cm 0cm 0cm
##   ..- attr(*, "unit")= int 1
##  $ legend.box.background           : list()
##   ..- attr(*, "class")= chr [1:2] "element_blank" "element"
##  $ legend.box.spacing              : 'simpleUnit' num 11points
##   ..- attr(*, "unit")= int 8
##   [list output truncated]
##  - attr(*, "class")= chr [1:2] "theme" "gg"
##  - attr(*, "complete")= logi TRUE
##  - attr(*, "validate")= logi TRUE

La gráfica nos muestra que la Categoría de Producto con mas ventas es ‘Technology’, después ‘Furniture’ y, finalmente ‘Office Supplies’. En cuanto al segmento de cliente, se ve en color verde como el segmento ’Corporate; es el que mas representa las ventas, lo cual es entendible pues son los que mas tendrían dinero, por así decirlo para comprar productos para sus oficinas.

6.1 Método de envío por el segmento de cliente

Se observa que el Método de Envío ‘Number of Air’ es el mas utilizado en todos los segmentos, después le sigue el ‘Delivery Truck’. Al igual que mi suposición en la gráfica pasada, el segmento ‘Corporate’ es el que me has tiene número de pedidos, debido a que tienen mas oportunidad económicamente.

6.2 Ventas totales de cada categoría por región

Los productos de la categoría de ‘Technology’ son los más vendidos en 2 regiones: ‘South’ y ‘West’, mientras que en ‘Central’ e ‘East’ ‘Office Supplies’ lleva mas ventaja.

7 Ggplot avanzado: diagramas de dispersión

8 Ggplot avanzado: boxplot con etiquetas personalizadas

---
title: "Líneas de Acción Estratégicas | María Sáenz Parás"
date: "2024-11-13"
output:
 html_document:
    toc: true
    toc_float: true
    toc_collapsed: true
    toc_depth: 1
    number_sections: true
    code_download: true
    theme: lumen
---


```{r, message=FALSE, echo=FALSE}
#install.packages("tidyverse")
library(tidyverse)
```

# <span style="color:#003399;">Gráfico de líneas</span>
El gráfico de serie de tiempo se puede elaborar a través de un gráfico de líneas. Spotify es un conjunto de valores que se distribuye a lo largo del tiempo, un gráfico de línea o serie de tiempo es lo ideal para visualizarlo. Se puede apreciar que la canción "Despacito" fue la que mayor cantidad de reproducciones obtuvo,  alcanzando el pico de 20M de reproducciones en Junio de 2017.  

```{r, message=FALSE, warning=FALSE, echo=FALSE}
spotify <- read.csv("spotify.csv")
view(spotify)


spotify_melted <- pivot_longer(spotify,Shape.of.You:Unforgettable,names_to = "Song",values_to = "Reproductions")
view(spotify_melted)

ggplot(spotify_melted,aes(Date,Reproductions,col=Song,linetype = Song)) +geom_line()+theme_minimal()+labs(x="Date")

ggplot(spotify_melted,aes(parse_datetime(Date),Reproductions,col=Song,linetype = Song)) +geom_line()+theme_minimal()+labs(x="Date")
```

# <span style="color:#003399;">Gráfico de caja</span>
Cuando se desea observar la variación que existe en una variable, el boxplot permite visualizar fácilmente la ubicación de los cuartiles, así como la existencia (o no) de puntos atípicos más allá de los "bigotes". Basándonos en la mediana, Parece que Toyota es la marca que tiene más kilómetros recorridos antes de su primer re-venta, cabe señalar que es la que más variación presenta entre sus datos, teniendo además casi 10 valores muy atípicos por encima del 3er cuartil. 

```{r, message=FALSE, echo=FALSE}
cars <- read.csv("Carsdataset.csv")
view(cars)
#names(cars)
options(scipen = 999)

cars %>% 
  filter(brand %in% c("Toyota","Volkswagen","Honda","Ford","Audi","BMW")) %>% 
  filter(km_driven<1500000) %>% 
  filter(owner=="First Owner") %>% 
  ggplot(aes(x=brand,y=km_driven,fill=brand))+geom_boxplot()+theme_minimal()+theme(axis.text.x = element_text(angle = 45))+labs(x="Car brand",y="Kms driven",title="Kms driven before 1st re-sale")

```

# <span style="color:#003399;">Gráficos de barras</span>
Los gráficos de barra son ideales para visualizar variable categóricas. Cuando se emplea el apilado, es importante que no haya más de 3 categorías pues son complejos de analizar luego de observar la categoría de la base, este es útil para mostrar totales. Para hacer comparativas, suele ser más funcional el gráfico de barras agrupado. Existen dos funciones básicas: geom_bar es utilizado para hacer conteo de casos, geom_col representa las alturas de la barra en función de alguna variable. 

```{r, message=FALSE, echo=FALSE}
store <- read.csv("SuperStoreUS.csv")

#glimpse(store)

options(scipen = 999)

ggplot(store,aes(x=Customer_Segment,fill=Ship_Mode))+geom_bar(position="dodge")+theme_minimal()+labs(x="Customer segment",y="Number of orders")

ggplot(store,aes(x=Customer_Segment,fill=Ship_Mode))+geom_bar(position="stack")+theme_minimal()+labs(x="Customer segment",y="Number of orders")

ggplot(store,aes(x=Customer_Segment,y=Sales,fill=Ship_Mode))+geom_col(position="stack")+theme_minimal()+labs(x="Customer segment",y="Total Sales")
```

# <span style="color:#003399;">Gráficos de barras con facet_wrap</span>
La función facet_wrap permite segmentar gráficos de acuerdo a los niveles de una variable cualitativa
```{r, message=FALSE, echo=FALSE}
store %>% 
  ggplot(aes(x=Product_Category,y=Sales,label=sum(Sales),fill=Customer_Segment))+geom_col(position = "stack")+theme_minimal()+labs(x="Product Category",y="Total sales")+facet_wrap(~Region)


```

# <span style="color:#003399;">Gráficos de línea/pendiente</span>
Para representar de forma simple la relación entre dos variables cualitativas, el gráfico de líneas o pendiente es una alternativa adecuada, sobre todo cuando las variables (factores) se pueden arreglar por niveles. 

```{r, warning=FALSE, message=FALSE,  echo=FALSE}
store2 <- store %>% 
  group_by(Product_Category,Region) %>% 
  summarise(Sales=sum(Sales))
store2

ggplot(store2,aes(x=Product_Category,y=Sales,col=Region,group=Region))+geom_line()+geom_point()+theme_minimal()
```



# <span style="color:#003399;">Ejercicios individuales</span>
A continuación se presentan 3 ejercicios de visualización presentados en clase sobre la base de datos 'Super Store, iniciando con 'Total de ventas por Categoría de Producto según el Segmento del Cliente'
## <span style="color:#003399;">Total de ventas por Categoría de Producto según el Segmento del Cliente</span>

```{r, echo=FALSE}
ggplot(store, aes(x = Product_Category, y = Sales, fill = Customer_Segment)) +
  geom_col(position = "stack")+
  labs(title = "Total de Ventas por Categoría de Producto según el Segmento del Cliente",
       x = "Categoría de Producto", y = "Total de Ventas", fill = "Customer Segment")
#+scale_y_continuos(breaks=c(100000,200000,300000,400000,500000,600000,700000)), #labels=c("100k", "200k", "300k", "400k", "500k", "600k", "700k")+
  theme_minimal()
```
La gráfica nos muestra que la Categoría de Producto con mas ventas es 'Technology', después 'Furniture' y, finalmente 'Office Supplies'. En cuanto al segmento de cliente, se ve en color verde como el segmento 'Corporate; es el que mas representa las ventas, lo cual es entendible pues son los que mas tendrían dinero, por así decirlo para comprar productos para sus oficinas. 

## <span style="color:#003399;">Método de envío por el segmento de cliente</span>
```{r, echo=FALSE}
ggplot(store, aes(x = Customer_Segment, fill = Ship_Mode)) +
  geom_bar(position = "dodge") +
  labs(title = "Método de Envío por Segmento de Cliente",
       x = "Customer Segment", y = "Number of Orders", fill = "Método de Envío") +
  theme_minimal()

```
Se observa que el Método de Envío 'Number of Air' es el mas utilizado en todos los segmentos, después le sigue el 'Delivery Truck'. Al igual que mi suposición en la gráfica pasada, el segmento 'Corporate' es el que me has tiene número de pedidos, debido a que tienen mas oportunidad económicamente. 

## <span style="color:#003399;">Ventas totales de cada categoría por región</span>
```{r, echo=FALSE}
ggplot(store, aes(x = Product_Category, y = Sales, fill = Region)) +
  geom_col(position = "dodge") +
  facet_wrap(~ Region) +
  labs(title = "Ventas Totales por Categoría en Cada Región",
       x = "Categoría de Producto", y = "Ventas Totales") +
  theme_minimal()

```
Los productos de la categoría de 'Technology' son los más vendidos en 2 regiones: 'South' y 'West', mientras que en 'Central' e 'East' 'Office Supplies' lleva mas ventaja.

# <span style="color:#003399;">Ggplot avanzado: diagramas de dispersión</span>

```{r, message=FALSE, warning=FALSE, echo=FALSE}
#install.packages("car")
library(car)
view(Salaries)

Salaries %>% 
  ggplot(aes(x=yrs.since.phd,y=salary))+geom_point()

Salaries %>% 
  ggplot(aes(x=yrs.since.phd,y=salary,color=rank))+geom_point()+theme_minimal()

#Now, let's change to geom_jitter, change the shape in function of the discipline, add a linear model while facetting by sex, finally, we will add axis legend labels. 

Salaries %>% 
  ggplot(aes(x=yrs.since.phd,y=salary,color=rank))+geom_jitter()+theme_minimal()


Salaries %>% 
  ggplot(aes(x=yrs.since.phd,y=salary))+geom_jitter(aes(color=rank,shape=discipline))+theme_minimal()

Salaries %>% 
  ggplot(aes(x=yrs.since.phd,y=salary))+geom_jitter(aes(color=rank,shape=discipline))+theme_minimal()+facet_wrap(~sex)+geom_smooth(method = lm)

Salaries %>% 
  ggplot(aes(x=yrs.since.phd,y=salary))+geom_jitter(aes(color=rank,shape=discipline))+theme_minimal()+facet_wrap(~sex)+geom_smooth(method = lm)+labs(title="Salary vs years since PhD",x="Years since PhD",y="Income",color="Position",shape="Research area")




```


# <span style="color:#003399;">Ggplot avanzado: boxplot con etiquetas personalizadas</span>
```{r, message=FALSE, warning=FALSE, echo=FALSE}

#Gráfico de caja para comparar los salarios por género, filtraremos salarios menores a 200,000 para descartar algunos puntos atípicos. En el eje x se desea observar el rango del profesor. 

Salaries %>% 
  filter(salary<200000) %>% 
  ggplot(aes(x=rank,y=salary,fill=sex))+geom_boxplot(alpha=0.5)+theme_minimal()

Salaries %>% 
  filter(salary<200000) %>% 
  ggplot(aes(x=rank,y=salary,fill=sex))+geom_boxplot(alpha=0.5)+theme_minimal()+
  scale_x_discrete(breaks=c("AsstProf","AssocProf","Prof"),
      labels=c("Assistant\nProfessor","Associate\nProfessor","Full\nProfessor"))+
  scale_y_continuous(breaks=c(50000,100000,150000,200000),
      labels=c("50k","100k","150k","200k"))+
  labs(title="Faculty Salary by Rank and Gender",x="",y="",fill="Gender")

#Let's move the legend inside the graph

Salaries %>% 
  filter(salary<200000) %>% 
  ggplot(aes(x=rank,y=salary,fill=sex))+geom_boxplot(alpha=0.5)+theme_minimal()

Salaries %>% 
  filter(salary<200000) %>% 
  ggplot(aes(x=rank,y=salary,fill=sex))+geom_boxplot(alpha=0.5)+theme_minimal()+
  scale_x_discrete(breaks=c("AsstProf","AssocProf","Prof"),
      labels=c("Assistant\nProfessor","Associate\nProfessor","Full\nProfessor"))+
  scale_y_continuous(breaks=c(50000,100000,150000,200000),
      labels=c("50k","100k","150k","200k"))+
  labs(title="Faculty Salary by Rank and Gender",x="",y="",fill="Gender")+
  theme(legend.position = c(0.11,0.85))



```


