Boxplots

Column


Introducción

  • Según Salmerón A. (2001), puede definirse la Estadística Computacional como la Estadística calculada. De esta manera, cualquier procedimiento estadístico que implique una gran cantidad de cálculos, puede considerarse como un procedimiento de Estadística Computacional.

  • Una de las ramas más destacadas dentro de la Estadística Computacional es la correspondiente a la simulación y métodos de Monte Carlo. Las técnicas estadísticas de simulación juegan un papel muy importante en las ciencias experimentales e ingenierías, como la Informática, Física, Química, Biología y, naturalmente, dentro de la propia Estadística.

  • Presentaremos un Ejemplo aplicativo utilizando la Base de Datos “CP1985” descargada de la library(AER) que tiene un total de 554 observaciones y 11 variables

Column

a) BOXPLOT de Salario según Género

  • Obtenemos 3 gráficos de cajas (boxplot) a continuación:
  1. BOXPLOT de Salario según Género
  2. BOXPLOT (sin leyenda) del Salario según Ocupación
  3. BOXPLOT (con leyenda) del Salario según Ocupación

Column

b) BOXPLOT (sin leyenda)

c) BOXPLOT con Leyenda

Diagramas de Barras y Sectores

Column

- BARPLOT por Áreas de trabajo

Column

GGPLOT2 por Región

## Column {data-width=240} ———————————————————————–

PIE CHART por Región

Column

- PIE CHART por Áreas de trabajo

Otros gráficos

Column


Descripción:

  • Como habíamos mencionado, nuestra Base de datos “CP1985” descargada de la library(AER) tiene un total de 554 observaciones y las siguientes 11 variables:
  1. Wage (dollars per hour)
  2. Education: Number of years of education
  3. Experience: Number of years of work experience
  4. Age: Age (years)
  5. Ethnicity: Race (1=Other, 2=Hispanic, 3=White)
  6. Region: Indicator variable for Southern Region (1=Person lives in South, 0=Person lives elsewhere)
  7. Gender: Indicator variable for sex (1=Female, 0=Male)
  8. Occupation: Occupational category (1=Management, 2=Sales, 3=Clerical,4 =Service, 5=Professional, 6=Other)
  9. Sector: Sector (0=Other, 1=Manufacturing, 2=Construction)
  10. Union: Indicator variable for union membership (1=Union member, 0=Not union member)
  11. Married: Marital Status (0=Unmarried, 1=Married)
  • Con estas variables, también podemos obtener otros tipos de gráficos, como los siguientes: ***

- Scatter plot

Column

- Gráfico de mosaico

---
title: "PROYECTO FINAL"
author: "Maria Alvarez Balbuena"
date: "`r Sys.Date()`"
output: 
  flexdashboard::flex_dashboard:
    orientation: columns
    vertical_layout: fill
    theme: spacelab
    source: embed
    social: ['facebook','twitter','linkedin','pinterest']
---

```{r setup, include=FALSE}
library(flexdashboard)
library(prettydoc)
library(AER)
library(ggplot2)

```

# **Boxplots** {data-icon="fa-chart-bar"}

Column {data-width=250}
-----------------------------------------------------------------------
***
### **Introducción**

 - Según *Salmerón A. (2001)*, puede definirse la **Estadística Computacional** como la Estadística calculada. De esta manera, cualquier procedimiento estadístico que implique una gran cantidad de cálculos, puede considerarse como un procedimiento de Estadística Computacional.

 - Una de las ramas más destacadas dentro de la Estadística Computacional es la correspondiente a la simulación y métodos de Monte Carlo. Las técnicas estadísticas de simulación juegan un papel muy importante en las ciencias experimentales e ingenierías, como la Informática, Física, Química, Biología y, naturalmente, dentro de la propia Estadística.

- Presentaremos un Ejemplo aplicativo utilizando la Base de Datos "CP1985" descargada de la 
library(AER) que tiene un total de 554 observaciones y 11 variables


Column {data-width=380}
-----------------------------------------------------------------------

### **a) BOXPLOT** de Salario según Género
- Obtenemos 3 gráficos de cajas (boxplot) a continuación:
a. BOXPLOT de Salario según Género
b. BOXPLOT *(sin leyenda)* del Salario según Ocupación
c. BOXPLOT *(con leyenda)* del Salario según Ocupación

***

```{r boxplot_salario_gen,fig.align='center'}
data("CPS1985")
boxplot(CPS1985$wage~CPS1985$gender,main="Salario (dólares hora) según Género",
        ylab = "Salario",names=c("Hombres","Mujeres"),
        horizontal = T,col=heat.colors(2))
```

Column {data-width=370}
-----------------------------------------------------------------------

### **b) BOXPLOT** *(sin leyenda)*

```{r boxplot_01_sin_leyenda,fig.align='center'}
data("CPS1985")

opar<-par()
par(mar=c(5,6,4,2))

a<-rainbow(6)
b<-rainbow(6,alpha = 0.2)
c<-rainbow(6,v=0.5)

boxplot(CPS1985$wage~CPS1985$occupation,col=b,boxcol=c,medcol=c,whiscol=a,
        staplecol=c,outcol=c,outbg=c,pch=20,cex=1,horizontal = T,
        main="Salario (dólares hora) según Ocupación",xlab = "Salario",
        ylim=c(0,50),las=1,frame=F)

```

### **c) BOXPLOT** *con Leyenda*

```{r boxplot_02_leyenda,fig.align='center'}

a<-rainbow(6)
b<-rainbow(6,alpha = 0.2)
c<-rainbow(6,v=0.5)

boxplot(CPS1985$wage~CPS1985$occupation,col=b,boxcol=c,medcol=c,whiscol=a,
        staplecol=c,outcol=c,outbg=c,pch=20,cex=1,horizontal = T,
        main="Salario (dólares hora) según ocupación",xlab = "Salario",yaxt="n")

legend("bottomright",title = "Salario (dólares hora)",levels(CPS1985$occupation),fill = b)
```


# Diagramas de Barras y Sectores {data-icon="fa-chart-pie"}

Column {data-width=240}
-----------------------------------------------------------------------

### **- BARPLOT por Áreas de trabajo**

```{r barplot,fig.align='center'}
data("CPS1985")

x10 <- table(CPS1985$sector)
colores10<-c("orange","purple","light green")
barplot(x10,xlab="Áreas",ylab="Frecuencias",main="Distribución por Áreas",
        col=colores10)
```

Column {data-width=240}
-----------------------------------------------------------------------

### **GGPLOT2 por Región**

```{r ggplot2,fig.align='center'}
colores11 <- c("skyblue","red")

ggplot(CPS1985,aes(region)) + geom_bar(fill=colores11) + labs(x="Región",y="Empleados",title="Diagrama de Barras por Región") + theme_gray()
```
##
Column {data-width=240}
-----------------------------------------------------------------------

### **PIE CHART por Región**

```{r pie_chart_11,fig.align='center'}
x11 <- table(CPS1985$region)

colores11 <- c("skyblue","red")

pie(x11,col = colores11,main="Gráfico de sectores por Región")
```

Column {data-width=240}
-----------------------------------------------------------------------

### **- PIE CHART por Áreas de trabajo**

```{r pie_chart_10,fig.align='center'}
data("CPS1985")

x10 <- table(CPS1985$sector)
colores10<-c("orange","purple","light green")
pie(x10,col = colores10,main="Gráfico de sectores por Áreas")
```

# Otros gráficos {data-icon="fa-chart-bar"}

Column {data-width=400}
-----------------------------------------------------------------------
***
### **Descripción:**

- Como habíamos mencionado, nuestra *Base de datos* "CP1985" descargada de la 
library(AER) tiene un total de 554 observaciones y las siguientes 11 variables:
 1. Wage (dollars per hour)
 2. Education: Number of years of education
 3. Experience: Number of years of work experience
 4. Age: Age (years)
 5. Ethnicity: Race (1=Other, 2=Hispanic, 3=White)
 6. Region: Indicator variable for Southern Region (1=Person lives in South, 0=Person lives elsewhere)
 7. Gender: Indicator variable for sex (1=Female, 0=Male)
 8. Occupation: Occupational category (1=Management, 2=Sales, 3=Clerical,4 =Service, 5=Professional, 6=Other)
 9. Sector: Sector (0=Other, 1=Manufacturing, 2=Construction)
 10. Union: Indicator variable for union membership (1=Union member, 0=Not union member)
 11. Married: Marital Status (0=Unmarried, 1=Married)
 
- Con estas variables, también podemos obtener **otros tipos de gráficos**, como los siguientes:
***

### **- Scatter plot**

```{r scatterplot,fig.align='center'}

data("CPS1985")
ggplot(CPS1985,aes(experience,log(wage),color=gender))+geom_point()+labs(title="Diagrama de dispersión por Género y Salario",x="Experiencia (en años)",y="Salario (en logaritmo)")+scale_color_discrete(name="Género",labels=c("Hombre","Mujer"))
```

Column {data-width=400}
-----------------------------------------------------------------------


### **- Gráfico de mosaico**

```{r graf_mosaico,fig.align='center'}
data("CPS1985")

mosaicplot(CPS1985$ethnicity~CPS1985$occupation,col=2:5,
           main = "Gráfico de mosaico",xlab="Raza",ylab="Ocupación",cex.axis=0.5,las=1)
```