Según Salmerón A. (2001), puede definirse la Estadística Computacional como la Estadística calculada. De esta manera, cualquier procedimiento estadístico que implique una gran cantidad de cálculos, puede considerarse como un procedimiento de Estadística Computacional.
Una de las ramas más destacadas dentro de la Estadística Computacional es la correspondiente a la simulación y métodos de Monte Carlo. Las técnicas estadísticas de simulación juegan un papel muy importante en las ciencias experimentales e ingenierías, como la Informática, Física, Química, Biología y, naturalmente, dentro de la propia Estadística.
Presentaremos un Ejemplo aplicativo utilizando la Base de Datos “CP1985” descargada de la library(AER) que tiene un total de 554 observaciones y 11 variables
## Column {data-width=240} ———————————————————————–
---
title: "PROYECTO FINAL"
author: "Maria Alvarez Balbuena"
date: "`r Sys.Date()`"
output:
flexdashboard::flex_dashboard:
orientation: columns
vertical_layout: fill
theme: spacelab
source: embed
social: ['facebook','twitter','linkedin','pinterest']
---
```{r setup, include=FALSE}
library(flexdashboard)
library(prettydoc)
library(AER)
library(ggplot2)
```
# **Boxplots** {data-icon="fa-chart-bar"}
Column {data-width=250}
-----------------------------------------------------------------------
***
### **Introducción**
- Según *Salmerón A. (2001)*, puede definirse la **Estadística Computacional** como la Estadística calculada. De esta manera, cualquier procedimiento estadístico que implique una gran cantidad de cálculos, puede considerarse como un procedimiento de Estadística Computacional.
- Una de las ramas más destacadas dentro de la Estadística Computacional es la correspondiente a la simulación y métodos de Monte Carlo. Las técnicas estadísticas de simulación juegan un papel muy importante en las ciencias experimentales e ingenierías, como la Informática, Física, Química, Biología y, naturalmente, dentro de la propia Estadística.
- Presentaremos un Ejemplo aplicativo utilizando la Base de Datos "CP1985" descargada de la
library(AER) que tiene un total de 554 observaciones y 11 variables
Column {data-width=380}
-----------------------------------------------------------------------
### **a) BOXPLOT** de Salario según Género
- Obtenemos 3 gráficos de cajas (boxplot) a continuación:
a. BOXPLOT de Salario según Género
b. BOXPLOT *(sin leyenda)* del Salario según Ocupación
c. BOXPLOT *(con leyenda)* del Salario según Ocupación
***
```{r boxplot_salario_gen,fig.align='center'}
data("CPS1985")
boxplot(CPS1985$wage~CPS1985$gender,main="Salario (dólares hora) según Género",
ylab = "Salario",names=c("Hombres","Mujeres"),
horizontal = T,col=heat.colors(2))
```
Column {data-width=370}
-----------------------------------------------------------------------
### **b) BOXPLOT** *(sin leyenda)*
```{r boxplot_01_sin_leyenda,fig.align='center'}
data("CPS1985")
opar<-par()
par(mar=c(5,6,4,2))
a<-rainbow(6)
b<-rainbow(6,alpha = 0.2)
c<-rainbow(6,v=0.5)
boxplot(CPS1985$wage~CPS1985$occupation,col=b,boxcol=c,medcol=c,whiscol=a,
staplecol=c,outcol=c,outbg=c,pch=20,cex=1,horizontal = T,
main="Salario (dólares hora) según Ocupación",xlab = "Salario",
ylim=c(0,50),las=1,frame=F)
```
### **c) BOXPLOT** *con Leyenda*
```{r boxplot_02_leyenda,fig.align='center'}
a<-rainbow(6)
b<-rainbow(6,alpha = 0.2)
c<-rainbow(6,v=0.5)
boxplot(CPS1985$wage~CPS1985$occupation,col=b,boxcol=c,medcol=c,whiscol=a,
staplecol=c,outcol=c,outbg=c,pch=20,cex=1,horizontal = T,
main="Salario (dólares hora) según ocupación",xlab = "Salario",yaxt="n")
legend("bottomright",title = "Salario (dólares hora)",levels(CPS1985$occupation),fill = b)
```
# Diagramas de Barras y Sectores {data-icon="fa-chart-pie"}
Column {data-width=240}
-----------------------------------------------------------------------
### **- BARPLOT por Áreas de trabajo**
```{r barplot,fig.align='center'}
data("CPS1985")
x10 <- table(CPS1985$sector)
colores10<-c("orange","purple","light green")
barplot(x10,xlab="Áreas",ylab="Frecuencias",main="Distribución por Áreas",
col=colores10)
```
Column {data-width=240}
-----------------------------------------------------------------------
### **GGPLOT2 por Región**
```{r ggplot2,fig.align='center'}
colores11 <- c("skyblue","red")
ggplot(CPS1985,aes(region)) + geom_bar(fill=colores11) + labs(x="Región",y="Empleados",title="Diagrama de Barras por Región") + theme_gray()
```
##
Column {data-width=240}
-----------------------------------------------------------------------
### **PIE CHART por Región**
```{r pie_chart_11,fig.align='center'}
x11 <- table(CPS1985$region)
colores11 <- c("skyblue","red")
pie(x11,col = colores11,main="Gráfico de sectores por Región")
```
Column {data-width=240}
-----------------------------------------------------------------------
### **- PIE CHART por Áreas de trabajo**
```{r pie_chart_10,fig.align='center'}
data("CPS1985")
x10 <- table(CPS1985$sector)
colores10<-c("orange","purple","light green")
pie(x10,col = colores10,main="Gráfico de sectores por Áreas")
```
# Otros gráficos {data-icon="fa-chart-bar"}
Column {data-width=400}
-----------------------------------------------------------------------
***
### **Descripción:**
- Como habíamos mencionado, nuestra *Base de datos* "CP1985" descargada de la
library(AER) tiene un total de 554 observaciones y las siguientes 11 variables:
1. Wage (dollars per hour)
2. Education: Number of years of education
3. Experience: Number of years of work experience
4. Age: Age (years)
5. Ethnicity: Race (1=Other, 2=Hispanic, 3=White)
6. Region: Indicator variable for Southern Region (1=Person lives in South, 0=Person lives elsewhere)
7. Gender: Indicator variable for sex (1=Female, 0=Male)
8. Occupation: Occupational category (1=Management, 2=Sales, 3=Clerical,4 =Service, 5=Professional, 6=Other)
9. Sector: Sector (0=Other, 1=Manufacturing, 2=Construction)
10. Union: Indicator variable for union membership (1=Union member, 0=Not union member)
11. Married: Marital Status (0=Unmarried, 1=Married)
- Con estas variables, también podemos obtener **otros tipos de gráficos**, como los siguientes:
***
### **- Scatter plot**
```{r scatterplot,fig.align='center'}
data("CPS1985")
ggplot(CPS1985,aes(experience,log(wage),color=gender))+geom_point()+labs(title="Diagrama de dispersión por Género y Salario",x="Experiencia (en años)",y="Salario (en logaritmo)")+scale_color_discrete(name="Género",labels=c("Hombre","Mujer"))
```
Column {data-width=400}
-----------------------------------------------------------------------
### **- Gráfico de mosaico**
```{r graf_mosaico,fig.align='center'}
data("CPS1985")
mosaicplot(CPS1985$ethnicity~CPS1985$occupation,col=2:5,
main = "Gráfico de mosaico",xlab="Raza",ylab="Ocupación",cex.axis=0.5,las=1)
```