Estadística para la Investigación

¿Qué vamos a (tratar de) aprender en este curso?

¿Qué es estadística?

Tipos de variables

Población y Muestra

¿Qué podemos aprender de una población a partir de la muestra?

Sesgo del muestreo

Los métodos estadísticos de estimación intentan:

Muestreo

Otros tipos de muestreo

Diferencia entre R y R Studio

Tips para aprender a programar

Instalar R y R Studio

Interfaces

¿Qué son los paquetes de R?

install.packages("ggplot2")
library("ggplot2")

Cargar Datos

data()
data(package = .packages(all.available = TRUE))

Ejemplo

head(cars)
##   speed dist
## 1     4    2
## 2     4   10
## 3     7    4
## 4     7   22
## 5     8   16
## 6     9   10
summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Bases de datos propias

read.csv("archivo.csv", header = TRUE)
?read.table

Advertencia

Visualización

El gráfico más simple ha traído más información a la mente del analista de datos que cualquier otro dispositivo. Jhon Tukey

install.packages("ggplot2")
library(ggplot2)

mpg
?mpg

Nuestra primera gráfica

ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy))

Una plantilla para graficar

ggplot(data=<DATA>)+geom_point(mapping = aes(<MAPPINGS>))

Ejercicios

  1. Ejecute ggplot(data = mpg) ¿Qué observa?
  2. ¿Cuántas filas hay en mpg? ¿Cuántas columnas?
  3. ¿Qué describe la vabiable drv?
  4. Grafique hwy contra cyl
  5. ¿Qué pasa si se hace un gráfico de dispersión de class contra drv? ¿Por qué no es útil el gráfico?

Aesthetic

El mayor valor de una imagen es cuando nos obliga a notar lo que nunca esperábamos ver. Jhon Tukey

Un ejemplo

ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy, color = class))

Otras formas

ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy, size = class))
ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy, alpha = class))
ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy, shape = class))
ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy), color="red")

Ejercicios 2

  1. Se desea que todos los puntos de azul, sin embargo el siguiente código no produce lo deseado ¿puede ayudar a encontrar el error?
ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy, color="blue"))
  1. ¿Cuáles son las variables categóricas en mpg? ¿Cuáles son continuas?

  2. Mapee una variable continua to color, size y shape ¿cómo se comportan estas “aesthetics” para variables continuas?

  3. ¿Qué pasa si mapeamos una “aesthethics” para algo como aes(color=displ<5)

Facetas

ggplot(data=mpg)+
  geom_point(mapping = aes(x=displ,y=hwy))+
  facet_wrap(~ class, nrow=3)

Facetas con 2 variables

ggplot(data=mpg)+
  geom_point(mapping = aes(x=displ,y=hwy))+
  facet_grid(drv ~ class)

Facetas

ggplot(data=mpg)+
  geom_point(mapping = aes(x=displ,y=hwy))+
  facet_grid(. ~ class)

Geoms

Geoms

Transformaciones estadísticas

ggplot(data=diamonds)+
  geom_bar(mapping = aes(x=cut))

Transformaciones estadísticas 2

?geom_bar
ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut))

Ajustes

ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut,colour=cut))

ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut,fill=cut))
ggplot(data=diamonds)+
  stat_count(mapping = aes(x=cut,fill=clarity))