UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS ECONÓMICAS

CARRERA DE ESTADÍSTICA



PRIMERAS PRACTICAS EN R 15

Manual

En el siguiente texto podremos encontrar una serie de códigos elaborados en el programa Rstudio que darán solución a un determinado ejercicio enfocados principalmente en la creación de gráficos.

Ejercicio 1: Histograma

Inspecciona la columna Temp (temperatura) del conjunto de datos airquality:

  1. Para ello nos ayudaremos del comando tail para conocer las columnas de la base de datos arquiality, el comando summary nos servira para ver sus estadisticas mas relevantes y el comando hist nos develara la gráfica requerida.
tail(airquality)
summary(airquality)
hist(airquality$Temp)
  1. Utilizaremos los comandos main para el título,xlab y ylab para añadir nombre a los ejes y sumado a ello el color, el cual lo usamos con la función col :
hist(airquality$Temp, main = "Histograma de la calidad del aire",
    xlab = "Temperatura del aire", ylab = "Frecuencia",
    col = "pink")

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 1: Histograma
tail(airquality)
summary(airquality)

hist(airquality$Temp)
hist(airquality$Temp, main = "Histograma de la calidad del aire",
     xlab = "Temperatura del aire", ylab = "Frecuencia",
     col = "pink")
RESULTADO FINAL
##     Ozone Solar.R Wind Temp Month Day
## 148    14      20 16.6   63     9  25
## 149    30     193  6.9   70     9  26
## 150    NA     145 13.2   77     9  27
## 151    14     191 14.3   75     9  28
## 152    18     131  8.0   76     9  29
## 153    20     223 11.5   68     9  30
##      Ozone           Solar.R           Wind             Temp      
##  Min.   :  1.00   Min.   :  7.0   Min.   : 1.700   Min.   :56.00  
##  1st Qu.: 18.00   1st Qu.:115.8   1st Qu.: 7.400   1st Qu.:72.00  
##  Median : 31.50   Median :205.0   Median : 9.700   Median :79.00  
##  Mean   : 42.13   Mean   :185.9   Mean   : 9.958   Mean   :77.88  
##  3rd Qu.: 63.25   3rd Qu.:258.8   3rd Qu.:11.500   3rd Qu.:85.00  
##  Max.   :168.00   Max.   :334.0   Max.   :20.700   Max.   :97.00  
##  NA's   :37       NA's   :7                                       
##      Month            Day      
##  Min.   :5.000   Min.   : 1.0  
##  1st Qu.:6.000   1st Qu.: 8.0  
##  Median :7.000   Median :16.0  
##  Mean   :6.993   Mean   :15.8  
##  3rd Qu.:8.000   3rd Qu.:23.0  
##  Max.   :9.000   Max.   :31.0  
## 

Ejercicio 2: Histograma

Por defecto, el eje horizontal de un histograma muestra el número de observaciones en cada bin. Examina la ayuda de hist para ver cómo mostrar en, lugar de los números absolutos, la proporción.

  1. Comenzaremos por colocar el comando hist de la siguiente forma ?hist, el RStudio brindara la ayuda necesario a los campos con los que podemos trabajar el histograma
?hist

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 2: Histograma

?hist
RESULTADO FINAL
## starting httpd help server ... done

Ejercicio 3: Histograma

El número de bins también es parametrizable. Examina otra vez la página de ayuda para modificar el valor por defecto.

  1. Partimos del ejercicio anterior ejecutando la ayuda que nos brinda el RStudio: usamos el comando windows() para que nos presente en una nueva ventana el gráfico que vayamos realizando, luego colocamos el comando hist para ver un histograma de los sepalos por su anchura.
windows()
hist(iris$Sepal.Width)
  1. Luego creamos una gráfica la cual contenga los parametros antes mencionados en el ejercicio uno y añadimos breaks debido a que el histograma no maneja bins
windows()
hist(iris$Sepal.Width, main = "iris: histograma de la anchura de los sépalos",
    xlab = "temperaturas", ylab = "frecuencia",
    col = "yellow", breaks = 2)

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 3: Histograma

#Antes
windows()
hist(iris$Sepal.Width)

#Despues
windows()
hist(iris$Sepal.Width, main = "iris: histograma de la anchura de los sépalos",
     xlab = "temperaturas", ylab = "frecuencia",
     col = "yellow", breaks = 2)
RESULTADO FINAL

Ejercicio 4: Histograma

Estudia la distribución de las temperaturas en Nueva York (usa airquality)

  1. Comparamos las temperatura de Nueva York:

Realizamos un summary para conocer a detalle que columnas debemos tomar para nuestro gráfico

summary(airquality)
  1. Realizamos un histograma basico para ver que elementos nos muestra el gráfico
windows()
hist(airquality$Temp)
  1. Realizamos un histograma con todos los parámetros vistos en los ejercicios anteriores: nombre del gráfico,nombre de los ejes, color de las barras
windows()
hist(airquality$Temp, main = "airquality: histograma de la temperatura",
    xlab = "anchura del sépalo", ylab = "frecuencia",
    col = "steelblue")

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 4: Histograma

summary(airquality)

#Antes
windows()
hist(airquality$Temp)

#Despues
windows()
hist(airquality$Temp, main = "airquality: histograma de la temperatura",
     xlab = "anchura del sépalo", ylab = "frecuencia",
     col = "steelblue")
RESULTADO FINAL
##      Ozone           Solar.R           Wind             Temp      
##  Min.   :  1.00   Min.   :  7.0   Min.   : 1.700   Min.   :56.00  
##  1st Qu.: 18.00   1st Qu.:115.8   1st Qu.: 7.400   1st Qu.:72.00  
##  Median : 31.50   Median :205.0   Median : 9.700   Median :79.00  
##  Mean   : 42.13   Mean   :185.9   Mean   : 9.958   Mean   :77.88  
##  3rd Qu.: 63.25   3rd Qu.:258.8   3rd Qu.:11.500   3rd Qu.:85.00  
##  Max.   :168.00   Max.   :334.0   Max.   :20.700   Max.   :97.00  
##  NA's   :37       NA's   :7                                       
##      Month            Day      
##  Min.   :5.000   Min.   : 1.0  
##  1st Qu.:6.000   1st Qu.: 8.0  
##  Median :7.000   Median :16.0  
##  Mean   :6.993   Mean   :15.8  
##  3rd Qu.:8.000   3rd Qu.:23.0  
##  Max.   :9.000   Max.   :31.0  
## 

Ejercicio 5: Guardar el Gráfico como imagen

Usa las funciones png y jpeg para guardar alguno de los gráficos anteriores en tu disco duro:

  1. Para ello nos ayudaremos del comando png el cual contiene los siguientes argumentos como el nombre del gráfico a guardar “file name”, el tamaño en pixeles del gráfico el ancho “widith” y el alto del mismo “height”
png(filename = "histograma.png", width = 800, height = 600)
  1. Creamos el gráfico como trabajamos en el ejercicio anterior, cerramos el gráfico con el comando dev.off y para vizualizar el gráfico usamos el comando file.show.

Nota: estos archivos se guardaran en la carpeta que estemos trabajando

hist(iris$Sepal.Width, main = "iris: histograma de la anchura de los sépalos",
    xlab = "anchura del sépalo", ylab = "frecuencia",
    col = "steelblue")
dev.off()

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 5: Guardar el Gráfico como imagen
View(airquality)
png(filename = "histograma.png", width = 800, height = 600) 
hist(iris$Sepal.Width, main = "iris: histograma de la anchura de los sépalos",
     xlab = "anchura del sépalo", ylab = "frecuencia",
     col = "steelblue")
dev.off()
file.show("histograma.png")
RESULTADO FINAL
## png 
##   2

Ejercicio 6: Barplot

Usa los parámetros main, xlab, ylab y col discutidos en la sección anterior para mejorar el aspecto de este gráfico:

  1. Para ello nos ayudaremos de la función “barplot” la cual me da como resultado un gráfico de barras.
windows()
barplot(table(iris$Species))
  1. Utilizaremos los comandos main para el título,xlab y ylab para añadir nombre a los ejes y sumado a ello el color, el cual lo usamos con la función col :
windows()
barplot(table(iris$Species),
       xlab = "Especies", ylab = "Frecuencia", main = "Histograma de Especies",
       col = c("orange","Blue","Green"))hist(airquality$Temp, main = "Histograma de la calidad del aire",
    xlab = "Temperatura del aire", ylab = "Frecuencia",
    col = "pink")

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 6: barplot
#Antes
windows()
barplot(table(iris$Species))

#Despues
windows()
barplot(table(iris$Species),
        xlab = "Especies", ylab = "Frecuencia", main = "Histograma de Especies",
        col = c("orange","Blue","Green"))
RESULTADO FINAL

Ejercicio 7: barplot(parámetro horiz)

Investiga el argumento horiz de barplot para crear un gráfico de barras horizontales.

  1. Comenzaremos por realizar un barplot, añadimos los distintos campos ya estudiados en esta seccion como lo son los nombres a los ejes,el título y color del gráfico, lo único que añadimos al final es el parámetro “horiz= TRUE” para que las barras se muestren de manera horizontal
windows()
barplot(table(iris$Species),
       xlab = "Especies", ylab = "Frecuencia", main = "Histograma de Especies",
       col = c("orange","Blue","Green"),
       horiz = TRUE)

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 7:barplot(parámetro horiz)
windows()
barplot(table(iris$Species),
        xlab = "Especies", ylab = "Frecuencia", main = "Histograma de Especies",
        col = c("orange","Blue","Green"),
        horiz = TRUE)
RESULTADO FINAL

Ejercicio 8: Gráfico de Dispersión

Representa gráficamente la anchura del sépalo contra su longitud (usando iris). Interpreta el gráfico.

  1. Utilizamos la función plot la cual va a gráficar un gráfico de dispersion, ubicamos las 2 variables en este caso de la base iris vamos a ver la interacción que tiene la anchura y la longitud de los sepalos
windows()
plot(iris$Sepal.Width, iris$Sepal.Length)

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 8: Gráfico de Dispersión
windows()
plot(iris$Sepal.Width, iris$Sepal.Length)
RESULTADO FINAL

Ejercicio 9: Gráfico de Dispersión

De nuevo, usa los parámetros main, xlab, ylab y col discutidos en la sección anterior para mejorar el aspecto del gráfico anterior.

1.Usamos el código anterior y le aumentamos los parámetros que me permiten modificar el nombre del gráfico, el nombre de los ejes

plot(iris$Sepal.Width, iris$Sepal.Length,
    xlab="Ancho del petalo", ylab="Longitud del petalo",
    main="Anchura vs Longitud", col="black")

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 9: Gráfico de Dispersión

plot(iris$Sepal.Width, iris$Sepal.Length,
     xlab="Ancho del petalo", ylab="Longitud del petalo",
     main="Anchura vs Longitud", col="black")
RESULTADO FINAL

Ejercicio 10: Función abline

Consulta la ayuda de la función abline y úsala para añadir líneas (no solo horizontales) a alguno de los gráficos anteriores.

  1. Para ello nos ayudaremos del comando ?abline el cual sirve para cambiar el tipo de línea que usamos en nuestros gráficos
?abline

windows()
plot(airquality$Temp)
lines(airquality$Temp)
  1. Creamos el gráfico de lineas horizontales y el valor medio de y.
abline (h = mean (airquality$Temp), lwd = 2)
  1. Podemos ir añadiendo por encima y por debajo lineas al gráfico como nosotros creamos conveniente.
windows()
abline (h = mean (airquality$Temp) + sd (airquality$Temp), col = 'steelblue', lwd = 3, lty = 2)

windows()
abline (h = mean (airquality$Temp) - sd (airquality$Temp), col = 'steelblue', lwd = 3, lty = 2)

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 10: Comando abline
?abline

# crear una línea horizontal en el valor medio de y
windows()
plot(airquality$Temp)
lines(airquality$Temp)
abline (h = mean (airquality$Temp), lwd = 2)

#líneas horizontales con una desviación estándar por encima y por debajo del valor medio

windows()
plot(airquality$Temp)
lines(airquality$Temp)
abline (h = mean (airquality$Temp) + sd (airquality$Temp), col = 'steelblue', lwd = 3, lty = 2)

windows()
plot(airquality$Temp)
lines(airquality$Temp)
abline (h = mean (airquality$Temp) - sd (airquality$Temp), col = 'steelblue', lwd = 3, lty = 2)
RESULTADO FINAL

Ejercicio 11: Comando par

Consulta ?par, una página de ayuda en R que muestra gran cantidad de parámetros modificables en un gráfico. Investiga y usa col, lty y lwd.:

  1. Para ello nos ayudaremos del comando ?par y sabemos que esta función tiene 72 parámetros, el parámetro col es para colorear la linea o puntos de nuestra función, el parámetro lty es el tipo de linea que va a presentarse en nuestro gráfico y el comando lwd es para asignar el grosor de la línea de la funcion
?par
  1. Vamos a utilizar los parámetros del comando par en el gráfico de la distribución chi cuadrado :
windows()
par(ann=FALSE)
curve(dchisq(x, df=1), col='salmon1', lty=4,lwd=4,
     main='Chi cuadrada',
     xlab='x', ylab='Densidad')

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 11: Comando par
?par

windows()
par(ann=FALSE)
curve(dchisq(x, df=1), col='salmon1', lty=4,lwd=4,
      main='Chi cuadrada',
      xlab='x', ylab='Densidad')
RESULTADO FINAL

Ejercicio 12: Diagrama de Caja o Bigotes

Identifica la observación atípica de la base iris.Identificar si ¿Es atípica también con respecto a otras variables?

  1. Comenzaremos por colocar el comando boxplot el cual me permitirá crea el diagrama de caja
windows()
boxplot(iris$Sepal.Width ~ iris$Species, col = "gray",
       main = "Especies de iris\nsegún la anchura del sépalo")
  1. Realizamos lo mismo comparando las otras variables

~~~ windows() boxplot(iris\(Sepal.Length ~ iris\)Species, col = “gray”, main = “Especies de irisla longitud del sépalo”)

windows() boxplot(iris\(Petal.Length ~ iris\)Species, col = “gray”, main = “Especies de irisla longitud del Pétalo”)

windows() boxplot(iris\(Petal.Width ~ iris\)Species, col = “gray”, main = “Especies de irisla anchura del Pétalo”) ___

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 12: Diagrama de Caja o Bigotes

windows()
boxplot(iris$Sepal.Width ~ iris$Species, col = "gray",
        main = "Especies de iris\nsegún la anchura del sépalo")
#Los iris de las plantas setosas presentan un valor atípico ya que se encuetra fuera de los bigotes del diagrama de caja

windows()
boxplot(iris$Sepal.Length ~ iris$Species, col = "gray",
        main = "Especies de iris\nsegún la longitud del sépalo")
#Si comparamos la longitud de los sepalos la especie virginica presenta un valor atípico

windows()
boxplot(iris$Petal.Length ~ iris$Species, col = "gray",
        main = "Especies de iris\nsegún la longitud del Pétalo")
#Si comparamos la longitud de los petalos las especies versicolor y virgínica muestran datos atípicos

windows()
boxplot(iris$Petal.Width ~ iris$Species, col = "gray",
        main = "Especies de iris\nsegún la anchura del Pétalo")
#Si comparamos la longitud de los petalos la especie setosa muestran dos datos atípicos
RESULTADO FINAL

COLABORADOR: Phd.Francisco Valverde Alulema.