Seminario 1: Manipulación de datos en R

author: Dr. Marco Aurelio González Tagle date: 27 de Marzo 2014

Introducción

Importar datos a R

Importar base de datos creada en Excel

#setwd("F:/Rstudio/Principios_estadistica/Data")
setwd("/Volumes/TOSHIBA/Rstudio/Principios_estadistica/Data")
CedroRojo <- read.csv("cedrorojo.csv", header=T)

Revisar los datos

Usando R

Los datos Cedro Rojo se encuentran ya disponibles

head(CedroRojo)
  diametro altura
1    12.97  22.64
2    12.37  20.44
3    12.37  19.94
4    12.67  14.94
5    10.67  15.84
6    10.07  16.34

Determinar la media de la variable altura

Revisar: la variable altura se encuentra dentro de la base de datos CedroRojo

mean(CedroRojo$altura)
[1] 18.91

Determinar la media de la variable diámetro

Lo mismo sucede con la variable diametro, se encuentra dentro de la base de datos CedroRojo. Es importante utilizar el simbolo $ para especificar el lugar donde se encuentra.

mean(CedroRojo$diametro)
[1] 12.52

Coeficiente de variación:

¿Cuál es el coeficiente de variación de las observaciones en altura?

sd(CedroRojo$altura)/mean(CedroRojo$altura)*100
[1] 15.91

Selección específica

Determinar cuantos individuos existen por debajo de la media o un valor establecido

Crawley, J. (2012) The R Book, Chapter 1, pp. 27

Ejemplo

¿Cuántos individuos poseen un diámetro mayor o igual a 2 cm?

sum(CedroRojo$diametro >=2)
[1] 167

Ejemplo (1)

¿Cuántos individuos poseen un diámetro menor a 10 cm?

sum(CedroRojo$diametro < 10)
[1] 7

Ejemplo (2)

¿Qué valor obtenemos aplicando el siguiente comando?

sum(CedroRojo$diametro < 12)
[1] 71

Respuesta: Obtenemos la sumatoria de las plántulas de Cedro rojo que tiene un diametro menor a 12 cm.

Ejemplo (3)

¿Qué valor obtenemos aplicando el siguiente comando?

sum(CedroRojo$diametro[CedroRojo$diametro < 12])
[1] 785.8

Respuesta: Obtenemos la sumatoria de todos los 71 diametros de las plántulas de Cedro rojo que tiene un diametro menor a 12 cm.

Correlación entre Variables

Buscar la correlación entre el diámetro y altura

cor.test(CedroRojo$diametro, CedroRojo$altura)

    Pearson's product-moment correlation

data:  CedroRojo$diametro and CedroRojo$altura
t = 8.333, df = 165, p-value = 2.931e-14
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.4277 0.6429
sample estimates:
   cor 
0.5442