1. ¿Qué es R?

R es un lenguaje de programación estadística empleado para realizar varias funciones relacionadas a distintas disciplinas, como por ejemplo la cartografia o la estadistica.

2. Comenzando a escribir

Este cuaderno se desarrolla para la asignatura de Geomática Básica y corresponde a una breve introducción a R y sus funciones básicas. El documento fue realizado por Miguel Santiago Morales Ruiz. ### 3. Paquetes de R

Un paquete es un conjunto de comandos empleados para una función específica y se instalan con el siguiente codigo:

#install.packages("package name")

Para ejecutar los paquetes instalados se ejecuta el codigo Library de la siguiente manera:

#library(package-name)

Como ejemplo, se instalará el paquete dplyr

#install.packages("dplyr")
library(dplyr)

4.Directorio de trabajo

Es la carpeta en donde se guardaran y se buscaran los archivos que necesitamos para realizar un cuaderno de R, estos archivos una vez colocados no se pueden cambiar de lugar,con el comando getwd conocemos la ruta de lo archivos:

getwd()
[1] "C:/Users/HP LAPTOP/Documents"
 "C:/Users/HP LAPTOP/Desktop"
[1] "C:/Users/HP LAPTOP/Desktop"

En caso de que se quiera cambiar el directorio de trabajo, se usa la funcion setwd()

setwd("C:/Users/HP LAPTOP/Desktop")

5. Importar y verificar datos

Para realizar esta práctica es necesario descargar los registros entre 2000-2016 de NBN Gateway. Estos registros contienen información acerca de las especies de animales, plantas y hongos. Este archivo de excel se guardará como edidiv.csv. Después de descargar el archivo, se importa con el comando read.csv() o empleando herramientas de la consola.

read.csv()
Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
  el argumento "file" está ausente, sin valor por omisión

En el siguiente chunk se puede ver la ruta del archivo en donde se guardaron los datos:

edidiv <- read.csv("C:/Users/HP LAPTOP/Desktop/Semestre 2021 1/CC-RBasics-master/edidiv.csv")

6. ¿Cómo saber si se han cometido errores en los códigos?

Para tener una vista previa de los comandos que se han usado anteriormente se usa el comando head, el cual nos muestra una tabla de acuerdo a la informacion colocada anteriormente, de esta manera para no cometer errores mas adelante.

head()
Error in checkHT(n, dx <- dim(x)) : 
  el argumento "x" está ausente, sin valor por omisión

Esta opción nos permite ver las primeras filas:

head(edidiv)

tail()

Este comando muestra las últimas filas.

tail(edidiv)

str()

Esta opción indica si las variables son continuas, enteras, categóricas o caracteres.

str(edidiv)
'data.frame':   25684 obs. of  5 variables:
 $ organisationName: chr  "Joint Nature Conservation Committee" "Joint Nature Conservation Committee" "Joint Nature Conservation Committee" "British Trust for Ornithology" ...
 $ gridReference   : chr  "NT265775" "NT235775" "NT235775" "NT27" ...
 $ year            : int  2000 2000 2000 2000 2000 2001 2001 2001 2001 2001 ...
 $ taxonName       : chr  "Sterna hirundo" "Sterna hirundo" "Sterna paradisaea" "Branta canadensis" ...
 $ taxonGroup      : chr  "Bird" "Bird" "Bird" "Bird" ...

Para mirar la estructura de los datos se usa el comando str(object.name). Aunque, si se quiere cambiar la estructura, se realizan los siguientes pasos: Se emplea el cógigo head(nombre del archivo$grupo) para ver las primeras filas de la columna en esta clase.

head(edidiv$taxonGroup)
[1] "Bird" "Bird" "Bird" "Bird" "Bird" "Bird"

Se usa class(nombre del archivo$grupo) para saber con que tipo de variable se está trabajando

class(edidiv$taxonGroup)
[1] "character"

El siguiente comando, convierte cualquier valor colocado en un factor:

edidiv$taxonGroup <- as.factor(edidiv$taxonGroup)

Existen otros comandos que pueden ser utiles en distintos casos. Principalmente se trabajarán:

dim()

Es otro comando que permite ver el número de columnas y filas.

dim(edidiv)
[1] 25684     5

summary

Este comando da un resumen de los datos.

summary(edidiv)
 organisationName   gridReference           year     
 Length:25684       Length:25684       Min.   :2000  
 Class :character   Class :character   1st Qu.:2006  
 Mode  :character   Mode  :character   Median :2009  
                                       Mean   :2009  
                                       3rd Qu.:2011  
                                       Max.   :2016  
                                                     
  taxonName                    taxonGroup  
 Length:25684       Butterfly       :9670  
 Class :character   Bird            :7366  
 Mode  :character   Flowering.Plants:2625  
                    Mollusc         :2226  
                    Hymenopteran    :1391  
                    Mammal          : 960  
                    (Other)         :1446  

summary(-$-)

Da un breve resumen de una variable en particular.

summary(edidiv$taxonGroup)
          Beetle             Bird        Butterfly 
             426             7366             9670 
       Dragonfly Flowering.Plants           Fungus 
             421             2625              334 
    Hymenopteran           Lichen        Liverwort 
            1391              140              125 
          Mammal          Mollusc 
             960             2226 

7. Calcular la riqueza en especies

El comando filter() nos permiter dividir las variables de acuerdo a lo que mas se nos favorezca, en este caso, en grupos de taxonomia de distintas especies:

Beetle <- filter(edidiv, taxonGroup == "Beetle")
Bird <- filter(edidiv, taxonGroup == "Bird")
Butterfly <- filter(edidiv, taxonGroup == "Butterfly")
Dragonfly <- filter(edidiv, taxonGroup == "Dragonfly")
Flowering.Plants <- filter(edidiv, taxonGroup == "Flowering.Plants")
Fungus <- filter(edidiv, taxonGroup == "Fungus")
Hymenopteran <- filter(edidiv, taxonGroup == "Hymenopteran")
Lichen <- filter(edidiv, taxonGroup == "Lichen")
Liverwort <- filter(edidiv, taxonGroup == "Liverwort")
Mammal <- filter(edidiv, taxonGroup == "Mammal")
Mollusc <- filter(edidiv, taxonGroup == "Mollusc")

Ahora, se emplearán las funciones unique() que identifica las diferentes especies y length() que las cuenta.

a <- length(unique(Beetle$taxonName))
b <- length(unique(Bird$taxonName))
c <- length(unique(Butterfly$taxonName))
d <- length(unique(Dragonfly$taxonName))
e <- length(unique(Flowering.Plants$taxonName))
f <- length(unique(Fungus$taxonName))
g <- length(unique(Hymenopteran$taxonName))
h <- length(unique(Lichen$taxonName))
i <- length(unique(Liverwort$taxonName))
j <- length(unique(Mammal$taxonName))
k <- length(unique(Mollusc$taxonName))

8. Crear un vector y trazarlo

Un vector almacena valores en una única dimensión. Para crear un vector se emplea la función c()

biodiv <- c(a,b,c,d,e,f,g,h,i,j, k)
#Se están relacionando los valores en el mismo orden en el cual se escribieron anteriormente.
names(biodiv) <- c("Beetle", "Bird", "Butterfly", "Dragonfly", "Flowering.Plants", "Fungus", "Hymenopteran", "Lichen", "Liverwort", "Mammal", "Mollusc")

El codigo barplot nos muestra un diagrama de los datos usados anteriormente con esto se puede ver la diversidad y riqueza de especies.

help(barplot)
#Para obtener ayuda sólo con la función barplot.
help(par)
#Para tener ayuda con el trazado en general.

Para poder modificar el gráfico se pueden emplear distintos comandos como: -xlab y ylab que permiten nombrar los ejes -cex.names que permite modificar el tamaño de la fuente en el eje x -cex.axis que modifica el tamaño de fuente en el eje y -cex.lab que modifica el tamaño de fuente de los títulos de los ejes.

barplot(biodiv)

barplot(biodiv, xlab="Taxa", ylab="Number of species", ylim=c(0,600), cex.names= 0.45, cex.axis=0.9, cex.lab=1.0, col=c("darkblue","yellow"))

9. Crear un marco de datos y trazarlo

Para crear una serie de datos con etiquetas se utilizan objetos de marco de datos, con columnas y posteriormente se crea un objeto “taxa” y se usa el comando data frame

Para crear un objeto llamado “taxa” con todos los nombres del conjunto

taxa <- c("Beetle", "Bird", "Butterfly","Dragonfly","Flowering.Plants", "Fungus", "Hymenopteran", "Lichen", "Liverwort", "Mammal", "Mollusc")

Para convertir el objeto en un factor:

taxa_f <- factor(taxa)

Para combinar todos los valores en el número de especies “richness”

richness <- c(a,b,c,d,e,f,g,h,i,j,k)

Para crear un marco de datos a partir de dos vectores:

biodata <- data.frame(taxa_f, richness)

Para guardar el archivo en el directorio de trabajo:

write.csv(biodata, file ="biodata.csv")

En caso de que se quieran crear y guardar diagramas de barrasempleando sólo el marco de datos, se necesita cambiar un poco el código

png("barplot2.png", width=1600, height=600)
barplot(biodata$richness, names.arg=c("Beetle", "Bird", "Butterfly", "Dragonfly", "Flowering.Plants", "Fungus", "Hymenopteran", "Lichen", "Liverwort", "Mammal", "Mollusc"),
xlab="Taxa", ylab="Number of species", ylim=c(0,600))
dev.off()
null device 
          1 
---
title: "Introduccion a R"
output: html_notebook
Author: Miguel Santiago Morales Ruiz
Date: 07/03/2021
---
### 1. ¿Qué es R?

R es un lenguaje de programación estadística empleado para realizar varias funciones relacionadas a distintas disciplinas, como por ejemplo la cartografia o la estadistica.

### 2. Comenzando a escribir

Este cuaderno se desarrolla para la asignatura de Geomática Básica y corresponde a una breve introducción a R y sus funciones básicas. El documento fue realizado por Miguel Santiago Morales Ruiz.
### 3. Paquetes de R

Un paquete es un conjunto de comandos empleados para una función específica y se instalan con el siguiente codigo:

```{r}
#install.packages("package name")
```
Para ejecutar los paquetes instalados se ejecuta el codigo *Library* de la siguiente manera:
```{r}
#library(package-name)
```
Como ejemplo, se instalará el paquete dplyr
```{r}
#install.packages("dplyr")
library(dplyr)
```
### 4.Directorio de trabajo

Es la carpeta en donde se guardaran y se buscaran los archivos que necesitamos para realizar un cuaderno de R, estos archivos una vez colocados no se pueden cambiar de lugar,con el comando getwd conocemos la ruta de lo archivos: 

```{r}
getwd()
 "C:/Users/HP LAPTOP/Desktop"
```
En caso de que se quiera cambiar el directorio de trabajo, se usa la funcion setwd()

```{r}
setwd("C:/Users/HP LAPTOP/Desktop")

```
### 5. Importar y verificar datos

Para realizar esta práctica es necesario descargar los registros entre 2000-2016 de NBN Gateway. Estos registros contienen información acerca de las especies de animales, plantas y hongos. Este archivo de excel se guardará como edidiv.csv. Después de descargar el archivo, se importa con el comando read.csv() o empleando herramientas de la consola.
```{r}
read.csv()

```
En el siguiente chunk se puede ver la ruta del archivo en donde se guardaron los datos:
```{r}
edidiv <- read.csv("C:/Users/HP LAPTOP/Desktop/Semestre 2021 1/CC-RBasics-master/edidiv.csv")

```

### 6. ¿Cómo saber si se han cometido errores en los códigos?

Para tener una vista previa de los comandos que se han usado anteriormente se usa el comando head, el cual nos muestra una tabla de acuerdo a la informacion colocada anteriormente, de esta manera para no cometer errores mas adelante.
```{r}
head()
```
Esta opción nos permite ver las primeras filas:
```{r}
head(edidiv)
```
tail()

Este comando muestra las últimas filas.

```{r}
tail(edidiv)
```
str()

Esta opción indica si las variables son continuas, enteras, categóricas o caracteres.
```{r}
str(edidiv)
```
Para mirar la estructura de los datos se usa el comando str(object.name). Aunque, si se quiere cambiar la estructura, se realizan los siguientes pasos: Se emplea el cógigo head(nombre del archivo$grupo) para ver las primeras filas de la columna en esta clase.
```{r}
head(edidiv$taxonGroup)
```
Se usa class(nombre del archivo$grupo) para saber con que tipo de variable se está trabajando
```{r}
class(edidiv$taxonGroup)
```
El siguiente comando, convierte cualquier valor colocado en un factor:
```{r}
edidiv$taxonGroup <- as.factor(edidiv$taxonGroup)
```
Existen otros comandos que pueden ser utiles en distintos casos. Principalmente se trabajarán:

dim()

Es otro comando que permite ver el número de columnas y filas.
```{r}
dim(edidiv)
```
summary

Este comando da un resumen de los datos.

```{r}
summary(edidiv)
```
summary(-$-)

Da un breve resumen de una variable en particular.
```{r}
summary(edidiv$taxonGroup)
```
### 7. Calcular la riqueza en especies

El comando filter() nos permiter dividir las variables de acuerdo a lo que mas se nos favorezca, en este caso, en grupos de taxonomia de distintas especies:
```{r}
Beetle <- filter(edidiv, taxonGroup == "Beetle")
Bird <- filter(edidiv, taxonGroup == "Bird")
Butterfly <- filter(edidiv, taxonGroup == "Butterfly")
Dragonfly <- filter(edidiv, taxonGroup == "Dragonfly")
Flowering.Plants <- filter(edidiv, taxonGroup == "Flowering.Plants")
Fungus <- filter(edidiv, taxonGroup == "Fungus")
Hymenopteran <- filter(edidiv, taxonGroup == "Hymenopteran")
Lichen <- filter(edidiv, taxonGroup == "Lichen")
Liverwort <- filter(edidiv, taxonGroup == "Liverwort")
Mammal <- filter(edidiv, taxonGroup == "Mammal")
Mollusc <- filter(edidiv, taxonGroup == "Mollusc")
```
Ahora, se emplearán las funciones unique() que identifica las diferentes especies y length() que las cuenta.
```{r}
a <- length(unique(Beetle$taxonName))
b <- length(unique(Bird$taxonName))
c <- length(unique(Butterfly$taxonName))
d <- length(unique(Dragonfly$taxonName))
e <- length(unique(Flowering.Plants$taxonName))
f <- length(unique(Fungus$taxonName))
g <- length(unique(Hymenopteran$taxonName))
h <- length(unique(Lichen$taxonName))
i <- length(unique(Liverwort$taxonName))
j <- length(unique(Mammal$taxonName))
k <- length(unique(Mollusc$taxonName))
```
### 8. Crear un vector y trazarlo 
Un vector almacena valores en una única dimensión. Para crear un vector se emplea la función c()
```{r}
biodiv <- c(a,b,c,d,e,f,g,h,i,j, k)
#Se están relacionando los valores en el mismo orden en el cual se escribieron anteriormente.
names(biodiv) <- c("Beetle", "Bird", "Butterfly", "Dragonfly", "Flowering.Plants", "Fungus", "Hymenopteran", "Lichen", "Liverwort", "Mammal", "Mollusc")
```
El codigo barplot nos muestra un diagrama de los datos usados anteriormente con esto se puede ver la diversidad y riqueza de especies.
```{r}
help(barplot)
#Para obtener ayuda sólo con la función barplot.
help(par)
#Para tener ayuda con el trazado en general.
```
Para poder modificar el gráfico se pueden emplear distintos comandos como: -xlab y ylab que permiten nombrar los ejes -cex.names que permite modificar el tamaño de la fuente en el eje x -cex.axis que modifica el tamaño de fuente en el eje y -cex.lab que modifica el tamaño de fuente de los títulos de los ejes.

```{r}
barplot(biodiv)
```
```{r}
barplot(biodiv, xlab="Taxa", ylab="Number of species", ylim=c(0,600), cex.names= 0.45, cex.axis=0.9, cex.lab=1.0, col=c("darkblue","yellow"))

```
### 9. Crear un marco de datos y trazarlo

Para crear una serie de datos con etiquetas se utilizan objetos de marco de datos, con columnas y posteriormente se crea un objeto "taxa" y se usa el comando data frame

Para crear un objeto llamado “taxa” con todos los nombres del conjunto
```{r}
taxa <- c("Beetle", "Bird", "Butterfly","Dragonfly","Flowering.Plants", "Fungus", "Hymenopteran", "Lichen", "Liverwort", "Mammal", "Mollusc")
```
Para convertir el objeto en un factor:
```{r}
taxa_f <- factor(taxa)
```
Para combinar todos los valores en el número de especies “richness”
```{r}
richness <- c(a,b,c,d,e,f,g,h,i,j,k)
```
Para crear un marco de datos a partir de dos vectores:
```{r}
biodata <- data.frame(taxa_f, richness)
```
Para guardar el archivo en el directorio de trabajo:
```{r}
write.csv(biodata, file ="biodata.csv")
```
En caso de que se quieran crear y guardar diagramas de barrasempleando sólo el marco de datos, se necesita cambiar un poco el código

```{r}
png("barplot2.png", width=1600, height=600)
barplot(biodata$richness, names.arg=c("Beetle", "Bird", "Butterfly", "Dragonfly", "Flowering.Plants", "Fungus", "Hymenopteran", "Lichen", "Liverwort", "Mammal", "Mollusc"),
xlab="Taxa", ylab="Number of species", ylim=c(0,600))
dev.off()
```




















