Parte 1.

Los siguientes vectores se refieren a datos obtenidos para 25 estados americanos: region guarda la región a la que pertenecen estos estados, temperatura es la temperatura promedio que registran los estados en el mes de diciembre, y lluvia es el porcentaje de días que lluvió durante el mes de diciembre en cada uno de estos estados.

Regiones<- factor(c(rep("Norte",10),rep("Sur",14),rep("Oeste",5)))
Regiones
##  [1] Norte Norte Norte Norte Norte Norte Norte Norte Norte Norte Sur   Sur  
## [13] Sur   Sur   Sur   Sur   Sur   Sur   Sur   Sur   Sur   Sur   Sur   Sur  
## [25] Oeste Oeste Oeste Oeste Oeste
## Levels: Norte Oeste Sur
temperatura<-seq(-5,16,by=0.75)
temperatura
##  [1] -5.00 -4.25 -3.50 -2.75 -2.00 -1.25 -0.50  0.25  1.00  1.75  2.50  3.25
## [13]  4.00  4.75  5.50  6.25  7.00  7.75  8.50  9.25 10.00 10.75 11.50 12.25
## [25] 13.00 13.75 14.50 15.25 16.00
lluvia<-seq(0.900,0.200,by=-0.025)
lluvia
##  [1] 0.900 0.875 0.850 0.825 0.800 0.775 0.750 0.725 0.700 0.675 0.650 0.625
## [13] 0.600 0.575 0.550 0.525 0.500 0.475 0.450 0.425 0.400 0.375 0.350 0.325
## [25] 0.300 0.275 0.250 0.225 0.200

La variable región (en el orden en que aparecen) corresponde a la información de los siguientes estados:

region.b1<-state.name[c(1:9,11:30)]
region.b1
##  [1] "Alabama"       "Alaska"        "Arizona"       "Arkansas"     
##  [5] "California"    "Colorado"      "Connecticut"   "Delaware"     
##  [9] "Florida"       "Hawaii"        "Idaho"         "Illinois"     
## [13] "Indiana"       "Iowa"          "Kansas"        "Kentucky"     
## [17] "Louisiana"     "Maine"         "Maryland"      "Massachusetts"
## [21] "Michigan"      "Minnesota"     "Mississippi"   "Missouri"     
## [25] "Montana"       "Nebraska"      "Nevada"        "New Hampshire"
## [29] "New Jersey"

La variable temperatura (en el orden en que aparecen) corresponde a la información de los siguientes estados:

temperatura.b2<-state.name[c(1:4,6:30)]
temperatura.b2
##  [1] "Alabama"       "Alaska"        "Arizona"       "Arkansas"     
##  [5] "Colorado"      "Connecticut"   "Delaware"      "Florida"      
##  [9] "Georgia"       "Hawaii"        "Idaho"         "Illinois"     
## [13] "Indiana"       "Iowa"          "Kansas"        "Kentucky"     
## [17] "Louisiana"     "Maine"         "Maryland"      "Massachusetts"
## [21] "Michigan"      "Minnesota"     "Mississippi"   "Missouri"     
## [25] "Montana"       "Nebraska"      "Nevada"        "New Hampshire"
## [29] "New Jersey"

La variable lluvia corresponde a la información de los mismos estados que se recolectaron para la variable temperatura pero de manera descendente, es decir, mientras que temperatura fue recogida para los estados desde Alabama hasta New Jersey, para la variable lluvia los datos se recogieron empezando en New Jersey y terminando en Alabama.

Pregunta 1.

Cree una sola base de datos que recoja la información de las variables región, temperatura y lluvia, exclusivamente de los estados que poseen información en estas tres regiones. Esto significa que existirán estados para los cuales no se posea registros en alguna de estas variables; en ese caso, dicho estado no deberá ser tomado en cuenta. Solo se tomarán en cuenta los estados que posean información para las tres variables.

IMPORTANTE: Para responder a esta pregunta debe consultar el uso de la R-función llamada merge(). La pregunta no tendrá validez si el estudiante detecta los estados comunes para las tres variables de manera manual.

A esta base de datos final llámela data

base1<-data.frame(estados=region.b1,Regiones)

lluv<-sort(lluvia,decreasing = F)

base2<-data.frame(estados=temperatura.b2,temperatura,lluvia=lluv)

data<-merge(base1,base2)
data

Pregunta 2.

¿Cuál es la temperatura del estado con el porcentaje de lluvia más alto.?

mayorlluvia<-which.max(data$lluvia)
data$temperatura[mayorlluvia]
## [1] 16

Pregunta 3.

¿Cuántos estados tienen una temperatura promedio bajo cero.?

bajo0<-sum(data$temperatura<0)
bajo0
## [1] 7

Pregunta 4.

¿Cuál es el porcentaje de lluvia de los estados que tienen un número par (positivo o negativo) en su temperatura promedio?

par<-(data$temperatura >0 | data$temperatura<0)&((data$temperatura%%2)==0)
data$lluvia[par]
## [1] 0.3 0.5 0.7 0.9

Pregunta 5.

¿Cuál es el porcentaje promedio (comando mean) de lluvia para las ciudades que se encuentran en el Norte o en el Sur?

promedio<-(data$lluvia[data$Regiones == "Norte" | data$Regiones == "Sur"])
mean(promedio)
## [1] 0.4913043

Pregunta 6.

Cambie los valores de la variable región a sus correspondientes en inglés, es decir: Norte por North, Sur por South y Oeste por West

levels(data$Regiones)[1:3]<-c("North","South","West")
data$Regiones
##  [1] North North North North North North North North North West  West  West 
## [13] West  West  West  West  West  West  West  West  West  West  West  South
## [25] South South South South
## Levels: North South West

Pregunta 7.

¿En qué región se encuentra la ciudad con la temperatura más baja?

nbajo<-which.min(data$temperatura)
data$Regiones[nbajo]
## [1] North
## Levels: North South West

Parte 2.

Iris es una base de datos que se encuentra en la paquetería base de R, es decir con escribir iris la base de datos aparece. La información (variables) que contiene esta base de datos se refiere a las características de 150 flores provenientes de tres especies diferentes (setosa, versicolor y virginica)

Pregunta 8.

Adjunto encontrará el archivo orquideas.xlsx con la misma información (variables) que tiene iris, pero para una nueva especie de flores (orquideas). Importe este archivo y consulte la función rbind que le permita unir iris con orquideas en una sola base de datos llamada flores

library(readxl)
## Warning: package 'readxl' was built under R version 4.2.2
orquideasr<- read_excel("orquideas.xlsx")
d<-data.frame(orquideasr,Species=factor(c("Orquideas")))
d
#funcion r bind 
flores<-rbind(iris,d)
flores

Pregunta 9.

Cambie el nombre de las variables de esta base de datos a sus correspondientes en español (Longitud.Sepalo, Anchura.Sepalo, Longitud.Petalo, Anchura.Petalo, Especies)

nespanol<-c("Longitud.Sepalo","Anchura.Sepalo",
            "Longitud.Petalo","Anchura.Petalo", "Especies")
colnames(flores)<-nespanol
names(flores)
## [1] "Longitud.Sepalo" "Anchura.Sepalo"  "Longitud.Petalo" "Anchura.Petalo" 
## [5] "Especies"

Pregunta 10.

Note que la variable Anchura.Petalo tiene un valor de cero, lo cual no tiene sentido. Reemplace este valor por un dato perdido NA

valor0<-which.min(flores$Anchura.Petalo)
valor0
## [1] 155

flores$Anchura.Petalo[valor0]<-NA
flores