Los siguientes vectores se refieren a datos obtenidos para 25 estados americanos: region guarda la región a la que pertenecen estos estados, temperatura es la temperatura promedio que registran los estados en el mes de diciembre, y lluvia es el porcentaje de días que lluvió durante el mes de diciembre en cada uno de estos estados.
Regiones<- factor(c(rep("Norte",10),rep("Sur",14),rep("Oeste",5)))
Regiones
## [1] Norte Norte Norte Norte Norte Norte Norte Norte Norte Norte Sur Sur
## [13] Sur Sur Sur Sur Sur Sur Sur Sur Sur Sur Sur Sur
## [25] Oeste Oeste Oeste Oeste Oeste
## Levels: Norte Oeste Sur
temperatura<-seq(-5,16,by=0.75)
temperatura
## [1] -5.00 -4.25 -3.50 -2.75 -2.00 -1.25 -0.50 0.25 1.00 1.75 2.50 3.25
## [13] 4.00 4.75 5.50 6.25 7.00 7.75 8.50 9.25 10.00 10.75 11.50 12.25
## [25] 13.00 13.75 14.50 15.25 16.00
lluvia<-seq(0.900,0.200,by=-0.025)
lluvia
## [1] 0.900 0.875 0.850 0.825 0.800 0.775 0.750 0.725 0.700 0.675 0.650 0.625
## [13] 0.600 0.575 0.550 0.525 0.500 0.475 0.450 0.425 0.400 0.375 0.350 0.325
## [25] 0.300 0.275 0.250 0.225 0.200
La variable región (en el orden en que aparecen) corresponde a la información de los siguientes estados:
region.b1<-state.name[c(1:9,11:30)]
region.b1
## [1] "Alabama" "Alaska" "Arizona" "Arkansas"
## [5] "California" "Colorado" "Connecticut" "Delaware"
## [9] "Florida" "Hawaii" "Idaho" "Illinois"
## [13] "Indiana" "Iowa" "Kansas" "Kentucky"
## [17] "Louisiana" "Maine" "Maryland" "Massachusetts"
## [21] "Michigan" "Minnesota" "Mississippi" "Missouri"
## [25] "Montana" "Nebraska" "Nevada" "New Hampshire"
## [29] "New Jersey"
La variable temperatura (en el orden en que aparecen) corresponde a la información de los siguientes estados:
temperatura.b2<-state.name[c(1:4,6:30)]
temperatura.b2
## [1] "Alabama" "Alaska" "Arizona" "Arkansas"
## [5] "Colorado" "Connecticut" "Delaware" "Florida"
## [9] "Georgia" "Hawaii" "Idaho" "Illinois"
## [13] "Indiana" "Iowa" "Kansas" "Kentucky"
## [17] "Louisiana" "Maine" "Maryland" "Massachusetts"
## [21] "Michigan" "Minnesota" "Mississippi" "Missouri"
## [25] "Montana" "Nebraska" "Nevada" "New Hampshire"
## [29] "New Jersey"
La variable lluvia corresponde a la información de los mismos estados que se recolectaron para la variable temperatura pero de manera descendente, es decir, mientras que temperatura fue recogida para los estados desde Alabama hasta New Jersey, para la variable lluvia los datos se recogieron empezando en New Jersey y terminando en Alabama.
Cree una sola base de datos que recoja la información de las variables región, temperatura y lluvia, exclusivamente de los estados que poseen información en estas tres regiones. Esto significa que existirán estados para los cuales no se posea registros en alguna de estas variables; en ese caso, dicho estado no deberá ser tomado en cuenta. Solo se tomarán en cuenta los estados que posean información para las tres variables.
IMPORTANTE: Para responder a esta pregunta debe consultar el uso de la R-función llamada merge(). La pregunta no tendrá validez si el estudiante detecta los estados comunes para las tres variables de manera manual.
A esta base de datos final llámela data
base1<-data.frame(estados=region.b1,Regiones)
lluv<-sort(lluvia,decreasing = F)
base2<-data.frame(estados=temperatura.b2,temperatura,lluvia=lluv)
data<-merge(base1,base2)
data
¿Cuál es la temperatura del estado con el porcentaje de lluvia más alto.?
mayorlluvia<-which.max(data$lluvia)
data$temperatura[mayorlluvia]
## [1] 16
¿Cuántos estados tienen una temperatura promedio bajo cero.?
bajo0<-sum(data$temperatura<0)
bajo0
## [1] 7
¿Cuál es el porcentaje de lluvia de los estados que tienen un número par (positivo o negativo) en su temperatura promedio?
par<-(data$temperatura >0 | data$temperatura<0)&((data$temperatura%%2)==0)
data$lluvia[par]
## [1] 0.3 0.5 0.7 0.9
¿Cuál es el porcentaje promedio (comando mean) de lluvia para las ciudades que se encuentran en el Norte o en el Sur?
promedio<-(data$lluvia[data$Regiones == "Norte" | data$Regiones == "Sur"])
mean(promedio)
## [1] 0.4913043
Cambie los valores de la variable región a sus correspondientes en inglés, es decir: Norte por North, Sur por South y Oeste por West
levels(data$Regiones)[1:3]<-c("North","South","West")
data$Regiones
## [1] North North North North North North North North North West West West
## [13] West West West West West West West West West West West South
## [25] South South South South
## Levels: North South West
¿En qué región se encuentra la ciudad con la temperatura más baja?
nbajo<-which.min(data$temperatura)
data$Regiones[nbajo]
## [1] North
## Levels: North South West
Iris es una base de datos que se encuentra en la paquetería base de R, es decir con escribir iris la base de datos aparece. La información (variables) que contiene esta base de datos se refiere a las características de 150 flores provenientes de tres especies diferentes (setosa, versicolor y virginica)
Adjunto encontrará el archivo orquideas.xlsx con la misma información (variables) que tiene iris, pero para una nueva especie de flores (orquideas). Importe este archivo y consulte la función rbind que le permita unir iris con orquideas en una sola base de datos llamada flores
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.2
orquideasr<- read_excel("orquideas.xlsx")
d<-data.frame(orquideasr,Species=factor(c("Orquideas")))
d
#funcion r bind
flores<-rbind(iris,d)
flores
Cambie el nombre de las variables de esta base de datos a sus correspondientes en español (Longitud.Sepalo, Anchura.Sepalo, Longitud.Petalo, Anchura.Petalo, Especies)
nespanol<-c("Longitud.Sepalo","Anchura.Sepalo",
"Longitud.Petalo","Anchura.Petalo", "Especies")
colnames(flores)<-nespanol
names(flores)
## [1] "Longitud.Sepalo" "Anchura.Sepalo" "Longitud.Petalo" "Anchura.Petalo"
## [5] "Especies"
Note que la variable Anchura.Petalo tiene un valor de cero, lo cual no tiene sentido. Reemplace este valor por un dato perdido NA
valor0<-which.min(flores$Anchura.Petalo)
valor0
## [1] 155
flores$Anchura.Petalo[valor0]<-NA
flores