Instrucciones
Genere un documento R markdown para resolver los ejercicios. En su documento R markdown, incluya como texto el enunciado del ejercicio y en el chunk incluya el código y los resultados. Publique en Rpubs (Investigar) el documento renderizado con los las funciones requeridas y resultados (impresos en el reporte) para resolver los ejercicios.
Ejercicios
1- Para el laboratorio se van a utilizar los datos de los siguientes 4 datasets:
2- Escoger individualmente 1 de los 4 datasets.
DataFrame X e Y, Dataset#1
library(dplyr)
library(graphics)
DF1D <- data.frame(x=c(10,8,13,9,11,14,6,4,12,7,5),
y=c(8.04,6.95,7.58,8.81,8.33,9.96,7.24,4.26,10.84,4.82,5.68))
DF1D## x y
## 1 10 8.04
## 2 8 6.95
## 3 13 7.58
## 4 9 8.81
## 5 11 8.33
## 6 14 9.96
## 7 6 7.24
## 8 4 4.26
## 9 12 10.84
## 10 7 4.82
## 11 5 5.68
DataFrame X e Y, Dataset#2
DF2H <- data.frame(x=c(10,8,13,9,11,14,6,4,12,7,5),
y= c(9.14,8.14,8.74,8.77,9.26,8.1,6.13,3.1,9.13,7.26,4.74)
)
DF2H## x y
## 1 10 9.14
## 2 8 8.14
## 3 13 8.74
## 4 9 8.77
## 5 11 9.26
## 6 14 8.10
## 7 6 6.13
## 8 4 3.10
## 9 12 9.13
## 10 7 7.26
## 11 5 4.74
DataFrame X e Y, Dataset#3
DF3W <- data.frame(x=c(10,8,13,9,11,14,6,4,12,7,5),
y=c(7.46,6.77,12.74,7.11,7.81,8.84,6.08,5.39,8.15,6.42,5.73)
)
DF3W## x y
## 1 10 7.46
## 2 8 6.77
## 3 13 12.74
## 4 9 7.11
## 5 11 7.81
## 6 14 8.84
## 7 6 6.08
## 8 4 5.39
## 9 12 8.15
## 10 7 6.42
## 11 5 5.73
DataFrame X e Y, Dataset#4
DF4T <- data.frame(x=c(8,8,8,8,8,8,8,19,8,8,8),
y=c(6.58,5.76,7.71,8.84,8.47,7.04,5.25,12.5,5.56,7.91,6.89)
)
DF4T## x y
## 1 8 6.58
## 2 8 5.76
## 3 8 7.71
## 4 8 8.84
## 5 8 8.47
## 6 8 7.04
## 7 8 5.25
## 8 19 12.50
## 9 8 5.56
## 10 8 7.91
## 11 8 6.89
3- Para el dataset escogido, calcular:
Media_Dataset 1
## [1] 9
## [1] 7.500909
Media_Dataset 2
## [1] 9
## [1] 7.500909
Media_Dataset 3
## [1] 9
## [1] 7.5
Media_Dataset 4
## [1] 9
## [1] 7.500909
Desviación estándar_Dataset 1
## [1] 3.316625
## [1] 2.031568
Desviación estándar_Dataset 2
## [1] 3.316625
## [1] 2.031657
Desviación estándar_Dataset 3
## [1] 3.316625
## [1] 2.030424
Desviación estándar_Dataset 4
## [1] 3.316625
## [1] 2.030579
Correlación de X e Y-Dataset 1
## [1] 0.8164205
Correlación de X e Y-Dataset 2
## [1] 0.8162365
Correlación de X e Y-Dataset 3
## [1] 0.8162867
Correlación de X e Y-Dataset 4
## [1] 0.8165214
Scatterplot
1.Crear el scatterplot de x e y, con cada variable en su correspondiente eje.
Scatterplot Dataset 1
plot(x=DF1D$x, y=DF1D$y,
main= "Scatterplot entre X y Y_DF1Dennis",
xlab="X",
ylab = "Y",
pch = 19, frame = FALSE)Scatterplot Dataset 2
plot(x=DF2H$x, y=DF2H$y,
main= "Scatterplot entre X y Y_DF2Hellen",
xlab="X",
ylab ="Y",
pch = 8, frame = FALSE)Scatterplot Dataset 3
plot(x=DF3W$x, y=DF3W$y,
main= "Scatterplot entre X y Y_DF3Wendy",
xlab="X",
ylab = "Y",
pch = 23, frame = FALSE)Scatterplot Dataset 4
plot(x=DF4T$x, y=DF4T$y,
main= "Scatterplot entre X y Y_DF4Thelma",
xlab="X",
ylab ="Y",
pch = 24, frame = FALSE)Juntarse con tres compañeros que hayan escogido datasets diferentes(no se puede repetir datasets a menos que no hayan más opciones de compañeros).
Analisis de Resultados y Conclusiones
La media de la variable X en todos los datasets es de 9, mientras que la de Y es 7,5 en todos los Datasets.
Respecto a la desviación estándar de X, en todos los datasets es 3,16 mientras que la de Y en todos los datasets es 2,03.
Para los 4 datasets los scatterplots presentan una correlacion de 0.816, cercana a 1, con tendencia positiva, donde se hace notable la igualdad de los valores en X para los 3 primeros datasets, y dandose una variacion en los valores de Y.
Sin embargo, el que muestra el mejor es el Scatterplot 1 con una tendencia creciente variable con picos de incrementos, nostrando una correlacion positiva baja.
El Scatterplot 2, inicia con una tendencia ascendente y partir del x-11 empieza a decrecer.
En el Scatterplot 1, la correlación de X-Y es con un ascenso variable que difiere de los datesets 2 y 3, pero en el x-13 muestra un valor de 12.74, que se sale de la constante de crecimiento en relación con la tendencia que venía registrando.
El scatterplot del dataset 3 presenta casi una correlacion positiva perfecta de no ser por el eje X 13 e Y con 12.74 que hace que salga de la trayectoria lineal.
Finalmente, en el Scatterplot 4, las variable X muestra un mismo valor en la mayoria de los factores de X, por lo tanto su comportamiento lineal muestra una amplia dispercion entre los valores 8 y 19 en X.