Análisis de los datos de Samsung Galaxy S2
Análisis de los datos de Samsung Galaxy S2
Proyecto final - manejo de R - SEE
Proyecto final - manejo de R - SEE
1. Carga de librerías
library(openxlsx)
library(tidyverse)
library(magrittr)
library(rmarkdown)
library(DT)
library(reshape2)
library(plotly)
library(rmdformats)2. Carga y manipulación de datos
2.1 Carga de datos
Sgalaxy <- read.xlsx("../Datos/Sgalaxy.xlsx")
actividades <- read.xlsx("../Datos/actividades.xlsx")2.2 Manipulación de datos
Unión de tablas mediante “code”
data <- left_join(actividades,Sgalaxy,by="code")Seleccionando las columnas a trabajar
data <- data %>% select(code,activity,subject,contains("Media")|contains("DesvSTD"))Reemplazando por los nombres indicados
colnames(data) <- gsub("Acc","Acelerometro",colnames(data))
colnames(data) <- gsub("Gyro","Giroscopio",colnames(data))
colnames(data) <- gsub("BodyBody","Cuerpo",colnames(data))
colnames(data) <- gsub("Body","Cuerpo",colnames(data))
colnames(data) <- gsub("Mag","Magnitud",colnames(data))
colnames(data) <- gsub("angle","Angulo",colnames(data))
colnames(data) <- gsub("gravity","Gravedad",colnames(data))
colnames(data) <- gsub("Gravity","Gravedad",colnames(data))Agrupando por actividad y subject y promediando el resto
data1 <- data %>% group_by(activity,subject) %>% summarise_all(mean)
datatable(data1,class = "cell-border",options = list(dom = "ltipr",
pageLength = 5, lengthMenu= c(5,10,25,50,100),autoWidth = F, scrollX = T),
style = "bootstrap", escape = F)3 Visualización de los datos
Para una mejor visualización de los datos estos serán agrupados solo por actividad
data2 <- data1 %>% select(-subject,-code) %>% group_by(activity) %>%
summarise_all(mean) %>% melt(id.vars="activity")
data3 <- ggplot(data2,aes(x=activity,y=value, color=variable))+
geom_point(aes(color=activity))+
theme(plot.title = element_text(family = "Arial",face= "bold",size = 14),axis.text.x = element_text(), legend.position = "none",)+
labs(title="Clasificación de las actividades según su tiempo de media y desviación estandar",
x = "Actividad",
y="Valor del tiempo y desviación estandar medio")
ggplotly(data3)3.1 Tabla de datos relevantes
Datos relevantes de Samsung Galaxy S 2
data4 <- data1 %>% select(-subject,-code) %>% group_by(activity) %>%
summarise_all(mean)
datatable(data4,class = "cell-border",options = list( dom= "tifpr",
autoWidth = F, scrollX = T), style = "bootstrap", escape = F)