Análisis de los datos de Samsung Galaxy S2

Proyecto final - manejo de R - SEE

1. Carga de librerías

library(openxlsx)
library(tidyverse)
library(magrittr)
library(rmarkdown)
library(DT)
library(reshape2)
library(plotly)
library(rmdformats)

2. Carga y manipulación de datos

2.1 Carga de datos

Sgalaxy <- read.xlsx("../Datos/Sgalaxy.xlsx")
actividades <- read.xlsx("../Datos/actividades.xlsx")

2.2 Manipulación de datos

Unión de tablas mediante “code”

data <- left_join(actividades,Sgalaxy,by="code")

Seleccionando las columnas a trabajar

data <- data %>% select(code,activity,subject,contains("Media")|contains("DesvSTD"))

Reemplazando por los nombres indicados

colnames(data) <- gsub("Acc","Acelerometro",colnames(data))
colnames(data) <- gsub("Gyro","Giroscopio",colnames(data))
colnames(data) <- gsub("BodyBody","Cuerpo",colnames(data))
colnames(data) <- gsub("Body","Cuerpo",colnames(data))
colnames(data) <- gsub("Mag","Magnitud",colnames(data))
colnames(data) <- gsub("angle","Angulo",colnames(data))
colnames(data) <- gsub("gravity","Gravedad",colnames(data))
colnames(data) <- gsub("Gravity","Gravedad",colnames(data))

Agrupando por actividad y subject y promediando el resto

data1 <- data %>% group_by(activity,subject) %>% summarise_all(mean)

datatable(data1,class = "cell-border",options = list(dom = "ltipr",
  pageLength = 5, lengthMenu= c(5,10,25,50,100),autoWidth = F, scrollX = T),
  style = "bootstrap", escape = F)

3 Visualización de los datos

Para una mejor visualización de los datos estos serán agrupados solo por actividad

data2 <- data1 %>% select(-subject,-code) %>% group_by(activity) %>%
  summarise_all(mean) %>% melt(id.vars="activity")

data3 <- ggplot(data2,aes(x=activity,y=value, color=variable))+
  geom_point(aes(color=activity))+
  theme(plot.title = element_text(family = "Arial",face= "bold",size = 14),axis.text.x = element_text(), legend.position = "none",)+
  labs(title="Clasificación de las actividades según su tiempo de media y desviación estandar",
       x = "Actividad",
       y="Valor del tiempo y desviación estandar medio")

ggplotly(data3)

3.1 Tabla de datos relevantes

Datos relevantes de Samsung Galaxy S 2

data4 <- data1 %>% select(-subject,-code) %>% group_by(activity) %>%
  summarise_all(mean)

datatable(data4,class = "cell-border",options = list( dom= "tifpr",
  autoWidth = F, scrollX = T), style = "bootstrap", escape = F)