==================================================

Clear the Workspace

rm(list = ls())

Download and unzip the dataset:

filename <- "getdata_dataset.zip"

if (!file.exists(filename)){
  download.file(url = paste("https://d396qusza40orc.cloudfront.net/getdata%2Fprojectfiles%2FUCI%20HAR%20Dataset.zip", 
                          sep = ""), 
              destfile = filename, mode = 'wb',cacheOK = FALSE)
}

if (!file.exists("UCI HAR Dataset")) { 
  unzip(filename) 
}

Load activity lables as tables and convert the class of activity as characters

activityLabels <- read.table("UCI HAR Dataset/activity_labels.txt")
activityLabels[,2] <- as.character(activityLabels[,2])

Load features as tables and convert the class of features as characters

features <- read.table("UCI HAR Dataset/features.txt")
features[,2] <- as.character(features[,2])

Extracts only the measurements on the mean and standard deviation for each measurement

featuresWanted <- grep(".*mean.*|.*std.*", features[,2])
featuresWanted.names <- features[featuresWanted,2]
featuresWanted.names = gsub('-mean', 'Mean', featuresWanted.names)
featuresWanted.names = gsub('-std', 'Std', featuresWanted.names)
featuresWanted.names <- gsub('[-()]', '', featuresWanted.names)

Load the training datasets, training lables and subject who performed the activity window sample (ranges from 1 to 30)

train <- read.table("UCI HAR Dataset/train/X_train.txt")[featuresWanted]
trainActivities <- read.table("UCI HAR Dataset/train/Y_train.txt")
trainSubjects <- read.table("UCI HAR Dataset/train/subject_train.txt")

Merge Training dataset, Activities and Subjects

train <- cbind(trainSubjects, trainActivities, train)

Load the testing datasets, testing lables and subject who performed the activity window sample (ranges from 1 to 30)

test <- read.table("UCI HAR Dataset/test/X_test.txt")[featuresWanted]
testActivities <- read.table("UCI HAR Dataset/test/Y_test.txt")
testSubjects <- read.table("UCI HAR Dataset/test/subject_test.txt")

Merge Testing dataset, Activities and Subjects

test <- cbind(testSubjects, testActivities, test)

Merges the training and the testing data sets to create one data set

CombinedData <- rbind(train, test)

Appropriately labels the data set with descriptive variable names

colnames(CombinedData) <- c("subject", "activity", featuresWanted.names)

Convert activities & subjects into factors from activityLabels

CombinedData$activity <- factor(CombinedData$activity, 
                                levels = activityLabels[,1], 
                                labels = activityLabels[,2])

CombinedData$subject <- as.factor(CombinedData$subject)

Convert Combineddata into a molten data frame

library(reshape2)

## Warning: package 'reshape2' was built under R version 3.2.3

CombinedData.melted <- melt(CombinedData, id = c("subject", "activity"))

Cast a molten data frame into data frame subject and activities are breaked by variables and averaged Basically, this creates a independent tidy data set with the average of each variable for each activity and each subject.

CombinedData.mean <- dcast(CombinedData.melted, 
                           subject + activity ~ variable, mean)

Upload complete data set as a txt file created with write.table() using row.name=FALSE

write.table(CombinedData.mean, file = "TidyDataSet.txt", 
            row.names = FALSE, quote = FALSE)

==================================================

Title: “Getting and Cleaning Data Peer Assessment”

Date: “December 20, 2015”

==================================================