Tarea 2 computacion

IMPORTANDO DATOS

library(readxl)
datost <- read_excel("datost.xlsx")

GENERANDO HISTOGRAMAS DE DISTRIBUCION PARA LAS VARIABLES HUMEDAD RELATIVA Y TEMPERATURA MEDIA

humr <- hist(datost$RHUM, col = 'blue', ylim = c(0, 800), xlim = c(60, 110), main = 'Distribucion de Humedad relativa', xlab = 'Humedad relativa %')
rug(datost$RHUM, col = 'green')

tmed <- hist(datost$Tmed, col = 'red', ylim = c(0,400), xlim = c(20,30), main = 'Distribucion de Temperatura media', xlab = 'Temperatura media °C')
rug(datost$Tmed, col = 'green')

Creando graficos de distribucion

plot(datost$Tmed,datost$RHUM, main = 'Temperatura media vs Humedad relativa', ylab = 'Humedad Relativa', xlab = 'Temperatura media', pch = 16)

Formula de estandarización

\[Z = \frac{x-\mu_x}{\sigma_x}\] * Para hacer uso de la formula de estandarizacion se debe sacar la media y la desviacion estandar

medtemp = mean(datost$Tmed); medtemp

## [1] 26.20355

sdtemp = sd(datost$Tmed); sdtemp

## [1] 1.174865

medhumr = mean(datost$RHUM); medhumr

## [1] 87.97851

sdhumr = sd(datost$RHUM); sdhumr

## [1] 7.024278

# funcion para estandarizar
estand = function(x){
  media = mean(x)
  desv = sd(x)
  z = (x - media)/desv
  return(z)
}

# estandarizando Tmed
etmed = estand(datost$Tmed)

# estandarizando vis
ehumr = estand(datost$RHUM)

#Generando graficos de comparacion

par(mfrow = c(2, 2))
hist(datost$Tmed, main = 'Tmed NO estandarizada', xlab = 'Temperatura media °C', col = 'green' )
hist(etmed, main = 'Tmed estandarizada', xlab = 'Temperatura media', col = 'orange')
hist(datost$RHUM, main = 'Humr NO estandarizada', xlab = 'Humedad relativa', col = 'green')
hist(ehumr, main = 'Humr estandarizada', xlab = 'Humedad relativa', col = 'orange')

Como la estandarizacion hace que la media sea 0 vamos a comprobar

# Datos de temperatura
(medtemp = mean(datost$Tmed)) # media temperatura sin estandarizar

## [1] 26.20355

(dstemp = sd(datost$Tmed)) # desviación temperatura sin estandarizar

## [1] 1.174865

(medetmed = mean(etmed)) # media de temperatura estandarizada

## [1] -8.148022e-16

(desvetmed = sd(etmed)) # desviación de temperatura estandarizada

## [1] 1

#Datos de humedad relariva

(medhumr = mean(datost$RHUM)) # media temperatura sin estandarizar

## [1] 87.97851

(dshumr = sd(datost$RHUM)) # desviación temperatura sin estandarizar

## [1] 7.024278

(medehumr = mean(ehumr)) # media de temperatura estandarizada = 0

## [1] 2.866366e-16

(desvehumr = sd(ehumr)) # desviación de temperatura estandarizada = 1

## [1] 1

pch = 19, cex = 0.8, pch = 19, cex = 0.8

par(mfrow = c(1, 2))
plot(etmed, ehumr, pch = 19, cex = 0.5, main = 'Estandarizado')
points(x = mean(etmed), y = mean(ehumr), col = 'red', pch = 20)
plot(datost$Tmed, datost$RHUM, pch =19, cex = 0.5, main = 'No Estandarizado')
points(x = mean(datost$Tmed), y = mean(datost$RHUM), col = 'orange', pch = 20)

grafico no estandarizado con igual escala en los ejes

plot(datost$Tmed, datost$RHUM, pch =19, cex = 0.5, ylim = c(0,100), xlim = c(0,100), main = 'No Estandarizado', ylab = 'Humedad relativa %', xlab = 'Temperatura media en °C')

cor(datost$Tmed, datost$RHUM)

## [1] -0.6034923

Analisis: La grafica de los datos sin estandarizar es engañosa ya que al evidenciar escalas de medida diferentes pueden arrojar datos de correlacion erroneos mientras que la estandarizada al estar con la misma escala nos da una vision mas cercana de la correlacion de los datos.

Tarea 2 computacion

GINNA VALENTINA ROMERO RINCON

31/0/2020

IMPORTANDO DATOS

GENERANDO HISTOGRAMAS DE DISTRIBUCION PARA LAS VARIABLES HUMEDAD RELATIVA Y TEMPERATURA MEDIA

Creando graficos de distribucion

Formula de estandarización