Ejercicios guĆ­a fase 1

Bryan Solano

Cargue el siguiente conjunto de datos desde el repositorio Github.

fertilizante <- read.delim("https://raw.githubusercontent.com/JPASTORPM/D
atabase/master/Fertilizantes.txt", header = T, sep = "\t", dec = ".")
str(fertilizante) # permite ver la estructura de los datos, nĆŗmero de columna, nĆŗmero de observaciones (filas), y el tipo de datos en cada columna(i.e. nĆŗmerico, caracter, fecha, factor, integral, etc)
## 'data.frame':    62 obs. of  8 variables:
##  $ tratamiento: chr  "organico" "organico" "organico" "organico" ...
##  $ A          : num  12.7 12.7 12.4 12.4 12 ...
##  $ gs         : num  0.097 0.103 0.1 0.094 0.098 0.092 0.12 0.115 0.117 0.108 ...
##  $ WUEi       : num  0.131 0.123 0.124 0.131 0.123 0.131 0.097 0.099 0.097 0.104 ...
##  $ proteina   : num  84.4 86.7 84.6 82.3 82.4 ...
##  $ almidon    : num  25.7 24.4 23.8 25.1 23.2 ...
##  $ ACC        : num  198 246 239 193 233 ...
##  $ AIA        : num  0.986 1.633 1.592 0.962 1.551 ...
head(fertilizante)
##   tratamiento     A    gs  WUEi proteina almidon     ACC   AIA
## 1    organico 12.68 0.097 0.131   84.438  25.727 198.187 0.986
## 2    organico 12.67 0.103 0.123   86.740  24.413 245.527 1.633
## 3    organico 12.36 0.100 0.124   84.572  23.803 239.388 1.592
## 4    organico 12.36 0.094 0.131   82.327  25.083 193.233 0.962
## 5    organico 12.04 0.098 0.123   82.403  23.193 233.250 1.551
## 6    organico 12.04 0.092 0.131   80.216  24.440 188.278 0.937
library(TeachingDemos)
## Warning: package 'TeachingDemos' was built under R version 4.0.4
library(plotrix)
library(fdth)
## Warning: package 'fdth' was built under R version 4.0.4
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var

1-) Calcular el valor de la media aritmetica, desviacion estandar y mediana de la variable proteina para los tratamientos: organico, NPK y control:

protorg<-fertilizante$proteina[fertilizante$tratamiento=="organico"]
protnpk<-fertilizante$proteina[fertilizante$tratamiento=="NPK"]
protcont<-fertilizante$proteina[fertilizante$tratamiento=="control"]

summary(protorg)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   54.05   66.89   83.42   86.79   97.19  127.68
sd(protorg)
## [1] 24.20687
summary(protnpk)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   50.80   81.78   86.09   85.50   94.14   99.10
sd(protnpk)
## [1] 11.66933
summary(protcont)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   48.26   66.05   84.94   80.69   97.07  102.40
sd(protcont)
## [1] 18.53309
  1. Calcular el valor la desviación estÔndar y el error típico la variable proteina para cada tratamiento (organico, NPK y Control):
std.error(protorg)
## [1] 5.160921
std.error(protnpk)
## [1] 2.546457
std.error(protcont)
## [1] 4.251782
  1. A partir de la información anterior y usando la base de conocimiento adquirido durante la clase de teoría y/o laboratorio, calcular los intervalos de confianza al 95% de la variable proteina para cada tratamiento (organico, NPK y Control)
t.test(protorg, conf.level =  0.95)
## 
##  One Sample t-test
## 
## data:  protorg
## t = 16.816, df = 21, p-value = 1.165e-13
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  76.05232 97.51777
## sample estimates:
## mean of x 
##  86.78505
t.test(protnpk, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  protnpk
## t = 33.575, df = 20, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  80.18466 90.80829
## sample estimates:
## mean of x 
##  85.49648
t.test(protcont, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  protcont
## t = 18.977, df = 18, p-value = 2.379e-13
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  71.75450 89.61982
## sample estimates:
## mean of x 
##  80.68716
  1. Con base en el conocimiento adquirido durante la clase de teorĆ­a y/o laboratorio, explicar si existe diferencia significativa al 95% entre los tratamientos para la variable proteina usando unicamente los intervalos de confianza calculados en el punto anterior:
boxplot(protorg, protnpk, protcont, main = "Proteina segun distintos tratamientos", horizontal = T, xlim=c(0.5,3.5), ann = T, notch = T ,names = c("Organico","NPK","Control"), xlab = "Intervalos de confianza", ylab= "Tratamiento", col =c(123,445,456))

Bueno, si observamos los intervalos de nuestras 3 pruebas, vemos que estos se sobrelapan por lo que se comprueba la hipótesis nula, en otras palabras, hay igualdad.

  1. Realizar un histograma de frecuencia para la variable almidon para cada tratamiento:
almidorg<- fertilizante$almidon[fertilizante$tratamiento=="organico"]
almidnpk<- fertilizante$almidon[fertilizante$tratamiento=="NPK"]
almidcont<- fertilizante$almidon[fertilizante$tratamiento=="control"]
hist(almidorg, main = "Histograma de variable almidon con tratamiento organico.", ylab = "Frecuencia", xlab = "Almidon", col = c("azure3","darkolivegreen4","white","black","darkgoldenrod1","darkcyan"))

hist(almidnpk, main = "Histograma de variable almidon con tratamiento organico.", ylab = "Frecuencia", xlab = "Almidon", col = c("azure3","darkolivegreen4","darkkhaki","lightgray","darkgoldenrod1","darkcyan"))

hist(almidcont, main = "Histograma de variable almidon con tratamiento organico.", ylab = "Frecuencia", xlab = "Almidon", col = c("darkgoldenrod1","azure3","darkkhaki","darkolivegreen4","lightgray","darkcyan"))