guia-1.utf8

Ejercicios guía fase 1

Bryan Solano

Cargue el siguiente conjunto de datos desde el repositorio Github.

fertilizante <- read.delim("https://raw.githubusercontent.com/JPASTORPM/D
atabase/master/Fertilizantes.txt", header = T, sep = "\t", dec = ".")
str(fertilizante) # permite ver la estructura de los datos, número de columna, número de observaciones (filas), y el tipo de datos en cada columna(i.e. númerico, caracter, fecha, factor, integral, etc)

## 'data.frame':    62 obs. of  8 variables:
##  $ tratamiento: chr  "organico" "organico" "organico" "organico" ...
##  $ A          : num  12.7 12.7 12.4 12.4 12 ...
##  $ gs         : num  0.097 0.103 0.1 0.094 0.098 0.092 0.12 0.115 0.117 0.108 ...
##  $ WUEi       : num  0.131 0.123 0.124 0.131 0.123 0.131 0.097 0.099 0.097 0.104 ...
##  $ proteina   : num  84.4 86.7 84.6 82.3 82.4 ...
##  $ almidon    : num  25.7 24.4 23.8 25.1 23.2 ...
##  $ ACC        : num  198 246 239 193 233 ...
##  $ AIA        : num  0.986 1.633 1.592 0.962 1.551 ...

head(fertilizante)

##   tratamiento     A    gs  WUEi proteina almidon     ACC   AIA
## 1    organico 12.68 0.097 0.131   84.438  25.727 198.187 0.986
## 2    organico 12.67 0.103 0.123   86.740  24.413 245.527 1.633
## 3    organico 12.36 0.100 0.124   84.572  23.803 239.388 1.592
## 4    organico 12.36 0.094 0.131   82.327  25.083 193.233 0.962
## 5    organico 12.04 0.098 0.123   82.403  23.193 233.250 1.551
## 6    organico 12.04 0.092 0.131   80.216  24.440 188.278 0.937

library(TeachingDemos)

## Warning: package 'TeachingDemos' was built under R version 4.0.4

library(plotrix)
library(fdth)

## Warning: package 'fdth' was built under R version 4.0.4

## 
## Attaching package: 'fdth'

## The following objects are masked from 'package:stats':
## 
##     sd, var

1-) Calcular el valor de la media aritmetica, desviacion estandar y mediana de la variable proteina para los tratamientos: organico, NPK y control:

protorg<-fertilizante$proteina[fertilizante$tratamiento=="organico"]
protnpk<-fertilizante$proteina[fertilizante$tratamiento=="NPK"]
protcont<-fertilizante$proteina[fertilizante$tratamiento=="control"]

summary(protorg)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   54.05   66.89   83.42   86.79   97.19  127.68

sd(protorg)

## [1] 24.20687

summary(protnpk)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   50.80   81.78   86.09   85.50   94.14   99.10

sd(protnpk)

## [1] 11.66933

summary(protcont)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   48.26   66.05   84.94   80.69   97.07  102.40

sd(protcont)

## [1] 18.53309

Calcular el valor la desviación estándar y el error típico la variable proteina para cada tratamiento (organico, NPK y Control):

std.error(protorg)

## [1] 5.160921

std.error(protnpk)

## [1] 2.546457

std.error(protcont)

## [1] 4.251782

A partir de la información anterior y usando la base de conocimiento adquirido durante la clase de teoría y/o laboratorio, calcular los intervalos de confianza al 95% de la variable proteina para cada tratamiento (organico, NPK y Control)

t.test(protorg, conf.level =  0.95)

## 
##  One Sample t-test
## 
## data:  protorg
## t = 16.816, df = 21, p-value = 1.165e-13
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  76.05232 97.51777
## sample estimates:
## mean of x 
##  86.78505

t.test(protnpk, conf.level = 0.95)

## 
##  One Sample t-test
## 
## data:  protnpk
## t = 33.575, df = 20, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  80.18466 90.80829
## sample estimates:
## mean of x 
##  85.49648

t.test(protcont, conf.level = 0.95)

## 
##  One Sample t-test
## 
## data:  protcont
## t = 18.977, df = 18, p-value = 2.379e-13
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  71.75450 89.61982
## sample estimates:
## mean of x 
##  80.68716

Con base en el conocimiento adquirido durante la clase de teoría y/o laboratorio, explicar si existe diferencia significativa al 95% entre los tratamientos para la variable proteina usando unicamente los intervalos de confianza calculados en el punto anterior:

boxplot(protorg, protnpk, protcont, main = "Proteina segun distintos tratamientos", horizontal = T, xlim=c(0.5,3.5), ann = T, notch = T ,names = c("Organico","NPK","Control"), xlab = "Intervalos de confianza", ylab= "Tratamiento", col =c(123,445,456))

Bueno, si observamos los intervalos de nuestras 3 pruebas, vemos que estos se sobrelapan por lo que se comprueba la hipótesis nula, en otras palabras, hay igualdad.

Realizar un histograma de frecuencia para la variable almidon para cada tratamiento:

almidorg<- fertilizante$almidon[fertilizante$tratamiento=="organico"]
almidnpk<- fertilizante$almidon[fertilizante$tratamiento=="NPK"]
almidcont<- fertilizante$almidon[fertilizante$tratamiento=="control"]
hist(almidorg, main = "Histograma de variable almidon con tratamiento organico.", ylab = "Frecuencia", xlab = "Almidon", col = c("azure3","darkolivegreen4","white","black","darkgoldenrod1","darkcyan"))

hist(almidnpk, main = "Histograma de variable almidon con tratamiento organico.", ylab = "Frecuencia", xlab = "Almidon", col = c("azure3","darkolivegreen4","darkkhaki","lightgray","darkgoldenrod1","darkcyan"))

hist(almidcont, main = "Histograma de variable almidon con tratamiento organico.", ylab = "Frecuencia", xlab = "Almidon", col = c("darkgoldenrod1","azure3","darkkhaki","darkolivegreen4","lightgray","darkcyan"))