U : ā€œ9ā€

punto1

muestra independiente

library(tidyverse)
## ── Attaching packages ──────────────────────────────────────────────────────────────────────── tidyverse 1.3.0 ──
## āœ“ ggplot2 3.3.0     āœ“ purrr   0.3.4
## āœ“ tibble  3.0.1     āœ“ dplyr   0.8.5
## āœ“ tidyr   1.0.3     āœ“ stringr 1.4.0
## āœ“ readr   1.3.1     āœ“ forcats 0.5.0
## ── Conflicts ─────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(readxl)
library(Rcpp)
Df<- read_excel("datos_2.xlsx")
data.frame(Df)
##    Conductancia Variedad
## 1          0.45 Colombia
## 2          0.41 Colombia
## 3          0.49 Colombia
## 4          0.46 Colombia
## 5          0.39 Colombia
## 6          0.44 Colombia
## 7          0.48 Colombia
## 8          0.42 Colombia
## 9          0.44 Colombia
## 10         0.48 Colombia
## 11         0.50 Colombia
## 12         0.47 Colombia
## 13         0.44 Colombia
## 14         0.52 Colombia
## 15         0.28  Ocarina
## 16         0.25  Ocarina
## 17         0.32  Ocarina
## 18         0.34  Ocarina
## 19         0.36  Ocarina
## 20         0.40  Ocarina
## 21         0.39  Ocarina
## 22         0.36  Ocarina
## 23         0.39  Ocarina
## 24         0.41  Ocarina
## 25         0.37  Ocarina
## 26         0.42  Ocarina
## 27         0.41  Ocarina
## 28           NA  Ocarina
Df_C<- na.omit(Df )

Hipotesis

Ho: mu(conductancia)colombia == mu(conductancia)Ocarina Ha: mu(conductancia)ocarina < mu(conductancia)Ocarina

pruebaT1<-t.test(x = Df_C$Conductancia[Df_C$Variedad == 'Colombia'],
                 y = Df_C$Conductancia[Df_C$Variedad == 'Ocarina'],
                 mu = 0, alternative = 'l', conf.level = 0.95)
pruebaT1$p.value
## [1] 0.9999901

ifelse(prb_1$p.value<0.05, ā€˜Rechazo Ho: Las medias no son iguales’, ā€˜No rechazo Ho: medias iguales’)

no se rechazo Ho el p valor > 0.05 las medias son iguales

varianza, Prueba f

varianza

tapply(Df_C$Conductancia,Df_C$Variedad, var)
##    Colombia     Ocarina 
## 0.001317033 0.002714103

Hipotesis

Ho:la varianza de los datos de varieda(Colombia) == varianaza varieda 2(Ocarina) Ha:la varianza de los datos de varieda(Colombia) != varianaza varieda 2(Ocarina)

pruebaT1v<-var.test(x = Df_C$Conductancia[Df_C$Variedad == 'Colombia'],
                    y = Df_C$Conductancia[Df_C$Variedad == 'Ocarina'],
                    ratio = 1, alternative = 't', conf.level = 0.95)
pruebaT1v$p.value
## [1] 0.2104318

ifelse(pruebaT1v$p.value<0.05, ā€˜Rechazo Ho: var desiguales’, ā€˜No rechazo Ho: var iguales’)

conclusiones

vemos que el p.valor se encuentra arriba de nuestro nivel de significancia concluimos que presenta varianzas y medias iguales.

punto 2

P2<- read_excel("dependientes2.xlsx")
data.frame(P2)
##    Rendimiento  Dias
## 1           69 45dds
## 2           66 45dds
## 3           72 45dds
## 4           68 45dds
## 5           65 45dds
## 6           66 45dds
## 7           67 45dds
## 8           68 45dds
## 9           69 45dds
## 10          69 45dds
## 11          66 45dds
## 12          68 45dds
## 13          64 45dds
## 14          67 45dds
## 15          60 45dds
## 16          68 45dds
## 17         873 77dds
## 18         850 77dds
## 19         832 77dds
## 20         834 77dds
## 21         843 77dds
## 22         840 77dds
## 23         895 77dds
## 24         790 77dds
## 25         905 77dds
## 26         910 77dds
## 27         920 77dds
## 28         840 77dds
## 29         832 77dds
## 30         800 77dds
## 31         759 77dds
## 32         812 77dds

graficos

library(lattice)
bwplot(P2$Rendimiento~P2$Dias)

P2.2<- read_excel("dependientes.xlsx")
data.frame(P2.2)
##    X45dds X77dds
## 1      69    873
## 2      66    850
## 3      72    832
## 4      68    834
## 5      65    843
## 6      66    840
## 7      67    895
## 8      68    790
## 9      69    905
## 10     69    910
## 11     66    920
## 12     68    840
## 13     64    832
## 14     67    800
## 15     60    759
## 16     68    812

prueba t

Ho: mu(45dds) == mu(77dds) Ha: mu(45dds) != mu(77dds)

P2_t = t.test(P2.2$`45dds`,P2.2$`77dds`, paired = T, mu =0, conf.level = 0.95,
       alternative = 't')
P2_t$p.value
## [1] 2.605717e-20

ifelse(prb_2$p.value<0.05, ā€˜Rechazo Ho: ambas capas tiene diferente rendimiento’, ā€˜No rechazo Ho: el rendimiento de las capas es igual’)

se rechaza Ho p valor < 0.05 significa que los kg/ha fueron diferentes

cambio relativo

medias

me45<-mean(P2.2$`45dds`)
me77<-mean(P2.2$`77dds`)
me45
## [1] 67
me77
## [1] 845.9375

cambio relativo promedio

Crp<-((me77-me45)/me45)*100
Crp
## [1] 1162.593

incremento de 1162(kg/ha)entre 45 y 77 dias

prueba de correlacion/correlacion de pearson

p2Co<-cor.test(P2.2$`45dds`,P2.2$`77dds`, conf.level = 0.95, alternative = 't')
p2Co$p.value
## [1] 0.1339073

ifelse(P2C$p.value<0.05,ā€˜Correlacion NO nula’, ā€˜Correlacion nula’)

correlacion nula es decir si estan correlacionadas

conclusiones

vemos que el p.valor se encuentra arriba de nuestro nivel de significancia concluimos que tienen correlacion nula es decir estan correlacionadas.

punto 3

Dtp3 <-read_excel("Wilcoxon.xlsx")
data.frame(Dtp3)
##    Textura Aceite
## 1        3  Palma
## 2        4  Palma
## 3        3  Palma
## 4        4  Palma
## 5        4  Palma
## 6        3  Palma
## 7        3  Palma
## 8        4  Palma
## 9        4  Palma
## 10       3  Palma
## 11       4  Palma
## 12       4  Palma
## 13       2  Palma
## 14       4  Palma
## 15       3  Palma
## 16       4  Palma
## 17       3  Palma
## 18       3  Palma
## 19       3  Palma
## 20       4  Palma
## 21       4  Palma
## 22       3   MaĆ­z
## 23       4   MaĆ­z
## 24       4   MaĆ­z
## 25       4   MaĆ­z
## 26       4   MaĆ­z
## 27       4   MaĆ­z
## 28       3   MaĆ­z
## 29       4   MaĆ­z
## 30       3   MaĆ­z
## 31       4   MaĆ­z
## 32       4   MaĆ­z
## 33       4   MaĆ­z
## 34       4   MaĆ­z
## 35       3   MaĆ­z
## 36       4   MaĆ­z
## 37       4   MaĆ­z
## 38       4   MaĆ­z
## 39       3   MaĆ­z
## 40       3   MaĆ­z
## 41       4   MaĆ­z
## 42       3   MaĆ­z

medias

mediasaceite =tapply(Dtp3$Textura,Dtp3$Aceite, mean)
mediasaceite
##     MaĆ­z    Palma 
## 3.666667 3.476190

graficos

bwplot(Dtp3$Textura~Dtp3$Aceite)

ggplot(Dtp3,aes(x = Dtp3$Aceite,y = Dtp3$Textura))+
        geom_violin()+
        stat_summary(fun.y = mean, geom = "point", shape =18,
                     size = 3, color ="red")
## Warning: `fun.y` is deprecated. Use `fun` instead.
## Warning: Use of `Dtp3$Aceite` is discouraged. Use `Aceite` instead.
## Warning: Use of `Dtp3$Textura` is discouraged. Use `Textura` instead.
## Warning: Use of `Dtp3$Aceite` is discouraged. Use `Aceite` instead.
## Warning: Use of `Dtp3$Textura` is discouraged. Use `Textura` instead.

Verificacion de varianzas

Ho: varianza de textura de hojuela con aceite de palma == varianza de textura de hojuela con aceite de maiz Ha: varianza de textura de hojuela con aceite de palma != varianza de textura de hojuela con aceite de maiz ratio = 1, coceinte de varianzas == 1 (iguales)

pruebaT3v<-var.test(x = Dtp3$Textura[Dtp3$Aceite == 'Palma'],
                    y = Dtp3$Textura[Dtp3$Aceite == 'MaĆ­z'],
                    ratio = 1, alternative = 't', conf.level = 0.95)
pruebaT3v$p.value
## [1] 0.3343177

ifelse(IgualdadVarianzas2$p.value < 0.05, ā€˜Rechazo Ho: Las varianzas entre los grupos son diferentes’, ā€˜No rechazo Ho: Las varianzas entre los grupos son iguales’)

p valor > 0.05 las varianzas son iguales

Verificacion de la normalidad de los datos

shapiro.test(Dtp3$Textura[Dtp3$Aceite == 'Palma'])
## 
##  Shapiro-Wilk normality test
## 
## data:  Dtp3$Textura[Dtp3$Aceite == "Palma"]
## W = 0.72901, p-value = 6.474e-05
shapiro.test(Dtp3$Textura[Dtp3$Aceite == 'MaĆ­z'])
## 
##  Shapiro-Wilk normality test
## 
## data:  Dtp3$Textura[Dtp3$Aceite == "MaĆ­z"]
## W = 0.59907, p-value = 1.925e-06

las variables no presentan una distribucion normal pvalor < 0.05

Wilcoxon

Ho: Media de la textura de hojuela con aceite de palma == Media de la textura de hojuela con aceite de maiz Ha: Media de la textura de hojuela con aceite de palma != Media de la textura de hojuela con aceite de maiz

pruebaT3W<- wilcox.test(x = Dtp3$Textura[Dtp3$Aceite == 'Palma'],
                        y = Dtp3$Textura[Dtp3$Aceite == 'MaĆ­z'],
                        alternative = 'two.sided', mu = 0, paired = FALSE)
## Warning in wilcox.test.default(x = Dtp3$Textura[Dtp3$Aceite == "Palma"], :
## cannot compute exact p-value with ties
pruebaT3W$p.value
## [1] 0.3111338

ifelse(PruebaWilcoxon$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

conclusion

vemos que el p.valor se encuentra arriba de nuestro nivel de significancia concluimos que estadisticamente las medias de temperatura de almacenamiento frituras son iguales.

punto 4

DatosPunto4 <- read_excel("punto4.xlsx")
data.frame(DatosPunto4)
##      X4C  X12C CIELab
## 1  69.26 62.20      L
## 2  68.15 60.45      L
## 3  69.17 63.12      L
## 4  68.88 61.64      L
## 5  70.01 61.25      L
## 6  70.15 62.55      L
## 7  70.66 64.12      L
## 8  68.68 65.65      L
## 9  71.00 66.87      L
## 10 72.18 65.11      L
## 11 69.15 66.14      L
## 12 70.00 62.64      L
## 13 68.64 61.97      L
## 14 68.12 60.58      L
## 15 68.12 60.68      L
## 16 -1.31  0.81      a
## 17 -1.25  0.78      a
## 18 -1.49  0.55      a
## 19 -1.35  0.81      a
## 20 -1.32  0.77      a
## 21 -1.15  0.69      a
## 22 -1.25  0.59      a
## 23 -1.29  0.55      a
## 24 -1.42  0.42      a
## 25 -1.45  0.39      a
## 26 -1.29  0.41      a
## 27 -1.22  0.37      a
## 28 -1.19  0.35      a
## 29 -1.25  0.34      a
## 30 -1.25  0.34      a
## 31 28.68 37.31      b
## 32 27.66 35.90      b
## 33 28.02 36.36      b
## 34 27.66 36.12      b
## 35 27.66 36.45      b
## 36 26.88 35.99      b
## 37 26.25 36.14      b
## 38 26.26 36.14      b
## 39 28.15 35.55      b
## 40 30.00 34.77      b
## 41 28.24 32.32      b
## 42 25.59 31.96      b
## 43 24.69 30.17      b
## 44 25.56 36.65      b
## 45 26.26 37.15      b

pruebas Wilcoxon

contraste de L*

Ho: Media L* a 4°C == Media L* a 12°C Ha: Media L* a 4°C != Media L* a 12°C

PruebaWilcoxon2 <-wilcox.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "L"],
                              DatosPunto4$`4C`[DatosPunto4$CIELab == "L"],
                              paired = TRUE)
PruebaWilcoxon2$p.value
## [1] 6.103516e-05

ifelse(PruebaWilcoxon2$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

p valor menor 0.05 se rechaza Ho las medias son diferentes

Contraste de a*

Ho: Media a* a 4°C == Media a* a 12°C Ha: Media a* a 4°C != Media a* a 12°C

PruebaWilcoxon3 <- wilcox.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "a"],
                              DatosPunto4$`4C`[DatosPunto4$CIELab == "a"],
                              paired = TRUE) 
## Warning in wilcox.test.default(DatosPunto4$`12C`[DatosPunto4$CIELab == "a"], :
## cannot compute exact p-value with ties
PruebaWilcoxon3$p.value
## [1] 0.0007068908

ifelse(PruebaWilcoxon3$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

medias entre los grupos son diferentes

#Contraste de b*

Ho: Media b* a 4°C == Media b* a 12°C Ha: Media b* a 4°C != Media b* a 12°C

PruebaWilcoxon4 <- wilcox.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "b"],
                               DatosPunto4$`4C`[DatosPunto4$CIELab == "b"],
                               paired = TRUE)
PruebaWilcoxon4$p.value
## [1] 6.103516e-05

ifelse(PruebaWilcoxon4$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

se rechaza Ho significa que las medias diferente

ESTADISTICOS DE PRUEBA

#Para L >Ho: Media L a 4°C == Media L* a 12°C >Ha: Media L* a 4°C != Media L* a 12°C

PruebaT3= t.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "L"],
                 DatosPunto4$`4C`[DatosPunto4$CIELab == "L"],
                 paired = T, mu = 0, 
                 conf.level = 0.95, alternative = 't')
PruebaT3$p.value
## [1] 7.683573e-10

ifelse(PruebaT3$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

#Para a >Ho: Media a a 4°C == Media a* a 12°C >Ha: Media a* a 4°C != Media a* a 12°C

PruebaT4= t.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "a"],
                 DatosPunto4$`4C`[DatosPunto4$CIELab == "a"],
                 paired = T, mu = 0, 
                 conf.level = 0.95, alternative = 't')
PruebaT4$p.value
## [1] 7.319557e-15

ifelse(PruebaT4$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

#Para b >Ho: Media b a 4°C == Media b* a 12°C >Ha: Media b* a 4°C != Media b* a 12°C

PruebaT3= t.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "b"],
                 DatosPunto4$`4C`[DatosPunto4$CIELab == "b"],
                 paired = T, mu = 0, 
                 conf.level = 0.95, alternative = 't')
PruebaT3$p.value
## [1] 5.987182e-10

ifelse(PruebaT3$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

se rechaza Ho significa que las medias son diferente

conclusion General

vemos que los p.valor se encuentra abajo de nuestro nivel de significancia concluimos que estadisticamente las medias individuales de temperatura de almacenamiento con respecto a las tres variables son diferentes.

Transformacion para obtener Delta E

DatosPunto4a <- read_excel("Datos Taller-3.xlsx")
## New names:
## * L -> L...1
## * a -> a...2
## * b -> b...3
## * L -> L...4
## * a -> a...5
## * ...
data.frame(DatosPunto4a)
##    L...1 a...2 b...3 L...4 a...5 b...6   Delta.E
## 1  69.26 -1.31 28.68 62.20  0.81 37.31 11.349665
## 2  68.15 -1.25 27.66 60.45  0.78 35.90 11.458992
## 3  69.17 -1.49 28.02 63.12  0.55 36.36 10.503319
## 4  68.88 -1.35 27.66 61.64  0.81 36.12 11.342610
## 5  70.01 -1.32 27.66 61.25  0.77 36.45 12.584506
## 6  70.15 -1.15 26.88 62.55  0.69 35.99 12.005736
## 7  70.66 -1.25 26.25 64.12  0.59 36.14 11.998721
## 8  68.68 -1.29 26.26 65.65  0.55 36.14 10.496709
## 9  71.00 -1.42 28.15 66.87  0.42 35.55  8.671937
## 10 72.18 -1.45 30.00 65.11  0.39 34.77  8.724872
## 11 69.15 -1.29 28.24 66.14  0.41 32.32  5.347570
## 12 70.00 -1.22 25.59 62.64  0.37 31.96  9.862789
## 13 68.64 -1.19 24.69 61.97  0.35 30.17  8.768746
## 14 68.12 -1.25 25.56 60.58  0.34 36.65 13.504362
## 15 68.12 -1.25 26.26 60.68  0.34 37.15 13.284344

#Prueba Wilcoxon para una muestra

Ho: Media Delta E a 4°C == Media Delta E a 12°C Ha: Media Delta E a 4°C != Media Delta E a 12°C

PruebaWilcoxon5 <- wilcox.test(DatosPunto4a$`Delta E`, conf.int = T) 

PruebaWilcoxon4$p.value
## [1] 6.103516e-05

ifelse(PruebaWilcoxon5$p.value< 0.05, ā€˜Rechazo Ho: Las medias entre los grupos son diferentes’, ā€˜No rechazo Ho: Las medias entre los grupos son iguales’)

conclusion General

vemos que los p.valor se encuentra abajo de nuestro nivel de significancia concluimos que estadisticamente la medias de temperatura de almacenamiento con respecto al ΔE son diferentes. # Grafica 3D

library(scatterplot3d)
library(rgl)
## Warning in rgl.init(initValue, onlyNULL): RGL: unable to open X11 display
## Warning: 'rgl.init' failed, running with 'rgl.useNULL = TRUE'.
scatterplot3d(x=DatosPunto4a$a...2, y= DatosPunto4a$b...3, z=DatosPunto4a$L...1, 
              xlab = "a*", ylab = "b*", zlab = "L*",
              xlim = c(-1.50,-1.10), ylim = c(24,31), zlim = c(68,72.5),
              pch = 16,color = "wheat3", main = "CIEL*a*b* a 4°C")

scatterplot3d(x=DatosPunto4a$a...5, y= DatosPunto4a$b...6, z=DatosPunto4a$L...4,
              xlab = "a*", ylab = "b*", zlab = "L*",
              xlim = c(0.30,0.82), ylim = c(30,37.5), zlim = c(60,67),
              pch = 16,color = "wheat2", main = "CIEL*a*b* a 4°C")                               

punto 5

library(modeest)
## Registered S3 method overwritten by 'rmutil':
##   method         from
##   print.response httr
library(lattice)
Dap5 <- read_excel("punto5.xlsx")
data.frame(Dap5)
##    Bray Olsen Mehlich.3
## 1   7.1   6.0       9.1
## 2   6.8   6.2       7.1
## 3   6.6   6.4       7.8
## 4   6.7   6.6       7.3
## 5   6.8   6.9       7.6
## 6   6.7   6.6       7.8
## 7   6.9   6.4       7.4
## 8   6.8   6.4       7.3
## 9   6.7   6.5       7.3
## 10  6.6   6.3       7.1
## 11  6.9   6.4       8.0
## 12  7.4   6.6       8.7
## 13  6.6   6.6       7.6
## 14  6.7   6.7       7.8
## 15  6.8   6.4       7.8
## 16  7.0   6.2       7.2
## 17  6.9   6.6       7.2
## 18  6.7   6.3       7.9
## 19  7.1   5.8       7.3
## 20  6.6   6.5       7.5
## 21  6.6   6.2       7.1
## 22  6.9   6.4       7.1

Estadisticas descriptivas

medias por tratamiento

mp5b <-mean(Dap5$Bray);mp5b
## [1] 6.813636
mp5o <-mean(Dap5$Olsen);mp5o
## [1] 6.409091
mp5m <-mean(Dap5$`Mehlich-3`);mp5m
## [1] 7.590909

varianza

var(Dap5$Bray)
## [1] 0.04123377
var(Dap5$Olsen)
## [1] 0.05800866
var(Dap5$`Mehlich-3`)
## [1] 0.2665801

Moda

mlv(Dap5$Bray, method = "mfv")
## [1] 6.6 6.7
mlv(Dap5$Olsen, method = "mfv")
## [1] 6.4
mlv(Dap5$`Mehlich-3`, method = "mfv")
## [1] 7.1 7.3 7.8

Es el valor que mas se repite en cada uno de los metodos, en Bray existen 2 y en Mehlich 3

desviacion

sp5b <- sd(Dap5$Bray);sp5b
## [1] 0.203061
sp5o <- sd(Dap5$Olsen);sp5o
## [1] 0.2408499
sp5m <- sd(Dap5$`Mehlich-3`);sp5m
## [1] 0.5163139

coeficiente de variacion

(cov = 100*desv/medias

cvp5b = 100*(sp5b/mp5b);cvp5b
## [1] 2.980215
cvp5o = 100*(sp5o/mp5o);cvp5o
## [1] 3.757941
cvp5m = 100*(sp5m/mp5b);cvp5m
## [1] 7.577656

graficos

Dap5a<- read_excel("punto5-1.xlsx")
data.frame(Dap5a)
##    mg.de.fosforo.Kg.de.suelo    Metodo
## 1                        7.1      Bray
## 2                        6.8      Bray
## 3                        6.6      Bray
## 4                        6.7      Bray
## 5                        6.8      Bray
## 6                        6.7      Bray
## 7                        6.9      Bray
## 8                        6.8      Bray
## 9                        6.7      Bray
## 10                       6.6      Bray
## 11                       6.9      Bray
## 12                       7.4      Bray
## 13                       6.6      Bray
## 14                       6.7      Bray
## 15                       6.8      Bray
## 16                       7.0      Bray
## 17                       6.9      Bray
## 18                       6.7      Bray
## 19                       7.1      Bray
## 20                       6.6      Bray
## 21                       6.6      Bray
## 22                       6.9      Bray
## 23                       6.0     Olsen
## 24                       6.2     Olsen
## 25                       6.4     Olsen
## 26                       6.6     Olsen
## 27                       6.9     Olsen
## 28                       6.6     Olsen
## 29                       6.4     Olsen
## 30                       6.4     Olsen
## 31                       6.5     Olsen
## 32                       6.3     Olsen
## 33                       6.4     Olsen
## 34                       6.6     Olsen
## 35                       6.6     Olsen
## 36                       6.7     Olsen
## 37                       6.4     Olsen
## 38                       6.2     Olsen
## 39                       6.6     Olsen
## 40                       6.3     Olsen
## 41                       5.8     Olsen
## 42                       6.5     Olsen
## 43                       6.2     Olsen
## 44                       6.4     Olsen
## 45                       9.1 Mehlich-3
## 46                       7.1 Mehlich-3
## 47                       7.8 Mehlich-3
## 48                       7.3 Mehlich-3
## 49                       7.6 Mehlich-3
## 50                       7.8 Mehlich-3
## 51                       7.4 Mehlich-3
## 52                       7.3 Mehlich-3
## 53                       7.3 Mehlich-3
## 54                       7.1 Mehlich-3
## 55                       8.0 Mehlich-3
## 56                       8.7 Mehlich-3
## 57                       7.6 Mehlich-3
## 58                       7.8 Mehlich-3
## 59                       7.8 Mehlich-3
## 60                       7.2 Mehlich-3
## 61                       7.2 Mehlich-3
## 62                       7.9 Mehlich-3
## 63                       7.3 Mehlich-3
## 64                       7.5 Mehlich-3
## 65                       7.1 Mehlich-3
## 66                       7.1 Mehlich-3
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)

bwplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)

ggplot(Dap5a, aes(x = `mg de fosforo/Kg de suelo`, fill = Metodo))+
  geom_density(alpha = 0.6)

ggplot(Dap5a, aes(y = `mg de fosforo/Kg de suelo`, Metodo))+
  geom_violin()

Analisis de varianza

\[H_0: \mu_{Bray}=\mu_{Olsen}=\mu_{Mehlich-3}\]

\[H_a:H_o Al\ menos\ un\ igualdad\ es\ falta\]

modp5 =aov(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
summary(modp5)
##              Df Sum Sq Mean Sq F value  Pr(>F)    
## Dap5a$Metodo  2 15.873   7.937   65.08 4.7e-16 ***
## Residuals    63  7.682   0.122                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

82.6 veces es mas grande la variabilidad de los metodos,p valor > 0.05 y p valor > 0.01 se rechaza Ho. el contenido de fosforo determinado por los 3 tratamientos es estadisticamente diferente

prueba de normalidad mg P/kg

residp5 = (modp5$residuals)
shapiro.test(residp5)
## 
##  Shapiro-Wilk normality test
## 
## data:  residp5
## W = 0.87754, p-value = 9.579e-06

pvalor < 0.05 los residuos no son normales, no se cumple el suspuesto de normaildad.

#Prueba de Bartlett \[H_0: \sigma^2_{Bray}=\sigma^2_{Olsen}=\sigma^2_{Mehlich-3}\]

bartlett.test(residp5,Dap5a$Metodo)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  residp5 and Dap5a$Metodo
## Bartlett's K-squared = 21.492, df = 2, p-value = 2.153e-05

P valor < 0.05: se rechaza hipotesis, no se cumple supuesto de homocedasticidad ni las varianzas son iguales ni la normalidad se cumple

/La conclusion del ANOVA esta en duda por que no se cumplen supuestos./

condiciones laterales

mean(Dap5a$`mg de fosforo/Kg de suelo`)
## [1] 6.937879
media5a <- tapply(Dap5a$`mg de fosforo/Kg de suelo`,Dap5a$Metodo, mean)
media5a
##      Bray Mehlich-3     Olsen 
##  6.813636  7.590909  6.409091
difermedia = media5a-mean(Dap5a$`mg de fosforo/Kg de suelo`)
difermedia
##       Bray  Mehlich-3      Olsen 
## -0.1242424  0.6530303 -0.5287879
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)

Buscando datos atipicos…

library(outliers)
datp5 = grubbs.test(x = modp5$residuals ,two.sided = TRUE)
datp5
## 
##  Grubbs test for one outlier
## 
## data:  modp5$residuals
## G.45 = 4.3896, U = 0.6990, p-value = 0.000122
## alternative hypothesis: highest value 1.50909090909091 is an outlier

P valor < 0.01, el valor 1.50 es un dato atipico.

Buscando el lugar del dato atipico en los datos.

# buscar posición del residual atípico
which.max( modp5$residuals)
## 45 
## 45
which.min(modp5$residuals)
## 41 
## 41
media5a
##      Bray Mehlich-3     Olsen 
##  6.813636  7.590909  6.409091

cambiando el dato donde esta el dato atipico por la medias del grupo

dap5aa = Dap5a$`mg de fosforo/Kg de suelo`[45]= media5a[2]
tail(dap5aa)
## Mehlich-3 
##  7.590909
modp5c = aov(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
shapiro.test(modp5c$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modp5c$residuals
## W = 0.93685, p-value = 0.002261

conclusion p valor continua siendo inferior al 1% no presenta normalidad

Transformación Box-cox

library(car)
## Loading required package: carData
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
## The following object is masked from 'package:purrr':
## 
##     some
lbp5 =  powerTransform(Dap5a$`mg de fosforo/Kg de suelo`)
lbp5
## Estimated transformation parameter 
## Dap5a$`mg de fosforo/Kg de suelo` 
##                          -2.19838

Transformando los datos

Bp5 = (Dap5a$`mg de fosforo/Kg de suelo`)**lbp5$lambda
modp5B = aov(Bp5~Dap5a$Metodo)
shapiro.test(modp5B$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modp5B$residuals
## W = 0.96963, p-value = 0.1051

pvalor > 0.01 los residuos son normales al 1%,Se cumple el suspuesto de normaildad.

data.aov1 <- aov(modp5B$residuals ~ Dap5a$Metodo,Dap5a)
plot(data.aov1)

## hat values (leverages) are all = 0.04545455
##  and there are no factor predictors; no plot no. 5

anova(data.aov1)
## Analysis of Variance Table
## 
## Response: modp5B$residuals
##              Df     Sum Sq    Mean Sq F value Pr(>F)
## Dap5a$Metodo  2 0.0000e+00 0.0000e+00       0      1
## Residuals    63 9.5678e-05 1.5187e-06
par(mfrow =c (1,2))
hist(modp5$residuals, main = "sin transformar", xlab = 'Residuales')
hist(modp5B$residuals, main = "transformados", xlab = 'Residuales')

par(mfrow =c (1,2))
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo,main = "no trasnformados")
boxplot(Bp5~ Dap5a$Metodo, main = "transformados")

pruebas de media aposteriori

Prueba de TukeyHSD( maxima diferencia significativa)

tk5 = TukeyHSD(modp5)
tk5
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Dap5a$`mg de fosforo/Kg de suelo` ~ Dap5a$Metodo)
## 
## $`Dap5a$Metodo`
##                       diff        lwr        upr     p adj
## Mehlich-3-Bray   0.7772727  0.5245476  1.0299978 0.0000000
## Olsen-Bray      -0.4045455 -0.6572706 -0.1518203 0.0008252
## Olsen-Mehlich-3 -1.1818182 -1.4345433 -0.9290931 0.0000000

todos los pares son diferentes entre si, todos son menores al 5 porciento

Conlusion: Se seleccionar el metodo Mehlich-3 porque fue donde se presentaron los valores mas altos de mg de fosforo/ kg de suelo.

graficos

mediasp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, mean)
varianzasp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, var)
mediasp5
##      Bray Mehlich-3     Olsen 
##  6.813636  7.522314  6.409091
varianzasp5
##       Bray  Mehlich-3      Olsen 
## 0.04123377 0.15320525 0.05800866
plot(mediasp5, varianzasp5, pch =16, col= "sky blue ",xlab = "Promedios", ylab =  "Varianzas", cex=1:2)

tabla media y mediana

mediasp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, mean)
medianp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, median)
mediasp5
##      Bray Mehlich-3     Olsen 
##  6.813636  7.522314  6.409091
medianp5
##      Bray Mehlich-3     Olsen 
##      6.80      7.45      6.40
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
points(mediasp5, pch = 17, col = 'red')
points(medianp5, pch =15 , col = "green")

desviacion <- tapply(Dap5a$`mg de fosforo/Kg de suelo`,Dap5a$Metodo, sd)
desviacion
##      Bray Mehlich-3     Olsen 
## 0.2030610 0.3914144 0.2408499
summary(Dap5a$`mg de fosforo/Kg de suelo`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.800   6.600   6.800   6.915   7.275   8.700
barplot(desviacion, xlab = "metodos",ylab = "medias",col = "Royal blue", border = "black")

oneway.test(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo, var.equal = F)
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  Dap5a$`mg de fosforo/Kg de suelo` and Dap5a$Metodo
## F = 64.749, num df = 2.00, denom df = 39.93, p-value = 2.939e-13
matrix(sample(Dap5a$Metodo), ncol =6)
##       [,1]        [,2]        [,3]        [,4]        [,5]        [,6]       
##  [1,] "Mehlich-3" "Bray"      "Bray"      "Olsen"     "Mehlich-3" "Mehlich-3"
##  [2,] "Bray"      "Olsen"     "Olsen"     "Bray"      "Olsen"     "Olsen"    
##  [3,] "Mehlich-3" "Mehlich-3" "Olsen"     "Bray"      "Bray"      "Mehlich-3"
##  [4,] "Bray"      "Olsen"     "Mehlich-3" "Olsen"     "Olsen"     "Bray"     
##  [5,] "Mehlich-3" "Olsen"     "Bray"      "Olsen"     "Mehlich-3" "Bray"     
##  [6,] "Bray"      "Mehlich-3" "Olsen"     "Mehlich-3" "Bray"      "Mehlich-3"
##  [7,] "Mehlich-3" "Bray"      "Olsen"     "Olsen"     "Mehlich-3" "Olsen"    
##  [8,] "Bray"      "Mehlich-3" "Olsen"     "Mehlich-3" "Bray"      "Mehlich-3"
##  [9,] "Olsen"     "Olsen"     "Bray"      "Mehlich-3" "Bray"      "Olsen"    
## [10,] "Bray"      "Bray"      "Olsen"     "Olsen"     "Mehlich-3" "Olsen"    
## [11,] "Mehlich-3" "Bray"      "Bray"      "Mehlich-3" "Bray"      "Mehlich-3"
library(WebPower)
## Loading required package: MASS
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
## Loading required package: lme4
## Loading required package: Matrix
## 
## Attaching package: 'Matrix'
## The following objects are masked from 'package:tidyr':
## 
##     expand, pack, unpack
## Registered S3 methods overwritten by 'lme4':
##   method                          from
##   cooks.distance.influence.merMod car 
##   influence.merMod                car 
##   dfbeta.influence.merMod         car 
##   dfbetas.influence.merMod        car
## Loading required package: lavaan
## This is lavaan 0.6-5
## lavaan is BETA software! Please report any bugs.
## Loading required package: parallel
## Loading required package: PearsonDS
wp.anova(f=0.25,k =3, n =100, alpha =0.05)
## Power for One-way ANOVA
## 
##     k   n    f alpha     power
##     3 100 0.25  0.05 0.5885389
## 
## NOTE: n is the total sample size (overall)
## URL: http://psychstat.org/anova
wp.anova(f=0.25,k =3, n =NULL, alpha =0.05, power = 0.8)
## Power for One-way ANOVA
## 
##     k        n    f alpha power
##     3 157.1898 0.25  0.05   0.8
## 
## NOTE: n is the total sample size (overall)
## URL: http://psychstat.org/anova
wp.anova(f=seq(0.1,0.8,0.05),k=4, n=100,alpha = 0.05)
## Power for One-way ANOVA
## 
##     k   n    f alpha     power
##     4 100 0.10  0.05 0.1128198
##     4 100 0.15  0.05 0.2052235
##     4 100 0.20  0.05 0.3452612
##     4 100 0.25  0.05 0.5181755
##     4 100 0.30  0.05 0.6915962
##     4 100 0.35  0.05 0.8320716
##     4 100 0.40  0.05 0.9235525
##     4 100 0.45  0.05 0.9712839
##     4 100 0.50  0.05 0.9911867
##     4 100 0.55  0.05 0.9978061
##     4 100 0.60  0.05 0.9995595
##     4 100 0.65  0.05 0.9999290
##     4 100 0.70  0.05 0.9999908
##     4 100 0.75  0.05 0.9999991
##     4 100 0.80  0.05 0.9999999
## 
## NOTE: n is the total sample size (overall)
## URL: http://psychstat.org/anova