muestra independiente
library(tidyverse)
## āā Attaching packages āāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāā tidyverse 1.3.0 āā
## ā ggplot2 3.3.0 ā purrr 0.3.4
## ā tibble 3.0.1 ā dplyr 0.8.5
## ā tidyr 1.0.3 ā stringr 1.4.0
## ā readr 1.3.1 ā forcats 0.5.0
## āā Conflicts āāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāāā tidyverse_conflicts() āā
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(readxl)
library(Rcpp)
Df<- read_excel("datos_2.xlsx")
data.frame(Df)
## Conductancia Variedad
## 1 0.45 Colombia
## 2 0.41 Colombia
## 3 0.49 Colombia
## 4 0.46 Colombia
## 5 0.39 Colombia
## 6 0.44 Colombia
## 7 0.48 Colombia
## 8 0.42 Colombia
## 9 0.44 Colombia
## 10 0.48 Colombia
## 11 0.50 Colombia
## 12 0.47 Colombia
## 13 0.44 Colombia
## 14 0.52 Colombia
## 15 0.28 Ocarina
## 16 0.25 Ocarina
## 17 0.32 Ocarina
## 18 0.34 Ocarina
## 19 0.36 Ocarina
## 20 0.40 Ocarina
## 21 0.39 Ocarina
## 22 0.36 Ocarina
## 23 0.39 Ocarina
## 24 0.41 Ocarina
## 25 0.37 Ocarina
## 26 0.42 Ocarina
## 27 0.41 Ocarina
## 28 NA Ocarina
Df_C<- na.omit(Df )
Ho: mu(conductancia)colombia == mu(conductancia)Ocarina Ha: mu(conductancia)ocarina < mu(conductancia)Ocarina
pruebaT1<-t.test(x = Df_C$Conductancia[Df_C$Variedad == 'Colombia'],
y = Df_C$Conductancia[Df_C$Variedad == 'Ocarina'],
mu = 0, alternative = 'l', conf.level = 0.95)
pruebaT1$p.value
## [1] 0.9999901
ifelse(prb_1$p.value<0.05, āRechazo Ho: Las medias no son igualesā, āNo rechazo Ho: medias igualesā)
no se rechazo Ho el p valor > 0.05 las medias son iguales
tapply(Df_C$Conductancia,Df_C$Variedad, var)
## Colombia Ocarina
## 0.001317033 0.002714103
Ho:la varianza de los datos de varieda(Colombia) == varianaza varieda 2(Ocarina) Ha:la varianza de los datos de varieda(Colombia) != varianaza varieda 2(Ocarina)
pruebaT1v<-var.test(x = Df_C$Conductancia[Df_C$Variedad == 'Colombia'],
y = Df_C$Conductancia[Df_C$Variedad == 'Ocarina'],
ratio = 1, alternative = 't', conf.level = 0.95)
pruebaT1v$p.value
## [1] 0.2104318
ifelse(pruebaT1v$p.value<0.05, āRechazo Ho: var desigualesā, āNo rechazo Ho: var igualesā)
vemos que el p.valor se encuentra arriba de nuestro nivel de significancia concluimos que presenta varianzas y medias iguales.
P2<- read_excel("dependientes2.xlsx")
data.frame(P2)
## Rendimiento Dias
## 1 69 45dds
## 2 66 45dds
## 3 72 45dds
## 4 68 45dds
## 5 65 45dds
## 6 66 45dds
## 7 67 45dds
## 8 68 45dds
## 9 69 45dds
## 10 69 45dds
## 11 66 45dds
## 12 68 45dds
## 13 64 45dds
## 14 67 45dds
## 15 60 45dds
## 16 68 45dds
## 17 873 77dds
## 18 850 77dds
## 19 832 77dds
## 20 834 77dds
## 21 843 77dds
## 22 840 77dds
## 23 895 77dds
## 24 790 77dds
## 25 905 77dds
## 26 910 77dds
## 27 920 77dds
## 28 840 77dds
## 29 832 77dds
## 30 800 77dds
## 31 759 77dds
## 32 812 77dds
library(lattice)
bwplot(P2$Rendimiento~P2$Dias)
P2.2<- read_excel("dependientes.xlsx")
data.frame(P2.2)
## X45dds X77dds
## 1 69 873
## 2 66 850
## 3 72 832
## 4 68 834
## 5 65 843
## 6 66 840
## 7 67 895
## 8 68 790
## 9 69 905
## 10 69 910
## 11 66 920
## 12 68 840
## 13 64 832
## 14 67 800
## 15 60 759
## 16 68 812
Ho: mu(45dds) == mu(77dds) Ha: mu(45dds) != mu(77dds)
P2_t = t.test(P2.2$`45dds`,P2.2$`77dds`, paired = T, mu =0, conf.level = 0.95,
alternative = 't')
P2_t$p.value
## [1] 2.605717e-20
ifelse(prb_2$p.value<0.05, āRechazo Ho: ambas capas tiene diferente rendimientoā, āNo rechazo Ho: el rendimiento de las capas es igualā)
se rechaza Ho p valor < 0.05 significa que los kg/ha fueron diferentes
medias
me45<-mean(P2.2$`45dds`)
me77<-mean(P2.2$`77dds`)
me45
## [1] 67
me77
## [1] 845.9375
Crp<-((me77-me45)/me45)*100
Crp
## [1] 1162.593
incremento de 1162(kg/ha)entre 45 y 77 dias
p2Co<-cor.test(P2.2$`45dds`,P2.2$`77dds`, conf.level = 0.95, alternative = 't')
p2Co$p.value
## [1] 0.1339073
ifelse(P2C$p.value<0.05,āCorrelacion NO nulaā, āCorrelacion nulaā)
correlacion nula es decir si estan correlacionadas
vemos que el p.valor se encuentra arriba de nuestro nivel de significancia concluimos que tienen correlacion nula es decir estan correlacionadas.
Dtp3 <-read_excel("Wilcoxon.xlsx")
data.frame(Dtp3)
## Textura Aceite
## 1 3 Palma
## 2 4 Palma
## 3 3 Palma
## 4 4 Palma
## 5 4 Palma
## 6 3 Palma
## 7 3 Palma
## 8 4 Palma
## 9 4 Palma
## 10 3 Palma
## 11 4 Palma
## 12 4 Palma
## 13 2 Palma
## 14 4 Palma
## 15 3 Palma
## 16 4 Palma
## 17 3 Palma
## 18 3 Palma
## 19 3 Palma
## 20 4 Palma
## 21 4 Palma
## 22 3 MaĆz
## 23 4 MaĆz
## 24 4 MaĆz
## 25 4 MaĆz
## 26 4 MaĆz
## 27 4 MaĆz
## 28 3 MaĆz
## 29 4 MaĆz
## 30 3 MaĆz
## 31 4 MaĆz
## 32 4 MaĆz
## 33 4 MaĆz
## 34 4 MaĆz
## 35 3 MaĆz
## 36 4 MaĆz
## 37 4 MaĆz
## 38 4 MaĆz
## 39 3 MaĆz
## 40 3 MaĆz
## 41 4 MaĆz
## 42 3 MaĆz
mediasaceite =tapply(Dtp3$Textura,Dtp3$Aceite, mean)
mediasaceite
## MaĆz Palma
## 3.666667 3.476190
bwplot(Dtp3$Textura~Dtp3$Aceite)
ggplot(Dtp3,aes(x = Dtp3$Aceite,y = Dtp3$Textura))+
geom_violin()+
stat_summary(fun.y = mean, geom = "point", shape =18,
size = 3, color ="red")
## Warning: `fun.y` is deprecated. Use `fun` instead.
## Warning: Use of `Dtp3$Aceite` is discouraged. Use `Aceite` instead.
## Warning: Use of `Dtp3$Textura` is discouraged. Use `Textura` instead.
## Warning: Use of `Dtp3$Aceite` is discouraged. Use `Aceite` instead.
## Warning: Use of `Dtp3$Textura` is discouraged. Use `Textura` instead.
Ho: varianza de textura de hojuela con aceite de palma == varianza de textura de hojuela con aceite de maiz Ha: varianza de textura de hojuela con aceite de palma != varianza de textura de hojuela con aceite de maiz ratio = 1, coceinte de varianzas == 1 (iguales)
pruebaT3v<-var.test(x = Dtp3$Textura[Dtp3$Aceite == 'Palma'],
y = Dtp3$Textura[Dtp3$Aceite == 'MaĆz'],
ratio = 1, alternative = 't', conf.level = 0.95)
pruebaT3v$p.value
## [1] 0.3343177
ifelse(IgualdadVarianzas2$p.value < 0.05, āRechazo Ho: Las varianzas entre los grupos son diferentesā, āNo rechazo Ho: Las varianzas entre los grupos son igualesā)
p valor > 0.05 las varianzas son iguales
shapiro.test(Dtp3$Textura[Dtp3$Aceite == 'Palma'])
##
## Shapiro-Wilk normality test
##
## data: Dtp3$Textura[Dtp3$Aceite == "Palma"]
## W = 0.72901, p-value = 6.474e-05
shapiro.test(Dtp3$Textura[Dtp3$Aceite == 'MaĆz'])
##
## Shapiro-Wilk normality test
##
## data: Dtp3$Textura[Dtp3$Aceite == "MaĆz"]
## W = 0.59907, p-value = 1.925e-06
las variables no presentan una distribucion normal pvalor < 0.05
Ho: Media de la textura de hojuela con aceite de palma == Media de la textura de hojuela con aceite de maiz Ha: Media de la textura de hojuela con aceite de palma != Media de la textura de hojuela con aceite de maiz
pruebaT3W<- wilcox.test(x = Dtp3$Textura[Dtp3$Aceite == 'Palma'],
y = Dtp3$Textura[Dtp3$Aceite == 'MaĆz'],
alternative = 'two.sided', mu = 0, paired = FALSE)
## Warning in wilcox.test.default(x = Dtp3$Textura[Dtp3$Aceite == "Palma"], :
## cannot compute exact p-value with ties
pruebaT3W$p.value
## [1] 0.3111338
ifelse(PruebaWilcoxon$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
vemos que el p.valor se encuentra arriba de nuestro nivel de significancia concluimos que estadisticamente las medias de temperatura de almacenamiento frituras son iguales.
DatosPunto4 <- read_excel("punto4.xlsx")
data.frame(DatosPunto4)
## X4C X12C CIELab
## 1 69.26 62.20 L
## 2 68.15 60.45 L
## 3 69.17 63.12 L
## 4 68.88 61.64 L
## 5 70.01 61.25 L
## 6 70.15 62.55 L
## 7 70.66 64.12 L
## 8 68.68 65.65 L
## 9 71.00 66.87 L
## 10 72.18 65.11 L
## 11 69.15 66.14 L
## 12 70.00 62.64 L
## 13 68.64 61.97 L
## 14 68.12 60.58 L
## 15 68.12 60.68 L
## 16 -1.31 0.81 a
## 17 -1.25 0.78 a
## 18 -1.49 0.55 a
## 19 -1.35 0.81 a
## 20 -1.32 0.77 a
## 21 -1.15 0.69 a
## 22 -1.25 0.59 a
## 23 -1.29 0.55 a
## 24 -1.42 0.42 a
## 25 -1.45 0.39 a
## 26 -1.29 0.41 a
## 27 -1.22 0.37 a
## 28 -1.19 0.35 a
## 29 -1.25 0.34 a
## 30 -1.25 0.34 a
## 31 28.68 37.31 b
## 32 27.66 35.90 b
## 33 28.02 36.36 b
## 34 27.66 36.12 b
## 35 27.66 36.45 b
## 36 26.88 35.99 b
## 37 26.25 36.14 b
## 38 26.26 36.14 b
## 39 28.15 35.55 b
## 40 30.00 34.77 b
## 41 28.24 32.32 b
## 42 25.59 31.96 b
## 43 24.69 30.17 b
## 44 25.56 36.65 b
## 45 26.26 37.15 b
Ho: Media L* a 4°C == Media L* a 12°C Ha: Media L* a 4°C != Media L* a 12°C
PruebaWilcoxon2 <-wilcox.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "L"],
DatosPunto4$`4C`[DatosPunto4$CIELab == "L"],
paired = TRUE)
PruebaWilcoxon2$p.value
## [1] 6.103516e-05
ifelse(PruebaWilcoxon2$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
p valor menor 0.05 se rechaza Ho las medias son diferentes
Ho: Media a* a 4°C == Media a* a 12°C Ha: Media a* a 4°C != Media a* a 12°C
PruebaWilcoxon3 <- wilcox.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "a"],
DatosPunto4$`4C`[DatosPunto4$CIELab == "a"],
paired = TRUE)
## Warning in wilcox.test.default(DatosPunto4$`12C`[DatosPunto4$CIELab == "a"], :
## cannot compute exact p-value with ties
PruebaWilcoxon3$p.value
## [1] 0.0007068908
ifelse(PruebaWilcoxon3$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
medias entre los grupos son diferentes
#Contraste de b*
Ho: Media b* a 4°C == Media b* a 12°C Ha: Media b* a 4°C != Media b* a 12°C
PruebaWilcoxon4 <- wilcox.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "b"],
DatosPunto4$`4C`[DatosPunto4$CIELab == "b"],
paired = TRUE)
PruebaWilcoxon4$p.value
## [1] 6.103516e-05
ifelse(PruebaWilcoxon4$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
se rechaza Ho significa que las medias diferente
#Para L >Ho: Media L a 4°C == Media L* a 12°C >Ha: Media L* a 4°C != Media L* a 12°C
PruebaT3= t.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "L"],
DatosPunto4$`4C`[DatosPunto4$CIELab == "L"],
paired = T, mu = 0,
conf.level = 0.95, alternative = 't')
PruebaT3$p.value
## [1] 7.683573e-10
ifelse(PruebaT3$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
#Para a >Ho: Media a a 4°C == Media a* a 12°C >Ha: Media a* a 4°C != Media a* a 12°C
PruebaT4= t.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "a"],
DatosPunto4$`4C`[DatosPunto4$CIELab == "a"],
paired = T, mu = 0,
conf.level = 0.95, alternative = 't')
PruebaT4$p.value
## [1] 7.319557e-15
ifelse(PruebaT4$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
#Para b >Ho: Media b a 4°C == Media b* a 12°C >Ha: Media b* a 4°C != Media b* a 12°C
PruebaT3= t.test(DatosPunto4$`12C`[DatosPunto4$CIELab == "b"],
DatosPunto4$`4C`[DatosPunto4$CIELab == "b"],
paired = T, mu = 0,
conf.level = 0.95, alternative = 't')
PruebaT3$p.value
## [1] 5.987182e-10
ifelse(PruebaT3$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
se rechaza Ho significa que las medias son diferente
vemos que los p.valor se encuentra abajo de nuestro nivel de significancia concluimos que estadisticamente las medias individuales de temperatura de almacenamiento con respecto a las tres variables son diferentes.
DatosPunto4a <- read_excel("Datos Taller-3.xlsx")
## New names:
## * L -> L...1
## * a -> a...2
## * b -> b...3
## * L -> L...4
## * a -> a...5
## * ...
data.frame(DatosPunto4a)
## L...1 a...2 b...3 L...4 a...5 b...6 Delta.E
## 1 69.26 -1.31 28.68 62.20 0.81 37.31 11.349665
## 2 68.15 -1.25 27.66 60.45 0.78 35.90 11.458992
## 3 69.17 -1.49 28.02 63.12 0.55 36.36 10.503319
## 4 68.88 -1.35 27.66 61.64 0.81 36.12 11.342610
## 5 70.01 -1.32 27.66 61.25 0.77 36.45 12.584506
## 6 70.15 -1.15 26.88 62.55 0.69 35.99 12.005736
## 7 70.66 -1.25 26.25 64.12 0.59 36.14 11.998721
## 8 68.68 -1.29 26.26 65.65 0.55 36.14 10.496709
## 9 71.00 -1.42 28.15 66.87 0.42 35.55 8.671937
## 10 72.18 -1.45 30.00 65.11 0.39 34.77 8.724872
## 11 69.15 -1.29 28.24 66.14 0.41 32.32 5.347570
## 12 70.00 -1.22 25.59 62.64 0.37 31.96 9.862789
## 13 68.64 -1.19 24.69 61.97 0.35 30.17 8.768746
## 14 68.12 -1.25 25.56 60.58 0.34 36.65 13.504362
## 15 68.12 -1.25 26.26 60.68 0.34 37.15 13.284344
#Prueba Wilcoxon para una muestra
Ho: Media Delta E a 4°C == Media Delta E a 12°C Ha: Media Delta E a 4°C != Media Delta E a 12°C
PruebaWilcoxon5 <- wilcox.test(DatosPunto4a$`Delta E`, conf.int = T)
PruebaWilcoxon4$p.value
## [1] 6.103516e-05
ifelse(PruebaWilcoxon5$p.value< 0.05, āRechazo Ho: Las medias entre los grupos son diferentesā, āNo rechazo Ho: Las medias entre los grupos son igualesā)
vemos que los p.valor se encuentra abajo de nuestro nivel de significancia concluimos que estadisticamente la medias de temperatura de almacenamiento con respecto al ĪE son diferentes. # Grafica 3D
library(scatterplot3d)
library(rgl)
## Warning in rgl.init(initValue, onlyNULL): RGL: unable to open X11 display
## Warning: 'rgl.init' failed, running with 'rgl.useNULL = TRUE'.
scatterplot3d(x=DatosPunto4a$a...2, y= DatosPunto4a$b...3, z=DatosPunto4a$L...1,
xlab = "a*", ylab = "b*", zlab = "L*",
xlim = c(-1.50,-1.10), ylim = c(24,31), zlim = c(68,72.5),
pch = 16,color = "wheat3", main = "CIEL*a*b* a 4°C")
scatterplot3d(x=DatosPunto4a$a...5, y= DatosPunto4a$b...6, z=DatosPunto4a$L...4,
xlab = "a*", ylab = "b*", zlab = "L*",
xlim = c(0.30,0.82), ylim = c(30,37.5), zlim = c(60,67),
pch = 16,color = "wheat2", main = "CIEL*a*b* a 4°C")
library(modeest)
## Registered S3 method overwritten by 'rmutil':
## method from
## print.response httr
library(lattice)
Dap5 <- read_excel("punto5.xlsx")
data.frame(Dap5)
## Bray Olsen Mehlich.3
## 1 7.1 6.0 9.1
## 2 6.8 6.2 7.1
## 3 6.6 6.4 7.8
## 4 6.7 6.6 7.3
## 5 6.8 6.9 7.6
## 6 6.7 6.6 7.8
## 7 6.9 6.4 7.4
## 8 6.8 6.4 7.3
## 9 6.7 6.5 7.3
## 10 6.6 6.3 7.1
## 11 6.9 6.4 8.0
## 12 7.4 6.6 8.7
## 13 6.6 6.6 7.6
## 14 6.7 6.7 7.8
## 15 6.8 6.4 7.8
## 16 7.0 6.2 7.2
## 17 6.9 6.6 7.2
## 18 6.7 6.3 7.9
## 19 7.1 5.8 7.3
## 20 6.6 6.5 7.5
## 21 6.6 6.2 7.1
## 22 6.9 6.4 7.1
mp5b <-mean(Dap5$Bray);mp5b
## [1] 6.813636
mp5o <-mean(Dap5$Olsen);mp5o
## [1] 6.409091
mp5m <-mean(Dap5$`Mehlich-3`);mp5m
## [1] 7.590909
var(Dap5$Bray)
## [1] 0.04123377
var(Dap5$Olsen)
## [1] 0.05800866
var(Dap5$`Mehlich-3`)
## [1] 0.2665801
mlv(Dap5$Bray, method = "mfv")
## [1] 6.6 6.7
mlv(Dap5$Olsen, method = "mfv")
## [1] 6.4
mlv(Dap5$`Mehlich-3`, method = "mfv")
## [1] 7.1 7.3 7.8
Es el valor que mas se repite en cada uno de los metodos, en Bray existen 2 y en Mehlich 3
sp5b <- sd(Dap5$Bray);sp5b
## [1] 0.203061
sp5o <- sd(Dap5$Olsen);sp5o
## [1] 0.2408499
sp5m <- sd(Dap5$`Mehlich-3`);sp5m
## [1] 0.5163139
(cov = 100*desv/medias
cvp5b = 100*(sp5b/mp5b);cvp5b
## [1] 2.980215
cvp5o = 100*(sp5o/mp5o);cvp5o
## [1] 3.757941
cvp5m = 100*(sp5m/mp5b);cvp5m
## [1] 7.577656
Dap5a<- read_excel("punto5-1.xlsx")
data.frame(Dap5a)
## mg.de.fosforo.Kg.de.suelo Metodo
## 1 7.1 Bray
## 2 6.8 Bray
## 3 6.6 Bray
## 4 6.7 Bray
## 5 6.8 Bray
## 6 6.7 Bray
## 7 6.9 Bray
## 8 6.8 Bray
## 9 6.7 Bray
## 10 6.6 Bray
## 11 6.9 Bray
## 12 7.4 Bray
## 13 6.6 Bray
## 14 6.7 Bray
## 15 6.8 Bray
## 16 7.0 Bray
## 17 6.9 Bray
## 18 6.7 Bray
## 19 7.1 Bray
## 20 6.6 Bray
## 21 6.6 Bray
## 22 6.9 Bray
## 23 6.0 Olsen
## 24 6.2 Olsen
## 25 6.4 Olsen
## 26 6.6 Olsen
## 27 6.9 Olsen
## 28 6.6 Olsen
## 29 6.4 Olsen
## 30 6.4 Olsen
## 31 6.5 Olsen
## 32 6.3 Olsen
## 33 6.4 Olsen
## 34 6.6 Olsen
## 35 6.6 Olsen
## 36 6.7 Olsen
## 37 6.4 Olsen
## 38 6.2 Olsen
## 39 6.6 Olsen
## 40 6.3 Olsen
## 41 5.8 Olsen
## 42 6.5 Olsen
## 43 6.2 Olsen
## 44 6.4 Olsen
## 45 9.1 Mehlich-3
## 46 7.1 Mehlich-3
## 47 7.8 Mehlich-3
## 48 7.3 Mehlich-3
## 49 7.6 Mehlich-3
## 50 7.8 Mehlich-3
## 51 7.4 Mehlich-3
## 52 7.3 Mehlich-3
## 53 7.3 Mehlich-3
## 54 7.1 Mehlich-3
## 55 8.0 Mehlich-3
## 56 8.7 Mehlich-3
## 57 7.6 Mehlich-3
## 58 7.8 Mehlich-3
## 59 7.8 Mehlich-3
## 60 7.2 Mehlich-3
## 61 7.2 Mehlich-3
## 62 7.9 Mehlich-3
## 63 7.3 Mehlich-3
## 64 7.5 Mehlich-3
## 65 7.1 Mehlich-3
## 66 7.1 Mehlich-3
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
bwplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
ggplot(Dap5a, aes(x = `mg de fosforo/Kg de suelo`, fill = Metodo))+
geom_density(alpha = 0.6)
ggplot(Dap5a, aes(y = `mg de fosforo/Kg de suelo`, Metodo))+
geom_violin()
\[H_0: \mu_{Bray}=\mu_{Olsen}=\mu_{Mehlich-3}\]
\[H_a:H_o Al\ menos\ un\ igualdad\ es\ falta\]
modp5 =aov(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
summary(modp5)
## Df Sum Sq Mean Sq F value Pr(>F)
## Dap5a$Metodo 2 15.873 7.937 65.08 4.7e-16 ***
## Residuals 63 7.682 0.122
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
82.6 veces es mas grande la variabilidad de los metodos,p valor > 0.05 y p valor > 0.01 se rechaza Ho. el contenido de fosforo determinado por los 3 tratamientos es estadisticamente diferente
residp5 = (modp5$residuals)
shapiro.test(residp5)
##
## Shapiro-Wilk normality test
##
## data: residp5
## W = 0.87754, p-value = 9.579e-06
pvalor < 0.05 los residuos no son normales, no se cumple el suspuesto de normaildad.
#Prueba de Bartlett \[H_0: \sigma^2_{Bray}=\sigma^2_{Olsen}=\sigma^2_{Mehlich-3}\]
bartlett.test(residp5,Dap5a$Metodo)
##
## Bartlett test of homogeneity of variances
##
## data: residp5 and Dap5a$Metodo
## Bartlett's K-squared = 21.492, df = 2, p-value = 2.153e-05
P valor < 0.05: se rechaza hipotesis, no se cumple supuesto de homocedasticidad ni las varianzas son iguales ni la normalidad se cumple
/La conclusion del ANOVA esta en duda por que no se cumplen supuestos./
mean(Dap5a$`mg de fosforo/Kg de suelo`)
## [1] 6.937879
media5a <- tapply(Dap5a$`mg de fosforo/Kg de suelo`,Dap5a$Metodo, mean)
media5a
## Bray Mehlich-3 Olsen
## 6.813636 7.590909 6.409091
difermedia = media5a-mean(Dap5a$`mg de fosforo/Kg de suelo`)
difermedia
## Bray Mehlich-3 Olsen
## -0.1242424 0.6530303 -0.5287879
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
library(outliers)
datp5 = grubbs.test(x = modp5$residuals ,two.sided = TRUE)
datp5
##
## Grubbs test for one outlier
##
## data: modp5$residuals
## G.45 = 4.3896, U = 0.6990, p-value = 0.000122
## alternative hypothesis: highest value 1.50909090909091 is an outlier
P valor < 0.01, el valor 1.50 es un dato atipico.
Buscando el lugar del dato atipico en los datos.
# buscar posición del residual atĆpico
which.max( modp5$residuals)
## 45
## 45
which.min(modp5$residuals)
## 41
## 41
media5a
## Bray Mehlich-3 Olsen
## 6.813636 7.590909 6.409091
dap5aa = Dap5a$`mg de fosforo/Kg de suelo`[45]= media5a[2]
tail(dap5aa)
## Mehlich-3
## 7.590909
modp5c = aov(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
shapiro.test(modp5c$residuals)
##
## Shapiro-Wilk normality test
##
## data: modp5c$residuals
## W = 0.93685, p-value = 0.002261
conclusion p valor continua siendo inferior al 1% no presenta normalidad
library(car)
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
## The following object is masked from 'package:purrr':
##
## some
lbp5 = powerTransform(Dap5a$`mg de fosforo/Kg de suelo`)
lbp5
## Estimated transformation parameter
## Dap5a$`mg de fosforo/Kg de suelo`
## -2.19838
Transformando los datos
Bp5 = (Dap5a$`mg de fosforo/Kg de suelo`)**lbp5$lambda
modp5B = aov(Bp5~Dap5a$Metodo)
shapiro.test(modp5B$residuals)
##
## Shapiro-Wilk normality test
##
## data: modp5B$residuals
## W = 0.96963, p-value = 0.1051
pvalor > 0.01 los residuos son normales al 1%,Se cumple el suspuesto de normaildad.
data.aov1 <- aov(modp5B$residuals ~ Dap5a$Metodo,Dap5a)
plot(data.aov1)
## hat values (leverages) are all = 0.04545455
## and there are no factor predictors; no plot no. 5
anova(data.aov1)
## Analysis of Variance Table
##
## Response: modp5B$residuals
## Df Sum Sq Mean Sq F value Pr(>F)
## Dap5a$Metodo 2 0.0000e+00 0.0000e+00 0 1
## Residuals 63 9.5678e-05 1.5187e-06
par(mfrow =c (1,2))
hist(modp5$residuals, main = "sin transformar", xlab = 'Residuales')
hist(modp5B$residuals, main = "transformados", xlab = 'Residuales')
par(mfrow =c (1,2))
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo,main = "no trasnformados")
boxplot(Bp5~ Dap5a$Metodo, main = "transformados")
Prueba de TukeyHSD( maxima diferencia significativa)
tk5 = TukeyHSD(modp5)
tk5
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Dap5a$`mg de fosforo/Kg de suelo` ~ Dap5a$Metodo)
##
## $`Dap5a$Metodo`
## diff lwr upr p adj
## Mehlich-3-Bray 0.7772727 0.5245476 1.0299978 0.0000000
## Olsen-Bray -0.4045455 -0.6572706 -0.1518203 0.0008252
## Olsen-Mehlich-3 -1.1818182 -1.4345433 -0.9290931 0.0000000
todos los pares son diferentes entre si, todos son menores al 5 porciento
Conlusion: Se seleccionar el metodo Mehlich-3 porque fue donde se presentaron los valores mas altos de mg de fosforo/ kg de suelo.
mediasp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, mean)
varianzasp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, var)
mediasp5
## Bray Mehlich-3 Olsen
## 6.813636 7.522314 6.409091
varianzasp5
## Bray Mehlich-3 Olsen
## 0.04123377 0.15320525 0.05800866
plot(mediasp5, varianzasp5, pch =16, col= "sky blue ",xlab = "Promedios", ylab = "Varianzas", cex=1:2)
mediasp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, mean)
medianp5<- tapply(Dap5a$`mg de fosforo/Kg de suelo`, Dap5a$Metodo, median)
mediasp5
## Bray Mehlich-3 Olsen
## 6.813636 7.522314 6.409091
medianp5
## Bray Mehlich-3 Olsen
## 6.80 7.45 6.40
boxplot(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo)
points(mediasp5, pch = 17, col = 'red')
points(medianp5, pch =15 , col = "green")
desviacion <- tapply(Dap5a$`mg de fosforo/Kg de suelo`,Dap5a$Metodo, sd)
desviacion
## Bray Mehlich-3 Olsen
## 0.2030610 0.3914144 0.2408499
summary(Dap5a$`mg de fosforo/Kg de suelo`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.800 6.600 6.800 6.915 7.275 8.700
barplot(desviacion, xlab = "metodos",ylab = "medias",col = "Royal blue", border = "black")
oneway.test(Dap5a$`mg de fosforo/Kg de suelo`~Dap5a$Metodo, var.equal = F)
##
## One-way analysis of means (not assuming equal variances)
##
## data: Dap5a$`mg de fosforo/Kg de suelo` and Dap5a$Metodo
## F = 64.749, num df = 2.00, denom df = 39.93, p-value = 2.939e-13
matrix(sample(Dap5a$Metodo), ncol =6)
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] "Mehlich-3" "Bray" "Bray" "Olsen" "Mehlich-3" "Mehlich-3"
## [2,] "Bray" "Olsen" "Olsen" "Bray" "Olsen" "Olsen"
## [3,] "Mehlich-3" "Mehlich-3" "Olsen" "Bray" "Bray" "Mehlich-3"
## [4,] "Bray" "Olsen" "Mehlich-3" "Olsen" "Olsen" "Bray"
## [5,] "Mehlich-3" "Olsen" "Bray" "Olsen" "Mehlich-3" "Bray"
## [6,] "Bray" "Mehlich-3" "Olsen" "Mehlich-3" "Bray" "Mehlich-3"
## [7,] "Mehlich-3" "Bray" "Olsen" "Olsen" "Mehlich-3" "Olsen"
## [8,] "Bray" "Mehlich-3" "Olsen" "Mehlich-3" "Bray" "Mehlich-3"
## [9,] "Olsen" "Olsen" "Bray" "Mehlich-3" "Bray" "Olsen"
## [10,] "Bray" "Bray" "Olsen" "Olsen" "Mehlich-3" "Olsen"
## [11,] "Mehlich-3" "Bray" "Bray" "Mehlich-3" "Bray" "Mehlich-3"
library(WebPower)
## Loading required package: MASS
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
## Loading required package: lme4
## Loading required package: Matrix
##
## Attaching package: 'Matrix'
## The following objects are masked from 'package:tidyr':
##
## expand, pack, unpack
## Registered S3 methods overwritten by 'lme4':
## method from
## cooks.distance.influence.merMod car
## influence.merMod car
## dfbeta.influence.merMod car
## dfbetas.influence.merMod car
## Loading required package: lavaan
## This is lavaan 0.6-5
## lavaan is BETA software! Please report any bugs.
## Loading required package: parallel
## Loading required package: PearsonDS
wp.anova(f=0.25,k =3, n =100, alpha =0.05)
## Power for One-way ANOVA
##
## k n f alpha power
## 3 100 0.25 0.05 0.5885389
##
## NOTE: n is the total sample size (overall)
## URL: http://psychstat.org/anova
wp.anova(f=0.25,k =3, n =NULL, alpha =0.05, power = 0.8)
## Power for One-way ANOVA
##
## k n f alpha power
## 3 157.1898 0.25 0.05 0.8
##
## NOTE: n is the total sample size (overall)
## URL: http://psychstat.org/anova
wp.anova(f=seq(0.1,0.8,0.05),k=4, n=100,alpha = 0.05)
## Power for One-way ANOVA
##
## k n f alpha power
## 4 100 0.10 0.05 0.1128198
## 4 100 0.15 0.05 0.2052235
## 4 100 0.20 0.05 0.3452612
## 4 100 0.25 0.05 0.5181755
## 4 100 0.30 0.05 0.6915962
## 4 100 0.35 0.05 0.8320716
## 4 100 0.40 0.05 0.9235525
## 4 100 0.45 0.05 0.9712839
## 4 100 0.50 0.05 0.9911867
## 4 100 0.55 0.05 0.9978061
## 4 100 0.60 0.05 0.9995595
## 4 100 0.65 0.05 0.9999290
## 4 100 0.70 0.05 0.9999908
## 4 100 0.75 0.05 0.9999991
## 4 100 0.80 0.05 0.9999999
##
## NOTE: n is the total sample size (overall)
## URL: http://psychstat.org/anova