Problema 17 [ver script, resuleto en clase]

Los pastizales nativos ubicados en la parte central de la Argentina se caracterizan por la abundancia de especies de gramíneas del género Stipa. Un grupo de investigación está estudiando los factores que limitan el crecimiento de Stipa brachychaeta, una de las especies más comunes en la región.

Problema 18 [ver script]

Las personas con enfermedades óseas crónicas tienen riesgo de presentar reducciones de densidad y posteriores fracturas de sus huesos. Uno de los tratamientos más utilizados en esos casos es la administración de bifosfonatos. Estos son inhibidores de la resorción ósea, que aumentan la densidad mineral de los huesos estimulando su formación e incrementando su volumen.

En un estudio, se quiso poner a prueba la efectividad de dos bifosfonatos: alendronato y zoledronato. A los investigadores les interesaba saber, en particular, si ambos eran efectivos y si uno era más eficiente que el otro. Para ello usaron como modelo experimental ovejas maduras ovariectomizadas. Las alimentaron durante 6 meses con una dieta pobre en calcio y vitamina D, luego se les midió la densidad mineral ósea (DMO) y las asignaron aleatoriamente a 3 grupos. A uno le administraron 0,1 mg/kg de zoledronato; a otro, igual dosis de alendronato y al tercero no le administraron ninguna medicación. Luego de 8 semanas sosteniendo la misma dieta, les volvieron a medir la DMO. Los cambios porcentuales en DMO se encuentran en el archivo BD_DMO.txt

Problema 19 [resuelto en campus]

Reanalizar el problema 13 utilizando ahora las herramientas de modelado de varianza adquiridas:

Problema 13. Se estudió la capacidad de los nitropirenos,un grupo de contaminantes ambientales, para efectuar cambios en la capacidad reproductiva de la bacteria Salmonella sp,. que produce una enfermedad de transmisión alimentaria. Para ello se calculó la superficie cubierta por colonias de Salmonella (en cm) en placas tratadas con cuatro dosis del nitropireno 4NP. Los resultados obtenidos utilizando 28 placas fueron (Datos en BD_Salmonella. txt):

datos <- read.table("BD_Salmonella.txt",header = T)
datos$Dosis <- as.factor(datos$Dosis)

13.1.- Identificar y clasificar las variables del estudio.¿Qué análisis estadístico se podría utilizar para resolver la pregunta?

13.2.- Examinar los datos gráficamente y mediante estadística descriptiva.

boxplot(datos$Superficie~datos$Dosis)

modelo <- lm(datos$Superficie~datos$Dosis)
plot(modelo) # no se cumple homocedasticidad

Modelado de varianza

library(nlme)
m2<-gls(Superficie~Dosis,data = datos)
m2_varIdent <- gls(Superficie~Dosis, weights=varIdent(form=~fitted(.)), data = datos)
m3_varExp <- gls(Superficie~Dosis, weights=varExp(form=~fitted(.)), data = datos)
m4_varPow<-gls(Superficie~Dosis, weights=varPower(form=~fitted(.)), data = datos)
AIC(m2_varIdent,m3_varExp, m4_varPow)
##             df      AIC
## m2_varIdent  5 156.6427
## m3_varExp    6 135.6598
## m4_varPow    6 133.8624
modelo <- anova(m4_varPow)

library(emmeans)
Tukey <- emmeans(m4_varPow, pairwise~Dosis, adjust = "tukey")
summary(Tukey)
## $emmeans
##  Dosis emmean    SE    df lower.CL upper.CL
##  0       3.46 0.335  8.71     2.70     4.22
##  0.3    10.23 0.759 21.78     8.65    11.80
##  1      21.89 1.348 20.89    19.08    24.69
##  3      56.09 2.744  9.29    49.91    62.26
## 
## Degrees-of-freedom method: satterthwaite 
## Confidence level used: 0.95 
## 
## $contrasts
##  contrast estimate   SE    df t.ratio p.value
##  0 - 0.3     -6.77 0.83 19.46  -8.159 <.0001 
##  0 - 1      -18.43 1.39 22.18 -13.264 <.0001 
##  0 - 3      -52.63 2.76  9.64 -19.041 <.0001 
##  0.3 - 1    -11.66 1.55 22.93  -7.533 <.0001 
##  0.3 - 3    -45.86 2.85 10.38 -16.108 <.0001 
##  1 - 3      -34.20 3.06 10.99 -11.187 <.0001 
## 
## Degrees-of-freedom method: satterthwaite 
## P value adjustment: tukey method for comparing a family of 4 estimates
library(multcomp)
## Loading required package: mvtnorm
## Loading required package: survival
## Loading required package: TH.data
## Loading required package: MASS
## 
## Attaching package: 'TH.data'
## The following object is masked from 'package:MASS':
## 
##     geyser
cld(Tukey$emmeans)
##  Dosis emmean    SE    df lower.CL upper.CL .group
##  0       3.46 0.335  8.71     2.70     4.22  1    
##  0.3    10.23 0.759 21.78     8.65    11.80   2   
##  1      21.89 1.348 20.89    19.08    24.69    3  
##  3      56.09 2.744  9.29    49.91    62.26     4 
## 
## Degrees-of-freedom method: satterthwaite 
## Confidence level used: 0.95 
## P value adjustment: tukey method for comparing a family of 4 estimates 
## significance level used: alpha = 0.05
plot(Tukey, comparisons = T, horizontal = F)

13.3.- Verificar si se cumplen los supuestos de la prueba. Si se cumplen, resolver y dar la conclusión.

Problema 20

Los vertebrados terrestres expuestos a metales pesados pueden presentar bioacumulación de dichos contaminantes en diferentes tejidos. Las ratas (genero Rattus) que viven en áreas urbanas están expuestas a los metales pesados. Además, como presentan áreas de actividad relativamente pequeñas, se ha sugerido que estos roedores pueden ser usados para la detección de contaminación ambiental por metales pesados y de los riesgos de salud humanos asociados. Un grupo de investigadores registró el nivel de acumulación de plomo en huesos de 143 ratas (Rattus norvegicus) provenientes de distintos ambientes de la Ciudad de Buenos Aires. Se analizaron fémures los cuales fueron digeridos con ácido nítrico y posteriormente llevados al Laboratorio de Química Analítica del Centro Atómico de Ezeiza (CEA) de la Comisión Nacional de Energía Atómica (CNEA), para la determinación de la concentración del plomo. El objetivo fue comparar el nivel de acumulación media de plomo en fémures de ratas capturadas en 4 ambientes: Espacios verdes; Barrios residenciales; Barrios carenciados y Costa del Riachuelo. Datos en BD_Acumulación plomo.txt

datos <- read.table("BD_Acumulación_plomo.txt",header = T)

20.1- Identifique la variable respuesta, factores y niveles.

plot(datos)

20.2.- Escriba el modelo en parámetros y en términos del problema.

Modelo de ANOVA 1 factor: \[y_i= \mu + \alpha_i + \varepsilon_i\] donde \(y_i\) es cada observación (concentración de plomo en el fémur de un ratón), \(\mu\) es la media general poblacional, \(\alpha_i\) es el efecto del tratamiento (o sea, cada uno de los 4 tipos de ambientes) y \(\varepsilon\) es el error no contemplado por el modelo y por los tratamientos.

20.3.- Analice el cumplimiento de los supuestos del modelo.

Se asume DCA y se analiza los otros supuestos.

m1 <- aov(datos$Pb~datos$Ambiente)
shapiro.test(m1$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  m1$residuals
## W = 0.9745, p-value = 0.008978
0.008978<0.05 # rechazo H_o 
## [1] TRUE
library(car)
## Loading required package: carData
leveneTest(datos$Pb~datos$Ambiente, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
##        Df F value   Pr(>F)   
## group   3  5.2468 0.001847 **
##       139                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
0.001847<0.05 # rechazo H_o 
## [1] TRUE

No cumple con normalidad ni homocedasticidad. Se hace modelado de varianza.

20.4.- Concluya en relación con las diferencias en la acumulación de plomo en ratas de distintos ambientes.

Selección del modelo

library(nlme)
m1 <- gls(Pb~Ambiente,data=datos)
# se usa varIdent pues es cualitativa el factor 
m2_varIdent<-gls(Pb~Ambiente, weights=varIdent(form=~1|Ambiente), data = datos)
resid<-resid(m2_varIdent, type ="pearson")
pred<-fitted(m2_varIdent)
plot(pred,resid)

#homocedasticidad 
leveneTest(resid, datos$Ambiente, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
##        Df F value Pr(>F)
## group   3  0.0868 0.9672
##       139
0.9672<0.05 # no rechazo H_o
## [1] FALSE
#normalidad
qqPlot(resid)

## [1] 127  59
shapiro.test(resid)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid
## W = 0.98708, p-value = 0.2033
0.2033<0.05 #no rechazo
## [1] FALSE

ANOVA con modelado de varianzas (con GLS con variables dummy):

anova(m2_varIdent) 
## Denom. DF: 139 
##             numDF   F-value p-value
## (Intercept)     1 1953.4088  <.0001
## Ambiente        3   31.0107  <.0001

Se rechaza H_o. Algún \(alpha_i\) difiere.

summary(m2_varIdent)
## Generalized least squares fit by REML
##   Model: Pb ~ Ambiente 
##   Data: datos 
##       AIC      BIC    logLik
##   416.255 439.7307 -200.1275
## 
## Variance function:
##  Structure: Different standard deviations per stratum
##  Formula: ~1 | Ambiente 
##  Parameter estimates:
##    Esp_verdes B_carenciados   Residencial     Riachuelo 
##      1.000000      1.540258      1.663145      2.379000 
## 
## Coefficients:
##                         Value Std.Error   t-value p-value
## (Intercept)          3.474750 0.1440281 24.125496  0.0000
## AmbienteEsp_verdes  -0.820696 0.1737729 -4.722807  0.0000
## AmbienteResidencial -0.168750 0.3427667 -0.492317  0.6233
## AmbienteRiachuelo    1.154536 0.2368383  4.874784  0.0000
## 
##  Correlation: 
##                     (Intr) AmbnE_ AmbntRs
## AmbienteEsp_verdes  -0.829               
## AmbienteResidencial -0.420  0.348        
## AmbienteRiachuelo   -0.608  0.504  0.256 
## 
## Standardized residuals:
##        Min         Q1        Med         Q3        Max 
## -2.3023480 -0.5870478 -0.0237639  0.5300223  2.5876665 
## 
## Residual standard error: 0.5914035 
## Degrees of freedom: 143 total; 139 residual
library(emmeans)
tukey<-emmeans(m2_varIdent, pairwise~ Ambiente, adjust = "tukey")
plot(tukey, comparisons = T, horizontal = F)

library(multcompView)
library(multcomp)
cld(tukey$emmeans)
##  Ambiente      emmean     SE    df lower.CL upper.CL .group
##  Esp_verdes      2.65 0.0972 36.01     2.46     2.85  1    
##  Residencial     3.31 0.3110  9.01     2.60     4.01  12   
##  B_carenciados   3.47 0.1440 39.00     3.18     3.77   2   
##  Riachuelo       4.63 0.1880 55.00     4.25     5.01    3  
## 
## Degrees-of-freedom method: satterthwaite 
## Confidence level used: 0.95 
## P value adjustment: tukey method for comparing a family of 4 estimates 
## significance level used: alpha = 0.05

Problema 21

En una segunda etapa, los investigadores estudiaron la relación entre las diferentes concentraciones de plomo en el agua y la acumulación de este metal en los huesos de ratas criadas en laboratorio. El estudio fue llevado a cabo utilizando 20 ratas macho de la cepa Wistar, con un peso aproximado de 250 g, bajo condiciones de temperatura constante (25° C), humedad (10%) y luz (12:12 h, ciclo luz: oscuridad) y mantenidos en cajas de acrílico con alimento estándar para roedores (Purine Chow) y agua ad libitum. Los ejemplares fueron asignados al azar y en forma balanceada a uno de cuatro grupos tratados con acetato de plomo en el agua de bebida a concentraciones de 10, 125, 250 y 500 ppm, respectivamente. La exposición al plomo se mantuvo durante 14 días al cabo de los cuales se registró la concentración de plomo en fémur. Datos en BD_Plomo laboratorio.txt

datos <- read.table("BD_Plomo_laboratorio.txt",header = T)

21.1.- Describa los datos mediante un gráfico que responda al objetivo.

plot(datos)

21.2.- Presente una ecuación que describa la relación existente entre la acumulación de plomo en los huesos de las ratas y el nivel de plomo al que fueron expuestas

\[y_i=\alpha+\beta \cdot x_i + \varepsilon_i \] Con observación y_i, dada por \(alpha\) ordenada al origen y pendiente \(\beta\) acumulación de metal en el fémur por cada unidad de concentración de agua y \(\varepsilon_i\) los residuos no contemplados.

21.3.- Estudie los supuestos del modelo.

Homocedasticidad?
H_o= todos los sigmas son iguales

modelo <- lm(Pb_hueso~Pb_agua, data=datos)
plot(modelo$fitted.values, modelo$residuals) 

No hay homocedasticidad.

21.4.- Plantee y ponga a prueba la/las hipótesis necesarias para analizar el efecto de la concentración de plomo en el agua sobre la acumulación en huesos. Concluya en relación a los objetivos de la investigación.

Usemos GLS

Y <- datos$Pb_hueso
X <- datos$Pb_agua
m1<-gls(Y~X,data = datos)
m3_varExp<-gls(Y~X, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(Y~X, weights=varPower(form=~fitted(.)), data = datos) # se usará este 
AIC(m3_varExp, m4_varPower)
##             df      AIC
## m3_varExp    4 45.66092
## m4_varPower  4 42.66042

Verificamos supuestos del modelo

plot(m4_varPower)

qqPlot(resid(m4_varPower,type="pearson"))

## [1] 12 14
shapiro.test(resid(m4_varPower,type="pearson"))
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(m4_varPower, type = "pearson")
## W = 0.94107, p-value = 0.2512
0.2512<0.05 # no rechazo H_o
## [1] FALSE

Resumen de los datos

summary(m4_varPower)
## Generalized least squares fit by REML
##   Model: Y ~ X 
##   Data: datos 
##        AIC      BIC    logLik
##   42.66042 46.22191 -17.33021
## 
## Variance function:
##  Structure: Power of variance covariate
##  Formula: ~fitted(.) 
##  Parameter estimates:
##    power 
## 1.153651 
## 
## Coefficients:
##                 Value  Std.Error  t-value p-value
## (Intercept) 0.8316726 0.05174746 16.07176       0
## X           0.0126971 0.00068466 18.54515       0
## 
##  Correlation: 
##   (Intr)
## X -0.441
## 
## Standardized residuals:
##        Min         Q1        Med         Q3        Max 
## -1.4669045 -0.7889853 -0.1635293  0.7851163  1.5853197 
## 
## Residual standard error: 0.1176889 
## Degrees of freedom: 20 total; 18 residual
plot(datos)
abline(m4_varPower)

Se rechaza H_o se concluye habría respuesta funcional de plomo vs agua (redactar mejor). La ecuación sería \[Y=0.83167255+0.01269712 x\].

Problema 22

Efecto del ácido indolbutílico (AIB) en el arraigamiento de estacas de N. glauca. Nothofagus glauca o roble colorado es una especie endémica de la cordillera austral que ha estado sujeta a una intensa presión antrópica. Santelices (2007) llevó a cabo un ensayo en invernadero a fin de estudiar la capacidad de arraigamiento de estacas. Para el experimento se colectaron 96 estacas de tallo de árboles de más de veinte años de edad, que se distribuyeron en forma balanceada en un total de 24 macetas con un mismo sustrato. Se analizó el efecto sobre el desarrollo radicular del ácido indolbutílico (AIB) a cuatro dosis: Control, Dosis baja (0,5), Dosis intermedia (0,8) y Dosis alta (1,5%), para lo cual 6 macetas fueron asignadas a cada uno de estos tratamientos. Al cabo de tres meses se midió la longitud de la raíz (en cm) de cada estaca. Resultados (datos en BD_AIB.txt)

22.1.- Identifique la unidad experimental, la variable respuesta, la variable explicatoria y la cantidad de réplicas. ¿Se trata de un estudio experimental u observacional?

datos <- read.table("BD_AIB.txt",header = T)
datos$AIB <- as.factor(datos$AIB)

22.2.- Describa gráfica y estadísticamente las muestras.

plot(datos)

library(psych)
## 
## Attaching package: 'psych'
## The following object is masked from 'package:car':
## 
##     logit
describeBy(datos$longitud,datos$AIB)
## 
##  Descriptive statistics by group 
## group: 0
##    vars n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 6 1.77 0.32   1.77    1.77 0.39 1.41 2.24  0.83 0.16    -1.86 0.13
## ------------------------------------------------------------ 
## group: 0.5
##    vars n mean   sd median trimmed  mad min  max range  skew kurtosis   se
## X1    1 6 3.12 0.37   3.12    3.12 0.34 2.6 3.62  1.02 -0.06    -1.69 0.15
## ------------------------------------------------------------ 
## group: 0.8
##    vars n mean   sd median trimmed mad  min  max range skew kurtosis   se
## X1    1 6 5.13 0.65   5.06    5.13 0.9 4.37 5.95  1.58 0.13    -1.92 0.26
## ------------------------------------------------------------ 
## group: 1.5
##    vars n mean   sd median trimmed  mad min  max range  skew kurtosis  se
## X1    1 6 5.44 0.72   5.37    5.44 0.81 4.4 6.39  1.99 -0.03    -1.66 0.3

22.3.- Plantee el modelo y ponga a prueba sus supuestos.

library(nlme)
m1<-gls(longitud~AIB,data = datos)
m2_varIdent<-gls(longitud~AIB, weights=varIdent(form=~1|AIB), data = datos)
m3_varExp<-gls(longitud~AIB, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(longitud~AIB, weights=varPower(form=~fitted(.)), data = datos)
AIC(m1, m2_varIdent, m3_varExp, m4_varPower)
##             df      AIC
## m1           5 49.58421
## m2_varIdent  8 51.10242
## m3_varExp    6 47.28742
## m4_varPower  6 47.59364
library(car)
qqPlot(m3_varExp$residuals)

## [1] 19 24
plot(m3_varExp$fitted, resid(m3_varExp,type="pearson"))

leveneTest(resid(m3_varExp,type="pearson"),datos$AIB, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
##       Df F value Pr(>F)
## group  3  0.1233 0.9453
##       20

22.4.- Concluya en relación a los objetivos de la investigación. ¿Mejora la capacidad de arraigamiento (medido como largo de raíz) de las estacas con el AIB? ¿Cambia el efecto con las dosis? ¿Qué dosis recomendaría utilizar? Acompañe con un gráfico convenientemente rotulado.

library(emmeans)
tukey<-emmeans(m3_varExp, pairwise~AIB, adjust = "tukey")
library(multcompView)
library(multcomp)
cld(tukey$emmeans)
##  AIB emmean    SE    df lower.CL upper.CL .group
##  0     1.77 0.125  7.11     1.48     2.07  1    
##  0.5   3.12 0.169 16.28     2.77     3.48   2   
##  0.8   5.13 0.265 12.06     4.55     5.71    3  
##  1.5   5.44 0.284  9.87     4.81     6.08    3  
## 
## Degrees-of-freedom method: satterthwaite 
## Confidence level used: 0.95 
## P value adjustment: tukey method for comparing a family of 4 estimates 
## significance level used: alpha = 0.05
plot(tukey, comparisons = T, horizontal = F)

Problema 23

Las características microbiológicas y químicas del suelo cambian con la aplicación de abonos orgánicos. Investigadores de la Estación Experimental Agropecuaria (INTA, Mendoza), llevan a cabo un estudio con el objetivo de evaluar los cambios a corto plazo en algunas variables microbiológicas y químicas en respuesta a la aplicación de abonos orgánicos (compost) bajo condiciones controladas.

Parte A: Características químicas.

Respecto de las variables químicas edáficas, uno de los nutrientes del suelo que podría responder al manejo orgánico es la fracción de fósforo disponible para los cultivos (P- H2CO3). Con el fin de estudiar el efecto del abono en la concentración de este nutriente en suelo, se dispuso de 30 recipientes que contenían 100 g de suelo seco de textura franco-arenosa. Cada uno de ellos fue aleatoriamente asignado en forma balanceada a uno de los siguientes tratamientos: agregado de 0,5 g de compost (c), 0,5 g de vermicompost, corresponde a compost más el agregado de lombrices californianas, Eisenia foetida en la etapa final del proceso (v), y sin el agregado de abono orgánico (t). Estos recipientes fueron incubados por 40 días a 28oC y 60% del agua disponible remanente y a los 40 días se midió el contenido de fósforo en el suelo (mg kg-1 de suelo). Los resultados en el archivo BD_Compost.txt

datos <- read.table("BD_Compost.txt",header=T)

23.1.- Enuncie las variables involucradas y clasifíquelas.

  • variable explicatoria. un factor, compost (tratamiento), es fija, cualitativa.
  • variable predictora. contenido de fósfor en el suelo (mk kg-1 de suelo)

23.2.- ¿Que análisis realizaría para estudiar el efecto del abono? Enuncie las hipótesis correspondientes, indique y verifique los supuestos de la prueba a ser usada con sus hipótesis.

Se puede hacer un anova (quiero diferencias de medias). \[y_i=\mu+\alpha_i+\varepsilon_i\] Hipótesis para anova : -\(H_o\) : Todas las \(\mu_i\) son iguales

  • muestra aleatorias e independientes
  • noramlidad
  • homocedascticidad
boxplot(datos$fosforo~datos$compost)

modelo1 <- aov(datos$fosforo~datos$compost)
plot(modelo1) # no hay homocedasticidad

23.3.- Ponga a prueba las hipótesis de la prueba elegida y concluya en términos estadísticos y del problema, informe los resultados gráficamente

Modelado de varianzas:

library(nlme)
m2_varIdent<-gls(fosforo~compost, weights=varIdent(form=~1|compost), data = datos)
m3_varExp<-gls(fosforo~compost, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(fosforo~compost, weights=varPower(form=~fitted(.)), data = datos)
AIC( m2_varIdent, m3_varExp, m4_varPower)
##             df      AIC
## m2_varIdent  6 138.2210
## m3_varExp    5 136.4247
## m4_varPower  5 137.3944
# elijo   varExp
resid <- resid(m3_varExp, type='pearson')
pred <- fitted(m3_varExp)
plot(pred, resid)

library(car)
leveneTest(resid, datos$compost,center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
##       Df F value Pr(>F)
## group  2  0.1492 0.8621
##       27
0.8621<0.05 # no rechazo (No significativo)
## [1] FALSE
shapiro.test(resid)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid
## W = 0.96469, p-value = 0.4057
0.4057<0.05 # no rechazo (No significativo)
## [1] FALSE

Usamos varExp

anova(m3_varExp) # da signficiativo
## Denom. DF: 27 
##             numDF   F-value p-value
## (Intercept)     1 176.53181  <.0001
## compost         2  16.44158  <.0001
summary(m3_varExp)
## Generalized least squares fit by REML
##   Model: fosforo ~ compost 
##   Data: datos 
##        AIC      BIC    logLik
##   136.4247 142.9039 -63.21235
## 
## Variance function:
##  Structure: Exponential of variance covariate
##  Formula: ~fitted(.) 
##  Parameter estimates:
##     expon 
## 0.2131755 
## 
## Coefficients:
##              Value Std.Error   t-value p-value
## (Intercept)  6.210 0.6764342  9.180494  0.0000
## compostt    -3.088 0.7617179 -4.053994  0.0004
## compostv     3.566 1.5970017  2.232934  0.0340
## 
##  Correlation: 
##          (Intr) cmpstt
## compostt -0.888       
## compostv -0.424  0.376
## 
## Standardized residuals:
##         Min          Q1         Med          Q3         Max 
## -1.74374631 -0.60234764 -0.03064929  0.45973043  1.82215616 
## 
## Residual standard error: 0.5692432 
## Degrees of freedom: 30 total; 27 residual

Rechazamos H0 de falta de efecto del tratamiento; los suelos suplementados con compost o vermicompost tienen una media de fósforo mayor que los no sumplementados (los suplementados no difieren entre sí) con p<0.05

Contrastes

m3_varExp$contrasts
## $compost
##   t v
## c 0 0
## t 1 0
## v 0 1
library(emmeans)
tukey<-emmeans(m3_varExp, pairwise~compost, adjust = "tukey") 
plot(tukey, comparisons = T, horizontal = F)

Parte B: Propiedades microbiológicas.

Los microorganismos cumplen una función clave en los ciclos de los nutrientes del suelo y están involucrados en la descomposición de la materia orgánica, razón por la cual es relevante determinar parámetros tales como el contenido de carbono proveniente de la biomasa microbiana, el que aporta información referida al tamaño de su comunidad. Se cree que la adición de compost estimula el crecimiento de esta comunidad. Se diseña un experimento con el fin de determinar si existe una relación funcional entre la concentración de vermicompost adicionado al suelo y la producción de biomasa microbiana. Para ello se dispuso de recipientes conteniendo un suelo franco-arenoso a los cuales se les asignó en forma aleatoria una concentración de vermicompost que varió entre 0 y 50 g/Kg de suelo. Estas se incubaron bajo condiciones controladas de temperatura y humedad y después de 30 días se midió la concentración de carbón proveniente de la biomasa microbiana a través de la técnica de fumigación-extracción (μg/kg suelo). Los resultados en el archivo BD_Biomasa.txt

datos <- read.table("BD_Biomasa.txt",header = T)

23.4.- Enuncie las variables involucradas y clasifíquelas.

  • var respuesta: produccion de biomasa microbiana (continua)
  • var explicatoria: concentracion de compost (continua). Es fija.
plot(datos$biomasa_microb~datos$concentrac_compost)

23.5.- ¿Qué análisis realizaría a los fines del problema planteado? Enuncie las hipótesis correspondientes, indique y verifique los supuestos de la prueba a ser usada con sus hipótesis.

Como me dice que quiere estudiar la relación funcional, hago una regresión. Modelo de regresion \[y_i=\alpha+\beta_i x\] con su respectiva interpretación.

  • H_o = \(\beta=0\) hay relacion funcional
  • H_a = \(\beta \neq 0\) no hay relacion funcional

Supuestos - X está medida sin error - obsrevaciones independiente y siguen una distribución normal - para todos los valores esperados de Y, los valores de X están alineados tq E(Y)=alfa+beta.x - homocedascticiad. Las varianzas sub-poblacionales de Y son iguales.

Verico supuestos

modelo <- lm(biomasa_microb~concentrac_compost, data=datos)
plot(modelo) # se cumple homogeneidad 

# aca puedo hacer levene porque tengo réplicas 
leveneTest(biomasa_microb~as.factor(concentrac_compost),data=datos, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
##       Df F value Pr(>F)
## group  5  0.2206 0.9501
##       24
0.9501<0.05 #no significativo
## [1] FALSE

23.6.- Ponga a prueba las hipótesis de la prueba elegida, indique el significado de los parámetros estimados y concluya en términos del problema.

summary(modelo)
## 
## Call:
## lm(formula = biomasa_microb ~ concentrac_compost, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -94.981 -39.940  -0.017  36.219 121.044 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        203.9224    16.3135   12.50 5.65e-13 ***
## concentrac_compost  38.3178     0.5388   71.11  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 50.4 on 28 degrees of freedom
## Multiple R-squared:  0.9945, Adjusted R-squared:  0.9943 
## F-statistic:  5057 on 1 and 28 DF,  p-value: < 2.2e-16

\[y=203.9224 +38.3178x\] donde sería el valor promedio de la biomasa cuando la concentración de compost es 0. La pendiente me dice que cada vez que la contreación aumenta en una unidad de g/kg de suelo, la biomasa aumenta tanto mug/kg suelo. R cuadrado : 0.9945 buen ajuste.

23.7.- ¿Cuál es el valor estimado o predicho para una concentración de vermicompost de 20 g/Kg de suelo.

predict(modelo, newdata = data.frame(concentrac_compost=20), interval = "confidence", level=0.95)
##        fit      lwr      upr
## 1 970.2778 950.6371 989.9186

La biomasa microbiana esperada para una concentración de vermicompost de 20gKg de suelo está entre lwr y upr. El valor esperado es fit

Problema 24

Para estudiar posibles drogas que ayuden a combatir el cáncer de las mucosas bucales, se utilizan animales como el hámster. A estos animales se les inoculan células cancerosas en las paredes de las mucosas bucales, para luego someterlos a tratamientos y ver sus efectos. Para ello se eligieron al azar 20 de estos animales y se los asigno, en forma balanceada y al azar, a una de 4 dosis de una droga experimental (0, 12.5, 25 y 50 μl/kg de animal). Se quiere saber cuál es la relación entre el diámetro de los tumores (en mm) y la dosis de la droga suministrada. Los datos se encuentran en el archivo BD_Cancer.txt

datos <- read.table("BD_Cancer.txt", header = T)

24.1.- Indique qué tipo de análisis se podría realizar, sus variables y enuncie las hipótesis que pondrá a prueba.

plot(datos)

Regresión? pues quiero relación funcional.

24.2.- Enuncie el modelo estadístico del análisis adecuado e interprete sus todos sus parámetros en términos del problema.

modelo <- lm(Diametro~Dosis, data=datos)
plot(modelo)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.94302, p-value = 0.2732
0.2732<0.05
## [1] FALSE
# no cumple homocedasticidad. 

24.3.- Realice el análisis propuesto en los puntos anteriores, indicando los supuestos involucrados y verificando los que corresponda.

library(nlme)

# no util m1<-gls(Diametro~Dosis, data=datos)
m3_varExp<-gls(Diametro~Dosis, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(Diametro~Dosis, weights=varPower(form=~fitted(.)), data = datos)
AIC(m3_varExp, m4_varPower) # uso var.exp
##             df      AIC
## m3_varExp    4 97.14635
## m4_varPower  4 98.43255

Se usa m3_varExpo (menor AIC)

par(mfrow=c(1,2))
qqPlot(resid(m3_varExp, type="pearson"))
## [1]  9 14
plot(m3_varExp) # cumple ahora homocedasticidad 
shapiro.test(resid(m3_varExp, type="pearson"))
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(m3_varExp, type = "pearson")
## W = 0.94316, p-value = 0.2749
summary(m3_varExp)
## Generalized least squares fit by REML
##   Model: Diametro ~ Dosis 
##   Data: datos 
##        AIC      BIC    logLik
##   97.14635 100.7078 -44.57318
## 
## Variance function:
##  Structure: Exponential of variance covariate
##  Formula: ~fitted(.) 
##  Parameter estimates:
##      expon 
## 0.09410367 
## 
## Coefficients:
##                 Value Std.Error   t-value p-value
## (Intercept) 29.171817 1.0694936  27.27629       0
## Dosis       -0.487665 0.0225631 -21.61342       0
## 
##  Correlation: 
##       (Intr)
## Dosis -0.977
## 
## Standardized residuals:
##         Min          Q1         Med          Q3         Max 
## -1.74024011 -0.71329413  0.02099593  0.87006252  1.40319709 
## 
## Residual standard error: 0.3489039 
## Degrees of freedom: 20 total; 18 residual

24.4.- Concluya estadística y biológicamente.

Se rechaza H_o. Hay relación funcional …