Los pastizales nativos ubicados en la parte central de la Argentina se caracterizan por la abundancia de especies de gramíneas del género Stipa. Un grupo de investigación está estudiando los factores que limitan el crecimiento de Stipa brachychaeta, una de las especies más comunes en la región.
Las personas con enfermedades óseas crónicas tienen riesgo de presentar reducciones de densidad y posteriores fracturas de sus huesos. Uno de los tratamientos más utilizados en esos casos es la administración de bifosfonatos. Estos son inhibidores de la resorción ósea, que aumentan la densidad mineral de los huesos estimulando su formación e incrementando su volumen.
En un estudio, se quiso poner a prueba la efectividad de dos bifosfonatos: alendronato y zoledronato. A los investigadores les interesaba saber, en particular, si ambos eran efectivos y si uno era más eficiente que el otro. Para ello usaron como modelo experimental ovejas maduras ovariectomizadas. Las alimentaron durante 6 meses con una dieta pobre en calcio y vitamina D, luego se les midió la densidad mineral ósea (DMO) y las asignaron aleatoriamente a 3 grupos. A uno le administraron 0,1 mg/kg de zoledronato; a otro, igual dosis de alendronato y al tercero no le administraron ninguna medicación. Luego de 8 semanas sosteniendo la misma dieta, les volvieron a medir la DMO. Los cambios porcentuales en DMO se encuentran en el archivo BD_DMO.txt
Reanalizar el problema 13 utilizando ahora las herramientas de modelado de varianza adquiridas:
Problema 13. Se estudió la capacidad de los nitropirenos,un grupo de contaminantes ambientales, para efectuar cambios en la capacidad reproductiva de la bacteria Salmonella sp,. que produce una enfermedad de transmisión alimentaria. Para ello se calculó la superficie cubierta por colonias de Salmonella (en cm) en placas tratadas con cuatro dosis del nitropireno 4NP. Los resultados obtenidos utilizando 28 placas fueron (Datos en BD_Salmonella. txt):
datos <- read.table("BD_Salmonella.txt",header = T)
datos$Dosis <- as.factor(datos$Dosis)
13.1.- Identificar y clasificar las variables del estudio.¿Qué análisis estadístico se podría utilizar para resolver la pregunta?
13.2.- Examinar los datos gráficamente y mediante estadística descriptiva.
boxplot(datos$Superficie~datos$Dosis)
modelo <- lm(datos$Superficie~datos$Dosis)
plot(modelo) # no se cumple homocedasticidad
Modelado de varianza
library(nlme)
m2<-gls(Superficie~Dosis,data = datos)
m2_varIdent <- gls(Superficie~Dosis, weights=varIdent(form=~fitted(.)), data = datos)
m3_varExp <- gls(Superficie~Dosis, weights=varExp(form=~fitted(.)), data = datos)
m4_varPow<-gls(Superficie~Dosis, weights=varPower(form=~fitted(.)), data = datos)
AIC(m2_varIdent,m3_varExp, m4_varPow)
## df AIC
## m2_varIdent 5 156.6427
## m3_varExp 6 135.6598
## m4_varPow 6 133.8624
modelo <- anova(m4_varPow)
library(emmeans)
Tukey <- emmeans(m4_varPow, pairwise~Dosis, adjust = "tukey")
summary(Tukey)
## $emmeans
## Dosis emmean SE df lower.CL upper.CL
## 0 3.46 0.335 8.71 2.70 4.22
## 0.3 10.23 0.759 21.78 8.65 11.80
## 1 21.89 1.348 20.89 19.08 24.69
## 3 56.09 2.744 9.29 49.91 62.26
##
## Degrees-of-freedom method: satterthwaite
## Confidence level used: 0.95
##
## $contrasts
## contrast estimate SE df t.ratio p.value
## 0 - 0.3 -6.77 0.83 19.46 -8.159 <.0001
## 0 - 1 -18.43 1.39 22.18 -13.264 <.0001
## 0 - 3 -52.63 2.76 9.64 -19.041 <.0001
## 0.3 - 1 -11.66 1.55 22.93 -7.533 <.0001
## 0.3 - 3 -45.86 2.85 10.38 -16.108 <.0001
## 1 - 3 -34.20 3.06 10.99 -11.187 <.0001
##
## Degrees-of-freedom method: satterthwaite
## P value adjustment: tukey method for comparing a family of 4 estimates
library(multcomp)
## Loading required package: mvtnorm
## Loading required package: survival
## Loading required package: TH.data
## Loading required package: MASS
##
## Attaching package: 'TH.data'
## The following object is masked from 'package:MASS':
##
## geyser
cld(Tukey$emmeans)
## Dosis emmean SE df lower.CL upper.CL .group
## 0 3.46 0.335 8.71 2.70 4.22 1
## 0.3 10.23 0.759 21.78 8.65 11.80 2
## 1 21.89 1.348 20.89 19.08 24.69 3
## 3 56.09 2.744 9.29 49.91 62.26 4
##
## Degrees-of-freedom method: satterthwaite
## Confidence level used: 0.95
## P value adjustment: tukey method for comparing a family of 4 estimates
## significance level used: alpha = 0.05
plot(Tukey, comparisons = T, horizontal = F)
13.3.- Verificar si se cumplen los supuestos de la prueba. Si se cumplen, resolver y dar la conclusión.
Los vertebrados terrestres expuestos a metales pesados pueden presentar bioacumulación de dichos contaminantes en diferentes tejidos. Las ratas (genero Rattus) que viven en áreas urbanas están expuestas a los metales pesados. Además, como presentan áreas de actividad relativamente pequeñas, se ha sugerido que estos roedores pueden ser usados para la detección de contaminación ambiental por metales pesados y de los riesgos de salud humanos asociados. Un grupo de investigadores registró el nivel de acumulación de plomo en huesos de 143 ratas (Rattus norvegicus) provenientes de distintos ambientes de la Ciudad de Buenos Aires. Se analizaron fémures los cuales fueron digeridos con ácido nítrico y posteriormente llevados al Laboratorio de Química Analítica del Centro Atómico de Ezeiza (CEA) de la Comisión Nacional de Energía Atómica (CNEA), para la determinación de la concentración del plomo. El objetivo fue comparar el nivel de acumulación media de plomo en fémures de ratas capturadas en 4 ambientes: Espacios verdes; Barrios residenciales; Barrios carenciados y Costa del Riachuelo. Datos en BD_Acumulación plomo.txt
datos <- read.table("BD_Acumulación_plomo.txt",header = T)
20.1- Identifique la variable respuesta, factores y niveles.
plot(datos)
20.2.- Escriba el modelo en parámetros y en términos del problema.
Modelo de ANOVA 1 factor: \[y_i= \mu + \alpha_i + \varepsilon_i\] donde \(y_i\) es cada observación (concentración de plomo en el fémur de un ratón), \(\mu\) es la media general poblacional, \(\alpha_i\) es el efecto del tratamiento (o sea, cada uno de los 4 tipos de ambientes) y \(\varepsilon\) es el error no contemplado por el modelo y por los tratamientos.
20.3.- Analice el cumplimiento de los supuestos del modelo.
Se asume DCA y se analiza los otros supuestos.
m1 <- aov(datos$Pb~datos$Ambiente)
shapiro.test(m1$residuals)
##
## Shapiro-Wilk normality test
##
## data: m1$residuals
## W = 0.9745, p-value = 0.008978
0.008978<0.05 # rechazo H_o
## [1] TRUE
library(car)
## Loading required package: carData
leveneTest(datos$Pb~datos$Ambiente, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
## Df F value Pr(>F)
## group 3 5.2468 0.001847 **
## 139
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
0.001847<0.05 # rechazo H_o
## [1] TRUE
No cumple con normalidad ni homocedasticidad. Se hace modelado de varianza.
20.4.- Concluya en relación con las diferencias en la acumulación de plomo en ratas de distintos ambientes.
Selección del modelo
library(nlme)
m1 <- gls(Pb~Ambiente,data=datos)
# se usa varIdent pues es cualitativa el factor
m2_varIdent<-gls(Pb~Ambiente, weights=varIdent(form=~1|Ambiente), data = datos)
resid<-resid(m2_varIdent, type ="pearson")
pred<-fitted(m2_varIdent)
plot(pred,resid)
#homocedasticidad
leveneTest(resid, datos$Ambiente, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
## Df F value Pr(>F)
## group 3 0.0868 0.9672
## 139
0.9672<0.05 # no rechazo H_o
## [1] FALSE
#normalidad
qqPlot(resid)
## [1] 127 59
shapiro.test(resid)
##
## Shapiro-Wilk normality test
##
## data: resid
## W = 0.98708, p-value = 0.2033
0.2033<0.05 #no rechazo
## [1] FALSE
ANOVA con modelado de varianzas (con GLS con variables dummy):
anova(m2_varIdent)
## Denom. DF: 139
## numDF F-value p-value
## (Intercept) 1 1953.4088 <.0001
## Ambiente 3 31.0107 <.0001
Se rechaza H_o. Algún \(alpha_i\) difiere.
summary(m2_varIdent)
## Generalized least squares fit by REML
## Model: Pb ~ Ambiente
## Data: datos
## AIC BIC logLik
## 416.255 439.7307 -200.1275
##
## Variance function:
## Structure: Different standard deviations per stratum
## Formula: ~1 | Ambiente
## Parameter estimates:
## Esp_verdes B_carenciados Residencial Riachuelo
## 1.000000 1.540258 1.663145 2.379000
##
## Coefficients:
## Value Std.Error t-value p-value
## (Intercept) 3.474750 0.1440281 24.125496 0.0000
## AmbienteEsp_verdes -0.820696 0.1737729 -4.722807 0.0000
## AmbienteResidencial -0.168750 0.3427667 -0.492317 0.6233
## AmbienteRiachuelo 1.154536 0.2368383 4.874784 0.0000
##
## Correlation:
## (Intr) AmbnE_ AmbntRs
## AmbienteEsp_verdes -0.829
## AmbienteResidencial -0.420 0.348
## AmbienteRiachuelo -0.608 0.504 0.256
##
## Standardized residuals:
## Min Q1 Med Q3 Max
## -2.3023480 -0.5870478 -0.0237639 0.5300223 2.5876665
##
## Residual standard error: 0.5914035
## Degrees of freedom: 143 total; 139 residual
library(emmeans)
tukey<-emmeans(m2_varIdent, pairwise~ Ambiente, adjust = "tukey")
plot(tukey, comparisons = T, horizontal = F)
library(multcompView)
library(multcomp)
cld(tukey$emmeans)
## Ambiente emmean SE df lower.CL upper.CL .group
## Esp_verdes 2.65 0.0972 36.01 2.46 2.85 1
## Residencial 3.31 0.3110 9.01 2.60 4.01 12
## B_carenciados 3.47 0.1440 39.00 3.18 3.77 2
## Riachuelo 4.63 0.1880 55.00 4.25 5.01 3
##
## Degrees-of-freedom method: satterthwaite
## Confidence level used: 0.95
## P value adjustment: tukey method for comparing a family of 4 estimates
## significance level used: alpha = 0.05
En una segunda etapa, los investigadores estudiaron la relación entre las diferentes concentraciones de plomo en el agua y la acumulación de este metal en los huesos de ratas criadas en laboratorio. El estudio fue llevado a cabo utilizando 20 ratas macho de la cepa Wistar, con un peso aproximado de 250 g, bajo condiciones de temperatura constante (25° C), humedad (10%) y luz (12:12 h, ciclo luz: oscuridad) y mantenidos en cajas de acrílico con alimento estándar para roedores (Purine Chow) y agua ad libitum. Los ejemplares fueron asignados al azar y en forma balanceada a uno de cuatro grupos tratados con acetato de plomo en el agua de bebida a concentraciones de 10, 125, 250 y 500 ppm, respectivamente. La exposición al plomo se mantuvo durante 14 días al cabo de los cuales se registró la concentración de plomo en fémur. Datos en BD_Plomo laboratorio.txt
datos <- read.table("BD_Plomo_laboratorio.txt",header = T)
21.1.- Describa los datos mediante un gráfico que responda al objetivo.
plot(datos)
21.2.- Presente una ecuación que describa la relación existente entre la acumulación de plomo en los huesos de las ratas y el nivel de plomo al que fueron expuestas
\[y_i=\alpha+\beta \cdot x_i + \varepsilon_i \] Con observación y_i, dada por \(alpha\) ordenada al origen y pendiente \(\beta\) acumulación de metal en el fémur por cada unidad de concentración de agua y \(\varepsilon_i\) los residuos no contemplados.
21.3.- Estudie los supuestos del modelo.
Homocedasticidad?
H_o= todos los sigmas son iguales
modelo <- lm(Pb_hueso~Pb_agua, data=datos)
plot(modelo$fitted.values, modelo$residuals)
No hay homocedasticidad.
21.4.- Plantee y ponga a prueba la/las hipótesis necesarias para analizar el efecto de la concentración de plomo en el agua sobre la acumulación en huesos. Concluya en relación a los objetivos de la investigación.
Usemos GLS
Y <- datos$Pb_hueso
X <- datos$Pb_agua
m1<-gls(Y~X,data = datos)
m3_varExp<-gls(Y~X, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(Y~X, weights=varPower(form=~fitted(.)), data = datos) # se usará este
AIC(m3_varExp, m4_varPower)
## df AIC
## m3_varExp 4 45.66092
## m4_varPower 4 42.66042
Verificamos supuestos del modelo
plot(m4_varPower)
qqPlot(resid(m4_varPower,type="pearson"))
## [1] 12 14
shapiro.test(resid(m4_varPower,type="pearson"))
##
## Shapiro-Wilk normality test
##
## data: resid(m4_varPower, type = "pearson")
## W = 0.94107, p-value = 0.2512
0.2512<0.05 # no rechazo H_o
## [1] FALSE
Resumen de los datos
summary(m4_varPower)
## Generalized least squares fit by REML
## Model: Y ~ X
## Data: datos
## AIC BIC logLik
## 42.66042 46.22191 -17.33021
##
## Variance function:
## Structure: Power of variance covariate
## Formula: ~fitted(.)
## Parameter estimates:
## power
## 1.153651
##
## Coefficients:
## Value Std.Error t-value p-value
## (Intercept) 0.8316726 0.05174746 16.07176 0
## X 0.0126971 0.00068466 18.54515 0
##
## Correlation:
## (Intr)
## X -0.441
##
## Standardized residuals:
## Min Q1 Med Q3 Max
## -1.4669045 -0.7889853 -0.1635293 0.7851163 1.5853197
##
## Residual standard error: 0.1176889
## Degrees of freedom: 20 total; 18 residual
plot(datos)
abline(m4_varPower)
Se rechaza H_o se concluye habría respuesta funcional de plomo vs agua (redactar mejor). La ecuación sería \[Y=0.83167255+0.01269712 x\].
Efecto del ácido indolbutílico (AIB) en el arraigamiento de estacas de N. glauca. Nothofagus glauca o roble colorado es una especie endémica de la cordillera austral que ha estado sujeta a una intensa presión antrópica. Santelices (2007) llevó a cabo un ensayo en invernadero a fin de estudiar la capacidad de arraigamiento de estacas. Para el experimento se colectaron 96 estacas de tallo de árboles de más de veinte años de edad, que se distribuyeron en forma balanceada en un total de 24 macetas con un mismo sustrato. Se analizó el efecto sobre el desarrollo radicular del ácido indolbutílico (AIB) a cuatro dosis: Control, Dosis baja (0,5), Dosis intermedia (0,8) y Dosis alta (1,5%), para lo cual 6 macetas fueron asignadas a cada uno de estos tratamientos. Al cabo de tres meses se midió la longitud de la raíz (en cm) de cada estaca. Resultados (datos en BD_AIB.txt)
22.1.- Identifique la unidad experimental, la variable respuesta, la variable explicatoria y la cantidad de réplicas. ¿Se trata de un estudio experimental u observacional?
datos <- read.table("BD_AIB.txt",header = T)
datos$AIB <- as.factor(datos$AIB)
22.2.- Describa gráfica y estadísticamente las muestras.
plot(datos)
library(psych)
##
## Attaching package: 'psych'
## The following object is masked from 'package:car':
##
## logit
describeBy(datos$longitud,datos$AIB)
##
## Descriptive statistics by group
## group: 0
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 6 1.77 0.32 1.77 1.77 0.39 1.41 2.24 0.83 0.16 -1.86 0.13
## ------------------------------------------------------------
## group: 0.5
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 6 3.12 0.37 3.12 3.12 0.34 2.6 3.62 1.02 -0.06 -1.69 0.15
## ------------------------------------------------------------
## group: 0.8
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 6 5.13 0.65 5.06 5.13 0.9 4.37 5.95 1.58 0.13 -1.92 0.26
## ------------------------------------------------------------
## group: 1.5
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 6 5.44 0.72 5.37 5.44 0.81 4.4 6.39 1.99 -0.03 -1.66 0.3
22.3.- Plantee el modelo y ponga a prueba sus supuestos.
library(nlme)
m1<-gls(longitud~AIB,data = datos)
m2_varIdent<-gls(longitud~AIB, weights=varIdent(form=~1|AIB), data = datos)
m3_varExp<-gls(longitud~AIB, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(longitud~AIB, weights=varPower(form=~fitted(.)), data = datos)
AIC(m1, m2_varIdent, m3_varExp, m4_varPower)
## df AIC
## m1 5 49.58421
## m2_varIdent 8 51.10242
## m3_varExp 6 47.28742
## m4_varPower 6 47.59364
library(car)
qqPlot(m3_varExp$residuals)
## [1] 19 24
plot(m3_varExp$fitted, resid(m3_varExp,type="pearson"))
leveneTest(resid(m3_varExp,type="pearson"),datos$AIB, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
## Df F value Pr(>F)
## group 3 0.1233 0.9453
## 20
22.4.- Concluya en relación a los objetivos de la investigación. ¿Mejora la capacidad de arraigamiento (medido como largo de raíz) de las estacas con el AIB? ¿Cambia el efecto con las dosis? ¿Qué dosis recomendaría utilizar? Acompañe con un gráfico convenientemente rotulado.
library(emmeans)
tukey<-emmeans(m3_varExp, pairwise~AIB, adjust = "tukey")
library(multcompView)
library(multcomp)
cld(tukey$emmeans)
## AIB emmean SE df lower.CL upper.CL .group
## 0 1.77 0.125 7.11 1.48 2.07 1
## 0.5 3.12 0.169 16.28 2.77 3.48 2
## 0.8 5.13 0.265 12.06 4.55 5.71 3
## 1.5 5.44 0.284 9.87 4.81 6.08 3
##
## Degrees-of-freedom method: satterthwaite
## Confidence level used: 0.95
## P value adjustment: tukey method for comparing a family of 4 estimates
## significance level used: alpha = 0.05
plot(tukey, comparisons = T, horizontal = F)
Las características microbiológicas y químicas del suelo cambian con la aplicación de abonos orgánicos. Investigadores de la Estación Experimental Agropecuaria (INTA, Mendoza), llevan a cabo un estudio con el objetivo de evaluar los cambios a corto plazo en algunas variables microbiológicas y químicas en respuesta a la aplicación de abonos orgánicos (compost) bajo condiciones controladas.
Respecto de las variables químicas edáficas, uno de los nutrientes del suelo que podría responder al manejo orgánico es la fracción de fósforo disponible para los cultivos (P- H2CO3). Con el fin de estudiar el efecto del abono en la concentración de este nutriente en suelo, se dispuso de 30 recipientes que contenían 100 g de suelo seco de textura franco-arenosa. Cada uno de ellos fue aleatoriamente asignado en forma balanceada a uno de los siguientes tratamientos: agregado de 0,5 g de compost (c), 0,5 g de vermicompost, corresponde a compost más el agregado de lombrices californianas, Eisenia foetida en la etapa final del proceso (v), y sin el agregado de abono orgánico (t). Estos recipientes fueron incubados por 40 días a 28oC y 60% del agua disponible remanente y a los 40 días se midió el contenido de fósforo en el suelo (mg kg-1 de suelo). Los resultados en el archivo BD_Compost.txt
datos <- read.table("BD_Compost.txt",header=T)
23.1.- Enuncie las variables involucradas y clasifíquelas.
23.2.- ¿Que análisis realizaría para estudiar el efecto del abono? Enuncie las hipótesis correspondientes, indique y verifique los supuestos de la prueba a ser usada con sus hipótesis.
Se puede hacer un anova (quiero diferencias de medias). \[y_i=\mu+\alpha_i+\varepsilon_i\] Hipótesis para anova : -\(H_o\) : Todas las \(\mu_i\) son iguales
boxplot(datos$fosforo~datos$compost)
modelo1 <- aov(datos$fosforo~datos$compost)
plot(modelo1) # no hay homocedasticidad
23.3.- Ponga a prueba las hipótesis de la prueba elegida y concluya en términos estadísticos y del problema, informe los resultados gráficamente
Modelado de varianzas:
library(nlme)
m2_varIdent<-gls(fosforo~compost, weights=varIdent(form=~1|compost), data = datos)
m3_varExp<-gls(fosforo~compost, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(fosforo~compost, weights=varPower(form=~fitted(.)), data = datos)
AIC( m2_varIdent, m3_varExp, m4_varPower)
## df AIC
## m2_varIdent 6 138.2210
## m3_varExp 5 136.4247
## m4_varPower 5 137.3944
# elijo varExp
resid <- resid(m3_varExp, type='pearson')
pred <- fitted(m3_varExp)
plot(pred, resid)
library(car)
leveneTest(resid, datos$compost,center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
## Df F value Pr(>F)
## group 2 0.1492 0.8621
## 27
0.8621<0.05 # no rechazo (No significativo)
## [1] FALSE
shapiro.test(resid)
##
## Shapiro-Wilk normality test
##
## data: resid
## W = 0.96469, p-value = 0.4057
0.4057<0.05 # no rechazo (No significativo)
## [1] FALSE
Usamos varExp
anova(m3_varExp) # da signficiativo
## Denom. DF: 27
## numDF F-value p-value
## (Intercept) 1 176.53181 <.0001
## compost 2 16.44158 <.0001
summary(m3_varExp)
## Generalized least squares fit by REML
## Model: fosforo ~ compost
## Data: datos
## AIC BIC logLik
## 136.4247 142.9039 -63.21235
##
## Variance function:
## Structure: Exponential of variance covariate
## Formula: ~fitted(.)
## Parameter estimates:
## expon
## 0.2131755
##
## Coefficients:
## Value Std.Error t-value p-value
## (Intercept) 6.210 0.6764342 9.180494 0.0000
## compostt -3.088 0.7617179 -4.053994 0.0004
## compostv 3.566 1.5970017 2.232934 0.0340
##
## Correlation:
## (Intr) cmpstt
## compostt -0.888
## compostv -0.424 0.376
##
## Standardized residuals:
## Min Q1 Med Q3 Max
## -1.74374631 -0.60234764 -0.03064929 0.45973043 1.82215616
##
## Residual standard error: 0.5692432
## Degrees of freedom: 30 total; 27 residual
Rechazamos H0 de falta de efecto del tratamiento; los suelos suplementados con compost o vermicompost tienen una media de fósforo mayor que los no sumplementados (los suplementados no difieren entre sí) con p<0.05
Contrastes
m3_varExp$contrasts
## $compost
## t v
## c 0 0
## t 1 0
## v 0 1
library(emmeans)
tukey<-emmeans(m3_varExp, pairwise~compost, adjust = "tukey")
plot(tukey, comparisons = T, horizontal = F)
Los microorganismos cumplen una función clave en los ciclos de los nutrientes del suelo y están involucrados en la descomposición de la materia orgánica, razón por la cual es relevante determinar parámetros tales como el contenido de carbono proveniente de la biomasa microbiana, el que aporta información referida al tamaño de su comunidad. Se cree que la adición de compost estimula el crecimiento de esta comunidad. Se diseña un experimento con el fin de determinar si existe una relación funcional entre la concentración de vermicompost adicionado al suelo y la producción de biomasa microbiana. Para ello se dispuso de recipientes conteniendo un suelo franco-arenoso a los cuales se les asignó en forma aleatoria una concentración de vermicompost que varió entre 0 y 50 g/Kg de suelo. Estas se incubaron bajo condiciones controladas de temperatura y humedad y después de 30 días se midió la concentración de carbón proveniente de la biomasa microbiana a través de la técnica de fumigación-extracción (μg/kg suelo). Los resultados en el archivo BD_Biomasa.txt
datos <- read.table("BD_Biomasa.txt",header = T)
23.4.- Enuncie las variables involucradas y clasifíquelas.
plot(datos$biomasa_microb~datos$concentrac_compost)
23.5.- ¿Qué análisis realizaría a los fines del problema planteado? Enuncie las hipótesis correspondientes, indique y verifique los supuestos de la prueba a ser usada con sus hipótesis.
Como me dice que quiere estudiar la relación funcional, hago una regresión. Modelo de regresion \[y_i=\alpha+\beta_i x\] con su respectiva interpretación.
Supuestos - X está medida sin error - obsrevaciones independiente y siguen una distribución normal - para todos los valores esperados de Y, los valores de X están alineados tq E(Y)=alfa+beta.x - homocedascticiad. Las varianzas sub-poblacionales de Y son iguales.
Verico supuestos
modelo <- lm(biomasa_microb~concentrac_compost, data=datos)
plot(modelo) # se cumple homogeneidad
# aca puedo hacer levene porque tengo réplicas
leveneTest(biomasa_microb~as.factor(concentrac_compost),data=datos, center=mean)
## Levene's Test for Homogeneity of Variance (center = mean)
## Df F value Pr(>F)
## group 5 0.2206 0.9501
## 24
0.9501<0.05 #no significativo
## [1] FALSE
23.6.- Ponga a prueba las hipótesis de la prueba elegida, indique el significado de los parámetros estimados y concluya en términos del problema.
summary(modelo)
##
## Call:
## lm(formula = biomasa_microb ~ concentrac_compost, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -94.981 -39.940 -0.017 36.219 121.044
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 203.9224 16.3135 12.50 5.65e-13 ***
## concentrac_compost 38.3178 0.5388 71.11 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 50.4 on 28 degrees of freedom
## Multiple R-squared: 0.9945, Adjusted R-squared: 0.9943
## F-statistic: 5057 on 1 and 28 DF, p-value: < 2.2e-16
\[y=203.9224 +38.3178x\] donde sería el valor promedio de la biomasa cuando la concentración de compost es 0. La pendiente me dice que cada vez que la contreación aumenta en una unidad de g/kg de suelo, la biomasa aumenta tanto mug/kg suelo. R cuadrado : 0.9945 buen ajuste.
23.7.- ¿Cuál es el valor estimado o predicho para una concentración de vermicompost de 20 g/Kg de suelo.
predict(modelo, newdata = data.frame(concentrac_compost=20), interval = "confidence", level=0.95)
## fit lwr upr
## 1 970.2778 950.6371 989.9186
La biomasa microbiana esperada para una concentración de vermicompost de 20gKg de suelo está entre lwr y upr. El valor esperado es fit
Para estudiar posibles drogas que ayuden a combatir el cáncer de las mucosas bucales, se utilizan animales como el hámster. A estos animales se les inoculan células cancerosas en las paredes de las mucosas bucales, para luego someterlos a tratamientos y ver sus efectos. Para ello se eligieron al azar 20 de estos animales y se los asigno, en forma balanceada y al azar, a una de 4 dosis de una droga experimental (0, 12.5, 25 y 50 μl/kg de animal). Se quiere saber cuál es la relación entre el diámetro de los tumores (en mm) y la dosis de la droga suministrada. Los datos se encuentran en el archivo BD_Cancer.txt
datos <- read.table("BD_Cancer.txt", header = T)
24.1.- Indique qué tipo de análisis se podría realizar, sus variables y enuncie las hipótesis que pondrá a prueba.
plot(datos)
Regresión? pues quiero relación funcional.
24.2.- Enuncie el modelo estadístico del análisis adecuado e interprete sus todos sus parámetros en términos del problema.
modelo <- lm(Diametro~Dosis, data=datos)
plot(modelo)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.94302, p-value = 0.2732
0.2732<0.05
## [1] FALSE
# no cumple homocedasticidad.
24.3.- Realice el análisis propuesto en los puntos anteriores, indicando los supuestos involucrados y verificando los que corresponda.
library(nlme)
# no util m1<-gls(Diametro~Dosis, data=datos)
m3_varExp<-gls(Diametro~Dosis, weights=varExp(form=~fitted(.)), data = datos)
m4_varPower<-gls(Diametro~Dosis, weights=varPower(form=~fitted(.)), data = datos)
AIC(m3_varExp, m4_varPower) # uso var.exp
## df AIC
## m3_varExp 4 97.14635
## m4_varPower 4 98.43255
Se usa m3_varExpo (menor AIC)
par(mfrow=c(1,2))
qqPlot(resid(m3_varExp, type="pearson"))
## [1] 9 14
plot(m3_varExp) # cumple ahora homocedasticidad
shapiro.test(resid(m3_varExp, type="pearson"))
##
## Shapiro-Wilk normality test
##
## data: resid(m3_varExp, type = "pearson")
## W = 0.94316, p-value = 0.2749
summary(m3_varExp)
## Generalized least squares fit by REML
## Model: Diametro ~ Dosis
## Data: datos
## AIC BIC logLik
## 97.14635 100.7078 -44.57318
##
## Variance function:
## Structure: Exponential of variance covariate
## Formula: ~fitted(.)
## Parameter estimates:
## expon
## 0.09410367
##
## Coefficients:
## Value Std.Error t-value p-value
## (Intercept) 29.171817 1.0694936 27.27629 0
## Dosis -0.487665 0.0225631 -21.61342 0
##
## Correlation:
## (Intr)
## Dosis -0.977
##
## Standardized residuals:
## Min Q1 Med Q3 Max
## -1.74024011 -0.71329413 0.02099593 0.87006252 1.40319709
##
## Residual standard error: 0.3489039
## Degrees of freedom: 20 total; 18 residual
24.4.- Concluya estadística y biológicamente.
Se rechaza H_o. Hay relación funcional …