Se quiere saber la proporción entre tres variedades de una misma planta la cual produce flores de tres tipos de colores y con tres clases de peciolo. Por lo cual se considera que todos los resultados son de variables de contingencia y que un caracter puede o no condicionar a los otros, buscando entender como la aparición de una variedad y una fenologia se relaciona con la aparición de otra

variedad= c("Rojas","Rojas","Amarillas","Amarillas","Otras","Otras")
fenologia= c("Largas","Cortas","Largas","Cortas","Largas","Cortas")
N.flores= c(860,320,610,280,159,34)
Variedad= as.factor(variedad)
Fenologia= as.factor(fenologia)
DF <- data.frame(Variedad,Fenologia,N.flores); DF
##    Variedad Fenologia N.flores
## 1     Rojas    Largas      860
## 2     Rojas    Cortas      320
## 3 Amarillas    Largas      610
## 4 Amarillas    Cortas      280
## 5     Otras    Largas      159
## 6     Otras    Cortas       34
tab<-array( data = c(560,320,610,280,159,34),
            dim = c(2,2,2),
            dimnames = list( "Rojas"= c("L","C"),
                             "Amarillas"=c("L","C"),
                             "Otras"=c("L","C")))
tab
## , , Otras = L
## 
##      Amarillas
## Rojas   L   C
##     L 560 610
##     C 320 280
## 
## , , Otras = C
## 
##      Amarillas
## Rojas   L   C
##     L 159 560
##     C  34 320
ftable(tab, row.vars = "Rojas")
##       Amarillas   L       C    
##       Otras       L   C   L   C
## Rojas                          
## L               560 159 610 560
## C               320  34 280 320
addmargins(tab)
## , , Otras = L
## 
##      Amarillas
## Rojas   L   C  Sum
##   L   560 610 1170
##   C   320 280  600
##   Sum 880 890 1770
## 
## , , Otras = C
## 
##      Amarillas
## Rojas   L   C  Sum
##   L   159 560  719
##   C    34 320  354
##   Sum 193 880 1073
## 
## , , Otras = Sum
## 
##      Amarillas
## Rojas    L    C  Sum
##   L    719 1170 1889
##   C    354  600  954
##   Sum 1073 1770 2843

Modelo log -lineal de independencia

Se utilizan los modelos loglineales para determinar si dos variables estan asociadas y de qué manera

\[log(\mu_{ij}) = log(n)+log(\pi_{i+})+log(\pi_{+j})= \\ =\lambda+{\lambda_i}^X+{\lambda_j}^Y \\ {\lambda_i}^X: efecto~fila \\ {\lambda_j}^Y: efecto~columna \\ Valores~esperados: 0 \]

Numero de plantas sembradas con un color de floración y con un caracter especifico

expe = glm(N.flores~ Variedad+Fenologia, family = poisson(link = "log"))
summary(expe)
## 
## Call:
## glm(formula = N.flores ~ Variedad + Fenologia, family = poisson(link = "log"))
## 
## Deviance Residuals: 
##       1        2        3        4        5        6  
##  0.3625  -0.5855  -1.2211   1.9037   1.6641  -2.9316  
## 
## Coefficients:
##                 Estimate Std. Error z value Pr(>|z|)    
## (Intercept)      5.51882    0.04753 116.115  < 2e-16 ***
## VariedadOtras   -1.52853    0.07940 -19.250  < 2e-16 ***
## VariedadRojas    0.28205    0.04440   6.353 2.11e-10 ***
## FenologiaLargas  0.94367    0.04681  20.160  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 1293.913  on 5  degrees of freedom
## Residual deviance:   16.953  on 2  degrees of freedom
## AIC: 69.156
## 
## Number of Fisher Scoring iterations: 4

Se tiene que el factor lambda sub 1 o lambda sub “i” correspondiente a los “odds” de obtener fenologias largas es de 2.56 para cada variedad

Se tiene una desviación residual de 16.953 para dos grados de libertada. Mostrando que no inicialmente no hay sobredispersión, sin embargo se realizara el calculo de la deviancia del modelo para corroborar las hipotesis

\[ H_o: los~resultados~satisfacen~el~modelo~log~lineal \\ H_a: los~resultados~no~satisfacen~el~modelo~log~lineal \] ## Prueba chi cuadrada

pchisq(deviance(expe), df= df.residual(expe), lower.tail = F)
## [1] 0.0002083484

Por los resultados de la prueba (pchisq<0) se rechaza la hipotesis nula, arrojando como resultado una sobredeviación

cbind(DF,fitted(expe))
##    Variedad Fenologia N.flores fitted(expe)
## 1     Rojas    Largas      860     849.4123
## 2     Rojas    Cortas      320     330.5877
## 3 Amarillas    Largas      610     640.6584
## 4 Amarillas    Cortas      280     249.3416
## 5     Otras    Largas      159     138.9293
## 6     Otras    Cortas       34      54.0707

Al comparar los resultados obtenidos se evidencia que el modelo se ajusta erroneamente a los datos de numeros de flores obtenidos

Se ajusta el modelo saturado

expe.a= glm(N.flores ~ (Variedad*Fenologia)^2, family=poisson); expe.a
## 
## Call:  glm(formula = N.flores ~ (Variedad * Fenologia)^2, family = poisson)
## 
## Coefficients:
##                   (Intercept)                  VariedadOtras  
##                        5.6348                        -2.1084  
##                 VariedadRojas                FenologiaLargas  
##                        0.1335                         0.7787  
## VariedadOtras:FenologiaLargas  VariedadRojas:FenologiaLargas  
##                        0.7639                         0.2099  
## 
## Degrees of Freedom: 5 Total (i.e. Null);  0 Residual
## Null Deviance:       1294 
## Residual Deviance: 3.553e-14     AIC: 56.2
pchisq(deviance(expe.a), df= df.residual(expe.a), lower.tail = F)
## [1] 0
cbind(DF, fitted(expe.a))
##    Variedad Fenologia N.flores fitted(expe.a)
## 1     Rojas    Largas      860            860
## 2     Rojas    Cortas      320            320
## 3 Amarillas    Largas      610            610
## 4 Amarillas    Cortas      280            280
## 5     Otras    Largas      159            159
## 6     Otras    Cortas       34             34

con el modelo ajustado nos dan valores estimados exactos que se tuvieron en la muestra sin embargo, junto a la prueba pchsq para el modelo ajustado obtenemos que aún no se logra ajustar los valores al modelo log lineal

expe.a$coefficients
##                   (Intercept)                 VariedadOtras 
##                     5.6347896                    -2.1084291 
##                 VariedadRojas               FenologiaLargas 
##                     0.1335314                     0.7786694 
## VariedadOtras:FenologiaLargas VariedadRojas:FenologiaLargas 
##                     0.7638743                     0.2099420

Los p valores no dan una razón concordante de que la aparición de una combinación fenotipo-variedad condicione la aparición y de otra. Y con los valores obtenidos en las pruebas no se puede decir que modelo ajuste perfectamente por lo cual se puede concluir que el experimento tiene un modelo independiente