Prueba de hipótesis para un experimento

Nuestro conocimiento solo puede ser finito, mientras que nuestra ignorancia debe ser necesariamente infinita. -Karl Popper

Karl Popper

Muestreo

setwd("~/PyE 11 AM")

Introducción

Siendo la distribición normal un tema de tanta importancia en la estadística, es necesario que sea abordado de la manera que se corresponde. Por ello, al realizar esta práctica se revisarán la formulación y la prueba de las hipótesis para luego revisar las evidencias y ser capaces de asumir la normalidad en las muestras. Adicionalmente se llevarán a cabo pruebas estadísticas para 1 y 2 pruebas, dos no normales y una alternativa que será sometida a la prueba de hipótesis utilizando el intervalo de confianza del 95% (IC 95%) de la media..

Formulación y pruebas de hipótesis para 1 y 2 muestras

Normalmente, para iniciar con la resolución de un problema se aplica el método científico. De acurdo con Risk (2003), éste es un proceso con el cual se investiga de forma sistemática las observaciones, se resuelven problemas y se prueban hipótesis. Como parte del método científico la propuesta de una hipótesis y luego su comprobación, son temas bien definidos, y a pesar de la incertidumbre asociada al problema es posible cuantificar el error de la conclusión planteada por la hipótesis.

Los pasos del método científico son:

  1. Plantear un problema a resolver.
  2. Colectar una serie de observaciones.
  3. Formular una o más hipótesis.
  4. Probar dichas hipótesis.
  5. Declarar las conclusiones.

La estadística nos puede ayudar en los pasos 2 (diseño y colecta de las observaciones) y 4 (prueba de hipótesis). Una hipótesis se puede definir de la siguiente manera: Una explicación tentativa que cuenta con un conjunto de hechos que pueden ser probados con una investigación posterior.

Ejemplo

Plántulas de limón

Se puede plantear un problema real que podría afectar a ciertas personas, como la importancia de las fertilizaciones de plántulas producidas en viveros forestales, que viene siendo el punto 1 del método científico. Las observaciones constan de dos muestras, un grupo de control sin fertilización (el cual será llamado Control) y otro de plántulas fertilizadas con un complejo N:P:K (cuyo nombre será Fertilizados). El tamaño de dichas muestras se basa en estudios similares ya publicados como por ejemplo Fraysse and Crémière (1998) y también es valido de acuerdo con la experiencia del investigador.

De ser necesario, ir al glosario en la parte inferior del documento.

Uno de los indicadores más comunes que miden el efecto de la fertilización de una plántula es el Índice de esbeltez (IE). Dicho índice relaciona la altura y el diámetro del tallo y se define con la siguiente ecuación (Olivo and Buduba 2006).

\[\begin{equation}\label{eq:IE} IE = \frac{\varnothing_{tallo}}{(h_{tallo}/10)+2} \end{equation}\]

El índice de Esbeltez (IE) alcanza valores máximos de 1.2 lo que indica que la plántulas tienen mayor probabilidad de éxito al llevarse a campo. Valores cercanos a 1 indica que la planta tendrá menos problemas en el establecimiento y valores por abajo de 0.5 son plántulas de mala calidad (Olivo and Buduba 2006).

Plántula Epígea Plántula Hipógea

#Se declara el gestor de bibliotecas y se indican aquellas que serán utilizadas.
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr", "citr")
#Código para poder descargar los archivos en caso de querer reproducirse el análisis.
xfun::embed_file('plantas.csv')
Download plantas.csv
xfun::embed_file('hipotesis.rmd')
Download hipotesis.rmd
  • Importar datos
#Se importa los datos u observaciones mencionadas.
plantas <- read_csv("plantas.csv")
## Parsed with column specification:
## cols(
##   planta = col_double(),
##   IE = col_double(),
##   Tratamiento = col_character()
## )
View(plantas)
  • Para crear una tabla que muestre los datos
knitr::kable(plantas)
planta IE Tratamiento
1 0.80 Ctrl
2 0.66 Ctrl
3 0.65 Ctrl
4 0.87 Ctrl
5 0.63 Ctrl
6 0.94 Ctrl
7 0.78 Ctrl
8 0.71 Ctrl
9 0.70 Ctrl
10 0.71 Ctrl
11 0.76 Ctrl
12 0.93 Ctrl
13 0.55 Ctrl
14 0.70 Ctrl
15 0.95 Ctrl
16 0.78 Ctrl
17 0.90 Ctrl
18 0.79 Ctrl
19 0.63 Ctrl
20 0.91 Ctrl
21 0.77 Ctrl
22 0.56 Fert
23 0.67 Fert
24 0.65 Fert
25 0.69 Fert
26 1.04 Fert
27 0.95 Fert
28 0.74 Fert
29 1.10 Fert
30 0.91 Fert
31 1.09 Fert
32 0.79 Fert
33 0.90 Fert
34 1.15 Fert
35 1.04 Fert
36 1.00 Fert
37 0.88 Fert
38 1.15 Fert
39 0.88 Fert
40 0.78 Fert
41 1.16 Fert
42 0.91 Fert
  • Gráfico de caja y bigote para comparar las muestras
boxplot( plantas$IE~ plantas$Tratamiento, col="grey" )

  • Test de normalidad de shapiro wilk
shapiro.test(plantas$IE)
## 
##  Shapiro-Wilk normality test
## 
## data:  plantas$IE
## W = 0.96225, p-value = 0.1777

Error tipo I y error tipo II

\[\begin{array}{l|l|l|c} \text{Conclusión} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

Redacción personal

Con los análisis realizados, como el gráfico de cajas y bigote, se puede demostrar que efectivamente, el IE en el grupo de Fertilizados se mantuvo con valores muy cercanos al 1, a diferencia del grupo de Control, en el cuál los sujetos de prueba alcanzaron valores más lejanos a ese número. Además, gracias al test de Shapiro Wilks, se puede saber que existe una hipótesis nula y que esta no es rechazada.

Con toda esta información no sería muy erróneo decir que el fertilizante NPK tiene efectos positivos al menos en las plántulas sobre las que se realizó el estudio. Sin embargo, sería conveniente utilizar otras variables en diferentes estudios para verificar su efectividad por sobre otros complejos, o incluso si este pudiése llegar a causar alguna clase de efecto secundario en las plantas, el suelo o incluso los consumidores.

Glosario

  • Plántula: Se denomina plántula a la planta en sus primeros estadíos de desarrollo, desde que germina hasta que se desarrollan las primeras hojas verdaderas.

  • Epígea: La germinación epigea es el proceso en el cual las hojas de semillas o los cotiledones son llevados a la superficie del suelo junto con el brote durante la germinación.

  • Hipógea: La germinación hipogeal es el proceso en el cual las hojas de las semillas o los cotiledones permanecen debajo de la superficie del suelo durante la germinación.

  • Complejo NPK: es un abono o fertilizante que está formado por los tres elementos o, mejor dicho, macroelementos primarios. Estos macroelementos son el nitrógeno (N), fósforo (P) y potasio (K).

  • Error tipo I y tipo II: El error de tipo I se comete cuando la hipótesis nula es verdadera y, como consecuencia del contraste, se rechaza. En cambio el error de tipo II se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se acepta.