aqui ca el EDA <- la asigancion 5
##Formulacion de hipotesis para pruebas de 1 y 2 muestras Normalmente, para iniciar con la resolución de un problema se aplica el método científico. De acurdo con Risk (2003), éste es un proceso con el cual se investiga de forma sistemática las observaciones, se resuelven problemas y se prueban hipótesis. Como parte del método científico la propuesta de una hipótesis y luego su comprobación, son temas bien definidos, y a pesar de la incertidumbre asociada al problema es posible cuantificar el error de la conclusión planteada por la hipótesis. Los pasos del método científico son:
1 Plantear un problema a resolver. 2 colectar una serie de observaciones. 3 Formular una o más hipótesis. 4 Probar dichas hipótesis. 5 Declarar las conclusiones.
La estadística nos puede ayudar en los pasos 2 (diseño y colecta de las observaciones) y 4 (prueba de hipótesis). Una hipótesis se puede definir de la siguiente manera: Una explicación tentativa que cuenta con un conjunto de hechos que pueden ser probados con una investigación posterior. ##Caso de estudio para prueba de hipotesis: efectividad de fertilizante en plantas Un problema a resolver podría ser la importancia del efecto de las fertilizaciones de plántulas producidas en viveros forestales; ya contamos con el paso 1 del método científico. Luego efectuamos observaciones en dos grupos de plántulas, uno control (Sin fertilización, llamados de aquí en adelante Control) y otro de plántulas fertilizadas con un complejo complejo N:P:K (denominados de aquí en adelante como Fertilizados). El tamaño de dichas muestras se basa en estudios similares ya publicados como por ejemplo Fraysse and Crémière (1998) y también es valido de acuerdo con la experiencia del investigador.
Uno de los indicadores más comunes que miden el efecto de la fertilización de una plántula es el Índice de esbeltez (IE). Dicho índice relaciona la altura y el diámetro del tallo y se define con la siguiente ecuación (Olivo and Buduba 2006).
\[ \begin{equation}\label{eq:IE} IE = \frac{\varnothing_{tallo}}{(h_{tallo}/10)+2} \end{equation} \] El índice de Esbeltez (IE) alcanza valores máximos de 1.2 lo que indica que la plántulas tienen mayor probabilidad de éxito al llevarse a campo. Valores cercanos a 1 indica que la planta tendrá menos problemas en el establecimiento y valores por abajo de 0.5 son plántulas de mala calidad (Olivo and Buduba 2006). · importar datos
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","fdth")plantas=read_csv("plantas.csv")## Rows: 42 Columns: 3
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (1): Tratamiento
## dbl (2): planta, IE
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (1): Tratamiento
## dbl (2): planta, IE
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
datatable=plantas##Tabla de los datos seleccionados “Ctrl” y “Fert” de la base de datos “plantas”
Ctrl= subset(plantas, Tratamiento=="Ctrl")
Fert= subset(plantas, Tratamiento=="Fert")
datatable(Ctrl)datatable(Fert)tablaCtrl=fdt(Ctrl)
tablaFert=fdt(Fert)
tablaCtrl## planta
## Class limits f rf rf(%) cf cf(%)
## [0.99,4.36) 4 0.19 19.05 4 19.05
## [4.36,7.73) 3 0.14 14.29 7 33.33
## [7.73,11.1) 4 0.19 19.05 11 52.38
## [11.1,14.47) 3 0.14 14.29 14 66.67
## [14.47,17.84) 3 0.14 14.29 17 80.95
## [17.84,21.21) 4 0.19 19.05 21 100.00
##
## IE
## Class limits f rf rf(%) cf cf(%)
## [0.5445,0.6137) 1 0.05 4.76 1 4.76
## [0.6137,0.6828) 4 0.19 19.05 5 23.81
## [0.6828,0.752) 4 0.19 19.05 9 42.86
## [0.752,0.8212) 6 0.29 28.57 15 71.43
## [0.8212,0.8903) 1 0.05 4.76 16 76.19
## [0.8903,0.9595) 5 0.24 23.81 21 100.00
tablaFert## planta
## Class limits f rf rf(%) cf cf(%)
## [21.78,25.22) 4 0.19 19.05 4 19.05
## [25.22,28.66) 3 0.14 14.29 7 33.33
## [28.66,32.1) 4 0.19 19.05 11 52.38
## [32.1,35.54) 3 0.14 14.29 14 66.67
## [35.54,38.98) 3 0.14 14.29 17 80.95
## [38.98,42.42) 4 0.19 19.05 21 100.00
##
## IE
## Class limits f rf rf(%) cf cf(%)
## [0.5544,0.6573) 2 0.10 9.52 2 9.52
## [0.6573,0.7601) 3 0.14 14.29 5 23.81
## [0.7601,0.863) 2 0.10 9.52 7 33.33
## [0.863,0.9659) 6 0.29 28.57 13 61.90
## [0.9659,1.069) 3 0.14 14.29 16 76.19
## [1.069,1.172) 5 0.24 23.81 21 100.00
##Histogramas y poligonos de distribuciones de frecuencia
plot(tablaCtrl,type = "fh") #Histograma de frecuencia absoluta plot(tablaFert,type = "fh") #Histograma de frecuencia absolutaplot(tablaFert,type = "fp") #Poligono de frecuencia absolutaplot(tablaCtrl,type = "fp") #Poligono de frecuencia absolutaplot(tablaCtrl,type = "rfh") #Histograma de frecuencia relativaplot(tablaFert,type = "rfh") #Histograma de frecuencia relativa plot(tablaCtrl,type = "rfp") #Poligono de frecuencia relativaplot(tablaFert,type = "rfp") #Poligono de frecuencia relativaplot(tablaCtrl,type = "cfh") #Histograma de frecuencia acumuladaplot(tablaFert,type = "cfh") #Histograma de frecuencia acumuladaplot(tablaCtrl,type = "cfp") #Poligono de frecuencia acumuladaplot(tablaFert,type = "cfp") #Poligono de frecuencia acumulada ##conclusion
el fertilizante como ya se pudo observar en graficos anteriores, hay una gran diferencia si se lleva a una comparativa del crecimiento de las plantas con y sin fertilizante, estos datos nos dicen que usar fertilizantes en las platas en bueno.
apartir de aqui seria la asigancion 6 AIUC1_6
hist(Ctrl$IE)#Histograma de frecuencia segun sturges
hist(Fert$IE) #analisis cuantilico
summary(Ctrl$IE)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.5500 0.7000 0.7700 0.7676 0.8700 0.9500
pruebas de normalidad
Los análisis de normalidad, también llamados contrastes de normalidad, tienen como objetivo analizar cuánto difiere la distribución de los datos observados respecto a lo esperado si procediesen de una distribución normal con la misma media y desviación típica.
prueba de chapiro-wilk
El test de Shapiro-Wilks plantea la hipótesis nula que una muestra proviene de una distribución normal. Eligimos un nivel de significanza, y tenemos una hipótesis alternativa que sostiene que la distribución no es normal. Estas es aplicable cuando se analizan muestras compuestas por menos de 50 elementos o muestras pequeñas como tambien se le suelen llamar.
shapiro.test(Ctrl$IE)##
## Shapiro-Wilk normality test
##
## data: Ctrl$IE
## W = 0.9532, p-value = 0.3908
shapiro.test(Fert$IE)##
## Shapiro-Wilk normality test
##
## data: Fert$IE
## W = 0.95339, p-value = 0.3941
prueba de normalidad de smirnov-kolmogorav
La prueba de Kolmogorov-Smirnov para una muestra, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada, es decir, contrasta si las observaciones podrían razonablemente proceder de la distribución especificada. \[D=max|Fn(x)−F0(x)|\]
ks.test(Ctrl$IE, "pnorm", mean = mean(Ctrl$IE), sd = sd(Ctrl$IE))## Warning in ks.test(Ctrl$IE, "pnorm", mean = mean(Ctrl$IE), sd = sd(Ctrl$IE)):
## ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: Ctrl$IE
## D = 0.11991, p-value = 0.9233
## alternative hypothesis: two-sided
ks.test(Ctrl$IE, "pnorm", mean = mean(Ctrl$IE), sd = sd(Ctrl$IE))## Warning in ks.test(Ctrl$IE, "pnorm", mean = mean(Ctrl$IE), sd = sd(Ctrl$IE)):
## ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: Ctrl$IE
## D = 0.11991, p-value = 0.9233
## alternative hypothesis: two-sided