Proveer las herramientas informáticas necesarias
para el análisis de datos estadísticos enfocados a
diseño experimental, que permitan al participante
plantear adecuadamente las hipótesis de trabajo,
realizar el análisis estadístico y establecer las
conclusiones adecuadas de un diseño particular aplicado
a la ingeniería.
Obtención e
instalación del software de apoyo
Para el caso de este curso se utlizará e software estadístico
R-Project en su versión 4.2.2 y su interfaz gráfica R-Studio en su
versión 2022.12.0, mismos que se obtienen descagando los archivos
ejecutables de las siguientes ligas:
Para el caso de R-Project:
Para el caso de R-Studio:
Procedimiento de instalación:
- Instalar la versión correspondiente al sistema operativo de
R-Project
- Instalar la versión correspondeinte al sistema operativo de
RStudio
- Ejecutar solamente el software RStudio.
Creación de un nuevo
proyecto
- Al ejecutar RStudio, se despliega la siguiente interfaz
gráfica:

- Para crear un nuevo proyecto, nos deubicaremos en el panel superior
de la interfaz gráfica y daremos un click en el ícono que se muestra a
continuación:

AL dar click se despliega el siguiente cuadro, en donde podremos
utilizar una de las dos opciones marcadas:

En el caso de utilizar la primera opción, se despliega el siguiente
cuadro de diálogo en el cual seleccionaremos la opción marcada:

Finalemente, daremos un nombre a la carpeta de creación del proyecto
y seleccionaremos su ubicación:

En el caso de utilizar la segunda opción, seleccionaremos
directamente el directorio de trabajo previamente creado para alojar el
proyecto y le indicamos crear:

Instalación de paquetes
adicioanales
Dentro de las capacidades del lenguaje R, están predefinidas una gran
cantidad de herramientas y pruebas estadśiticas, sin embargo, para
mejorar la funcionalidad y presentación de los resultados de los
análisis realizados, podemos hechar mano de paquetes adicionales de
fácil instalación, para el caso de nuestro curso, se recomienda instalar
los siguientes paquetes:
- agricolae. Una batería de pruebas estadśiticas para
diseños experimentales, tales como la Prueba de Tukey, de Duncan,
etc.
- lmtest. Una batería de pruebas enfocadas a modelos
lineales.
- car. Un compendio de complementos para análisis de
modelos de regresión.
- ggplot2. Un sistema para crear gráficos
‘declarativamente’, basado en “La gramática de los gráficos”.
- ggpubr. El paquete ‘ggplot2’ es excelente y
flexible para una visualización de datos elegante en R. Sin embargo, los
gráficos generados por defecto requieren cierto formato antes de que
podamos enviarlos para su publicación. Además, para personalizar un
‘ggplot’, la sintaxis es opaca y esto eleva el nivel de dificultad para
los investigadores sin conocimientos avanzados de programación R.
‘ggpubr’ proporciona algunas funciones fáciles de usar para crear y
personalizar gráficos listos para publicación basados en ‘ggplot2’.
- tidyr.Herramientas para ayudar a crear datos
ordenados, donde cada columna es una variable, cada fila es una
observación y cada celda contiene un solo valor. ‘tidyr’ contiene
herramientas para cambiar la forma (girar) y la jerarquía (anidar y
‘desanidar’) de un conjunto de datos, convertir listas profundamente
anidadas en marcos de datos rectangulares (‘rectángulo’) y extraer
valores de columnas de cadenas. También incluye herramientas para
trabajar con valores perdidos (tanto implícitos como explícitos).
- dplyr. Una herramienta rápida y consistente para
trabajar con marcos de datos como objetos, tanto en la memoria como
fuera de la memoria.
- patchwork. El paquete ‘ggplot2’ proporciona una API
sólida para construir secuencialmente un gráfico, pero no se ocupa de la
composición de varios gráficos. ‘patchwork’ es un paquete que expande la
API para permitir una composición de gráficos arbitrariamente compleja,
entre otras cosas, proporcionando operadores matemáticos para combinar
múltiples gráficos. Otros paquetes que tratan de abordar esta necesidad
(pero con un enfoque diferente) son ‘gridExtra’ y ‘cowplot’.
- Doe.base. Crea diseños experimentales factoriales
completos y diseños basados en matrices ortogonales para experimentos
(industriales). Proporciona diversos criterios de calidad. Proporciona
funciones de utilidad para el diseño de clases, que también utilizan
otros paquetes para experimentos diseñados.
- FrF2. Se pueden crear diseños de 2 niveles
factoriales fraccionados regulares y no regulares. Además, se ofrecen
herramientas de análisis para diseños factoriales fraccionados con
factores de 2 niveles (efectos principales y gráficas de interacción
para todos los factores simultáneamente, gráfica cúbica para ver los
efectos simultáneos de tres factores, gráfica completa o seminormal,
estructura de alias en un formato más legible). formato que con el alias
de la función integrada).
Para realizar la insalación de los paquetes, utilizaremos la
siguiente linea de comandos:
paquetes=c("agricolae","lmtest","car","ggplot2","ggpubr","tidyr","dplyr","patchwork","DoE.base","FrF2")
install.packages(paquetes,dependencies = TRUE)
Agenda del curso
Los temas a abordar en este curson son:
- Regresión Lineal Simple y Múltiple
- Diseño Completamente al Azar
- Diseño en Bloques al Azar
- Diseño en Cuadro Latino
- Diseño en Cuadro Grecolatino
- Diseños Factoriales
- Generación de Reportes: RMarkdown
Regresión Lineal Simple y
Múltiple
El análisis de regresión tiene como objetivo modelar de forma
matemática el comportamiento de una variable de respuesta en función de
una o más variables independientes (factores). Por ejemplo, suponga que
el rendimiento de un proceso químico está relacionado con la temperatura
de operación. Si mediante el modelo matemático es posible describir tal
relación, entonces este modelo puede usarse para propósitos de
predicción, optimización o control. Para estimar los parámetros de un
modelo de regresión son necesarios los datos, los cuales puden obtenerse
de experimentos planeados, de observaciones de fenómenos no controlados
o de registros históricos(Pulido & Vara Salazar, 2012).
Para profundizar en el tema de Regresión Lineal Simple iremos a la
siguiente liga:
https://rpubs.com/Gabo6381/801498
Los datos que utilizaremos en este curso se encuentran en la
siguiente liga:
https://drive.google.com/drive/folders/1sqvMqvgc40rtHvR4wylWsSMZhcQIyRHf?usp=sharing