Teoría

El paquete caret(Classification and regression training) es una herramienta poderosa para la implementación de modelos de Machine learning.

Instalar paquetes y llamar librerías

# install.packages("caret") #Algoritmos de aprendizaje automático
library(caret)
# install.packages("datasets") #Para usar la base de datos IRIS
library(datasets)
# install.packages("ggplot2") #Gráficos mejor diseño
library(ggplot2)
# install.packages("lattice") #Crear gráficos
library(lattice)
# install.packages("DataExplorer") #Análisis descriptivo
library(DataExplorer)
# install.packages("kernlab") #Métodos de aprendizaje automático
library(kernlab)
# install.packages("rpart")
library(rpart)

Importar la base de datos

df <-data.frame(iris)

Análisis descriptivo

# create_report(df)
plot_missing(df)

plot_histogram(df)

plot_correlation(df)

** NOTA: La variable que queremos predecir debe tener formato de FACTOR.**

Partir los datos 80-20

set.seed(123)
renglones_entrenamiento <-createDataPartition(df$Species,p=0.8,list=FALSE)
entrenamiento <-iris[renglones_entrenamiento,]
prueba <-iris[-renglones_entrenamiento,]

Distintos tipos de métodos para modelar

Los métodos másutilizados para modelar aprendizaje automático son:

  • SVM : Support Vector Machine o Máquina de Vectores de Soporte. Hay varios subtipos: Lineal (svmlinear), Radial (svmRadial), Polinómico (svmPoly), etc.
  • Árbol de desición : rpart
  • Redes Neuronales : nnet
  • Random Forest o Bosques aleatrorios: rf

La validación cruzada (CV,Cross validation) es una técnica para evaluar el rendimiento de un modelo, divideindo los datos en múltiples subconjuntos, permitiendo medir su capacidad de generalización y evitar sobreajuste (overfitting).

La matriz de confusión (Confusion Matrix) permite analizar que tan bien funciona un modelo y qué tipos de errores comete. Lo que hace es comparar las predicciones del modelo con los valores reales de la variable objetivo.

Si la precisión es muy alta en entrenamiento (95-100%), pero baja en prueba (60-70%), es una señal de sobreajuste (overfitting).

Modelo 1. SVM Lineal

modelo1 <-train(Species ~ ., data=entrenamiento,
                method="svmLinear", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid=data.frame(C=1) #Cambiar hiperparámetros
                )

resultado_entrenamiento <- predict(modelo1,entrenamiento)
resultado_prueba1 <- predict(modelo1,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre1 <-confusionMatrix(resultado_entrenamiento,entrenamiento$Species)
mcre1
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         39         0
##   virginica       0          1        40
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9917          
##                  95% CI : (0.9544, 0.9998)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.9875          
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9750           1.0000
## Specificity                 1.0000            1.0000           0.9875
## Pos Pred Value              1.0000            1.0000           0.9756
## Neg Pred Value              1.0000            0.9877           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3250           0.3333
## Detection Prevalence        0.3333            0.3250           0.3417
## Balanced Accuracy           1.0000            0.9875           0.9938
#Matriz de confusión del  resultado de la pureba
mcrp1 <-confusionMatrix(resultado_prueba1,prueba$Species)
mcrp1
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         1
##   virginica       0          0         9
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.8278, 0.9992)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 2.963e-13       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.9000
## Specificity                 1.0000            0.9500           1.0000
## Pos Pred Value              1.0000            0.9091           1.0000
## Neg Pred Value              1.0000            1.0000           0.9524
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3000
## Detection Prevalence        0.3333            0.3667           0.3000
## Balanced Accuracy           1.0000            0.9750           0.9500

Modelo 2. SVM Radial

modelo2 <-train(Species ~ ., data=entrenamiento,
                method="svmRadial", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid=data.frame(sigma=1,C=1) #Cambiar hiperparámetros
                )

resultado_entrenamiento2 <- predict(modelo2,entrenamiento)
resultado_prueba2 <- predict(modelo2,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre2 <-confusionMatrix(resultado_entrenamiento2,entrenamiento$Species)
mcre2
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         39         0
##   virginica       0          1        40
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9917          
##                  95% CI : (0.9544, 0.9998)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.9875          
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9750           1.0000
## Specificity                 1.0000            1.0000           0.9875
## Pos Pred Value              1.0000            1.0000           0.9756
## Neg Pred Value              1.0000            0.9877           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3250           0.3333
## Detection Prevalence        0.3333            0.3250           0.3417
## Balanced Accuracy           1.0000            0.9875           0.9938
#Matriz de confusión del  resultado de la pureba
mcrp2 <-confusionMatrix(resultado_prueba2,prueba$Species)
mcrp2
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         2
##   virginica       0          0         8
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9333          
##                  95% CI : (0.7793, 0.9918)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 8.747e-12       
##                                           
##                   Kappa : 0.9             
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.8000
## Specificity                 1.0000            0.9000           1.0000
## Pos Pred Value              1.0000            0.8333           1.0000
## Neg Pred Value              1.0000            1.0000           0.9091
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.2667
## Detection Prevalence        0.3333            0.4000           0.2667
## Balanced Accuracy           1.0000            0.9500           0.9000

Modelo 3. SVM Polinómico

modelo3 <-train(Species ~ ., data=entrenamiento,
                method="svmPoly", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid=data.frame(degree=1,scale=1,C=1) #Cambiar hiperparámetros
                )

resultado_entrenamiento3 <- predict(modelo3,entrenamiento)
resultado_prueba3 <- predict(modelo3,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre3 <-confusionMatrix(resultado_entrenamiento3,entrenamiento$Species)
mcre3
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         39         0
##   virginica       0          1        40
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9917          
##                  95% CI : (0.9544, 0.9998)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.9875          
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9750           1.0000
## Specificity                 1.0000            1.0000           0.9875
## Pos Pred Value              1.0000            1.0000           0.9756
## Neg Pred Value              1.0000            0.9877           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3250           0.3333
## Detection Prevalence        0.3333            0.3250           0.3417
## Balanced Accuracy           1.0000            0.9875           0.9938
#Matriz de confusión del  resultado de la pureba
mcrp3 <-confusionMatrix(resultado_prueba3,prueba$Species)
mcrp3
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         1
##   virginica       0          0         9
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.8278, 0.9992)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 2.963e-13       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.9000
## Specificity                 1.0000            0.9500           1.0000
## Pos Pred Value              1.0000            0.9091           1.0000
## Neg Pred Value              1.0000            1.0000           0.9524
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3000
## Detection Prevalence        0.3333            0.3667           0.3000
## Balanced Accuracy           1.0000            0.9750           0.9500

Modelo 4. Árbol de decisión

modelo4 <-train(Species ~ ., data=entrenamiento,
                method="rpart", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneLength=10 #Cambiar hiperparámetros
                )

resultado_entrenamiento4 <- predict(modelo4,entrenamiento)
resultado_prueba4 <- predict(modelo4,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre4 <-confusionMatrix(resultado_entrenamiento4,entrenamiento$Species)
mcre4
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         39         3
##   virginica       0          1        37
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.9169, 0.9908)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9750           0.9250
## Specificity                 1.0000            0.9625           0.9875
## Pos Pred Value              1.0000            0.9286           0.9737
## Neg Pred Value              1.0000            0.9872           0.9634
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3250           0.3083
## Detection Prevalence        0.3333            0.3500           0.3167
## Balanced Accuracy           1.0000            0.9688           0.9563
#Matriz de confusión del  resultado de la pureba
mcrp4 <-confusionMatrix(resultado_prueba4,prueba$Species)
mcrp4
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         2
##   virginica       0          0         8
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9333          
##                  95% CI : (0.7793, 0.9918)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 8.747e-12       
##                                           
##                   Kappa : 0.9             
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.8000
## Specificity                 1.0000            0.9000           1.0000
## Pos Pred Value              1.0000            0.8333           1.0000
## Neg Pred Value              1.0000            1.0000           0.9091
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.2667
## Detection Prevalence        0.3333            0.4000           0.2667
## Balanced Accuracy           1.0000            0.9500           0.9000

Modelo 5. Redes neuronales

modelo5 <-train(Species ~ ., data=entrenamiento,
                method="nnet", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10), #Cambiar hiperparámetros
                trace=FALSE
                )

resultado_entrenamiento5 <- predict(modelo5,entrenamiento)
resultado_prueba5 <- predict(modelo5,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre5 <-confusionMatrix(resultado_entrenamiento5,entrenamiento$Species)
mcre5
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         36         0
##   virginica       0          4        40
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.9169, 0.9908)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9000           1.0000
## Specificity                 1.0000            1.0000           0.9500
## Pos Pred Value              1.0000            1.0000           0.9091
## Neg Pred Value              1.0000            0.9524           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3000           0.3333
## Detection Prevalence        0.3333            0.3000           0.3667
## Balanced Accuracy           1.0000            0.9500           0.9750
#Matriz de confusión del  resultado de la pureba
mcrp5 <-confusionMatrix(resultado_prueba5,prueba$Species)
mcrp5
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0          9         0
##   virginica       0          1        10
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.8278, 0.9992)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 2.963e-13       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9000           1.0000
## Specificity                 1.0000            1.0000           0.9500
## Pos Pred Value              1.0000            1.0000           0.9091
## Neg Pred Value              1.0000            0.9524           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3000           0.3333
## Detection Prevalence        0.3333            0.3000           0.3667
## Balanced Accuracy           1.0000            0.9500           0.9750

Modelo 6. Bosques aleatorios

modelo6 <-train(Species ~ ., data=entrenamiento,
                method="rf", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid= expand.grid(mtry =c(2,4,6))#Cambiar hiperparámetros
                )

resultado_entrenamiento6 <- predict(modelo6,entrenamiento)
resultado_prueba6 <- predict(modelo6,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre6 <-confusionMatrix(resultado_entrenamiento6,entrenamiento$Species)
mcre6
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         40         0
##   virginica       0          0        40
## 
## Overall Statistics
##                                      
##                Accuracy : 1          
##                  95% CI : (0.9697, 1)
##     No Information Rate : 0.3333     
##     P-Value [Acc > NIR] : < 2.2e-16  
##                                      
##                   Kappa : 1          
##                                      
##  Mcnemar's Test P-Value : NA         
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           1.0000
## Specificity                 1.0000            1.0000           1.0000
## Pos Pred Value              1.0000            1.0000           1.0000
## Neg Pred Value              1.0000            1.0000           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3333
## Detection Prevalence        0.3333            0.3333           0.3333
## Balanced Accuracy           1.0000            1.0000           1.0000
#Matriz de confusión del  resultado de la pureba
mcrp6 <-confusionMatrix(resultado_prueba6,prueba$Species)
mcrp6
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         2
##   virginica       0          0         8
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9333          
##                  95% CI : (0.7793, 0.9918)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 8.747e-12       
##                                           
##                   Kappa : 0.9             
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.8000
## Specificity                 1.0000            0.9000           1.0000
## Pos Pred Value              1.0000            0.8333           1.0000
## Neg Pred Value              1.0000            1.0000           0.9091
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.2667
## Detection Prevalence        0.3333            0.4000           0.2667
## Balanced Accuracy           1.0000            0.9500           0.9000

Resumen de los resultados

resultados <- data.frame(
  "SVM Lineal" = c(mcre1$overall["Accuracy"],mcrp1$overall["Accuracy"]),
  "SVM Radial" = c(mcre2$overall["Accuracy"],mcrp2$overall["Accuracy"]),
  "SVM Polinómico" = c(mcre3$overall["Accuracy"],mcrp3$overall["Accuracy"]),
  "Árboles de decisión" = c(mcre4$overall["Accuracy"],mcrp4$overall["Accuracy"]),
  "Redes Neuronales" = c(mcre5$overall["Accuracy"],mcrp5$overall["Accuracy"]),
  "Bosques aleatorios" = c(mcre6$overall["Accuracy"],mcrp6$overall["Accuracy"])
)
rownames(resultados) <-c("Precisión de entrenamiento","Precisión de prueba")
resultados
##                            SVM.Lineal SVM.Radial SVM.Polinómico
## Precisión de entrenamiento  0.9916667  0.9916667      0.9916667
## Precisión de prueba         0.9666667  0.9333333      0.9666667
##                            Árboles.de.decisión Redes.Neuronales
## Precisión de entrenamiento           0.9666667        0.9666667
## Precisión de prueba                  0.9333333        0.9666667
##                            Bosques.aleatorios
## Precisión de entrenamiento          1.0000000
## Precisión de prueba                 0.9333333
---
title: "CARET"
author: "Alma Santiago-A00836636"
date: "2025-02-20"
output:
  html_document:
    toc: TRUE
    toc_float: TRUE
    code_download: TRUE
    theme: "united"
    highlight: "espresso"
---

![](C:\\Users\\almai\\Downloads\\193254449-63fd39d3-03d4-46bd-bd3e-961e7b1147dc.png)

## <span style="color: green;">Teoría</span>
El paquete caret(*Classification and regression training*)
es una herramienta poderosa para la implementación de modelos de **Machine learning**.

# <span style="color: green;">Instalar paquetes y llamar librerías</span>
```{r message=FALSE, warning=FALSE}
# install.packages("caret") #Algoritmos de aprendizaje automático
library(caret)
# install.packages("datasets") #Para usar la base de datos IRIS
library(datasets)
# install.packages("ggplot2") #Gráficos mejor diseño
library(ggplot2)
# install.packages("lattice") #Crear gráficos
library(lattice)
# install.packages("DataExplorer") #Análisis descriptivo
library(DataExplorer)
# install.packages("kernlab") #Métodos de aprendizaje automático
library(kernlab)
# install.packages("rpart")
library(rpart)
```
# <span style="color: green;">Importar la base de datos</span>
```{r}
df <-data.frame(iris)
```

# <span style="color: green;">Análisis descriptivo</span>
```{r}
# create_report(df)
plot_missing(df)
plot_histogram(df)
plot_correlation(df)
```
** NOTA: La variable que queremos predecir debe tener formato de FACTOR.**

# <span style="color: green;">Partir los datos 80-20</span>
```{r}
set.seed(123)
renglones_entrenamiento <-createDataPartition(df$Species,p=0.8,list=FALSE)
entrenamiento <-iris[renglones_entrenamiento,]
prueba <-iris[-renglones_entrenamiento,]
```

# <span style="color: green;">Distintos tipos de métodos para modelar</span>
Los métodos másutilizados para modelar aprendizaje automático son:

* **SVM** : *Support Vector Machine* o Máquina de Vectores de Soporte. Hay varios subtipos: Lineal (svmlinear), Radial (svmRadial), Polinómico (svmPoly), etc. 
* **Árbol de desición** : rpart
* **Redes Neuronales** : nnet
* **Random Forest**  o Bosques aleatrorios: rf

La validación cruzada (*CV,Cross validation*) es una técnica para evaluar el rendimiento de un modelo, divideindo los datos en múltiples subconjuntos, permitiendo medir su capacidad de generalización y evitar sobreajuste (*overfitting*).

La **matriz de confusión** (*Confusion Matrix*) permite analizar que tan bien funciona un modelo y qué tipos de errores comete. Lo que hace es comparar las predicciones del modelo con los valores reales de la variable objetivo. 

Si la precisión es muy alta en entrenamiento (95-100%), pero baja en prueba (60-70%), es una señal de **sobreajuste** (*overfitting*).

# <span style="color: green;">Modelo 1. SVM Lineal</span>
```{r}
modelo1 <-train(Species ~ ., data=entrenamiento,
                method="svmLinear", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid=data.frame(C=1) #Cambiar hiperparámetros
                )

resultado_entrenamiento <- predict(modelo1,entrenamiento)
resultado_prueba1 <- predict(modelo1,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre1 <-confusionMatrix(resultado_entrenamiento,entrenamiento$Species)
mcre1

#Matriz de confusión del  resultado de la pureba
mcrp1 <-confusionMatrix(resultado_prueba1,prueba$Species)
mcrp1
```

# <span style="color: green;">Modelo 2. SVM Radial</span>
```{r}
modelo2 <-train(Species ~ ., data=entrenamiento,
                method="svmRadial", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid=data.frame(sigma=1,C=1) #Cambiar hiperparámetros
                )

resultado_entrenamiento2 <- predict(modelo2,entrenamiento)
resultado_prueba2 <- predict(modelo2,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre2 <-confusionMatrix(resultado_entrenamiento2,entrenamiento$Species)
mcre2

#Matriz de confusión del  resultado de la pureba
mcrp2 <-confusionMatrix(resultado_prueba2,prueba$Species)
mcrp2
```
# <span style="color: green;">Modelo 3. SVM Polinómico</span>
```{r}
modelo3 <-train(Species ~ ., data=entrenamiento,
                method="svmPoly", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid=data.frame(degree=1,scale=1,C=1) #Cambiar hiperparámetros
                )

resultado_entrenamiento3 <- predict(modelo3,entrenamiento)
resultado_prueba3 <- predict(modelo3,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre3 <-confusionMatrix(resultado_entrenamiento3,entrenamiento$Species)
mcre3

#Matriz de confusión del  resultado de la pureba
mcrp3 <-confusionMatrix(resultado_prueba3,prueba$Species)
mcrp3
```
# <span style="color: green;">Modelo 4. Árbol de decisión</span>
```{r}
modelo4 <-train(Species ~ ., data=entrenamiento,
                method="rpart", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneLength=10 #Cambiar hiperparámetros
                )

resultado_entrenamiento4 <- predict(modelo4,entrenamiento)
resultado_prueba4 <- predict(modelo4,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre4 <-confusionMatrix(resultado_entrenamiento4,entrenamiento$Species)
mcre4

#Matriz de confusión del  resultado de la pureba
mcrp4 <-confusionMatrix(resultado_prueba4,prueba$Species)
mcrp4
```

# <span style="color: green;">Modelo 5. Redes neuronales</span>
```{r}
modelo5 <-train(Species ~ ., data=entrenamiento,
                method="nnet", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10), #Cambiar hiperparámetros
                trace=FALSE
                )

resultado_entrenamiento5 <- predict(modelo5,entrenamiento)
resultado_prueba5 <- predict(modelo5,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre5 <-confusionMatrix(resultado_entrenamiento5,entrenamiento$Species)
mcre5

#Matriz de confusión del  resultado de la pureba
mcrp5 <-confusionMatrix(resultado_prueba5,prueba$Species)
mcrp5
```

# <span style="color: green;">Modelo 6. Bosques aleatorios</span>
```{r warning=FALSE}
modelo6 <-train(Species ~ ., data=entrenamiento,
                method="rf", #Cambiar 
                preProcess=c("scale","center"),
                trControl=trainControl(method="cv",number=10),
                tuneGrid= expand.grid(mtry =c(2,4,6))#Cambiar hiperparámetros
                )

resultado_entrenamiento6 <- predict(modelo6,entrenamiento)
resultado_prueba6 <- predict(modelo6,prueba)


#Matriz de confusión del  resultado del entrenamiento
mcre6 <-confusionMatrix(resultado_entrenamiento6,entrenamiento$Species)
mcre6

#Matriz de confusión del  resultado de la pureba
mcrp6 <-confusionMatrix(resultado_prueba6,prueba$Species)
mcrp6
```
# <span style="color: green;">Resumen de los resultados</span>
```{r}
resultados <- data.frame(
  "SVM Lineal" = c(mcre1$overall["Accuracy"],mcrp1$overall["Accuracy"]),
  "SVM Radial" = c(mcre2$overall["Accuracy"],mcrp2$overall["Accuracy"]),
  "SVM Polinómico" = c(mcre3$overall["Accuracy"],mcrp3$overall["Accuracy"]),
  "Árboles de decisión" = c(mcre4$overall["Accuracy"],mcrp4$overall["Accuracy"]),
  "Redes Neuronales" = c(mcre5$overall["Accuracy"],mcrp5$overall["Accuracy"]),
  "Bosques aleatorios" = c(mcre6$overall["Accuracy"],mcrp6$overall["Accuracy"])
)
rownames(resultados) <-c("Precisión de entrenamiento","Precisión de prueba")
resultados
```

