Teoría

El paquete caret(Classification and REgression Training) es una herramienta poderosa para la implementacion de modelos de Machine Learning

Instalar paquetes y llamar librerias

Importar librerias de datos

df <- data.frame(iris)

Reporte de la base de datos

#create_report(df)
plot_missing(df)

plot_histogram(df)

plot_correlation(df)

plot_bar(df)

NOTA: La variable que queremos predecirdebe tener formato de FATOR, que este en caracter no quire decir que esta en factor

Partir los datos 80-20

set.seed(123) 
renglones_entrenamiento <- createDataPartition(df$Species, p=0.8, list=FALSE)
dt_entrenamiento <- iris[renglones_entrenamiento, ]
prueba <- iris[-renglones_entrenamiento, ]

Tipos de modelos de aprendizaje

Los metodosmas utilizados para modelar aprendizaje automatico son: * SVM: Support vector machine o Maquina de vectores de soporte. Hay varios subtipos: Lineal(svmlinear), Radial (svmRadial), Polinomico (svmPoly), etc.

  • Arbol de decisiones: rpart
  • Redes neuronales: nnet
  • Random forest o Bosques aleatorios: rf

Validacion cruzada (cross validation, CV) es una tecnica para evaluar el rendimiento de un modelo dividiendo los datos en multiples subconjuntos permitiendo medir su capacidad de generalizacion y evitar sobreajuste (Overfitting) *Matriz de confusion** permite analizar que tan buen funcuina un modelo uu qye tipos de errores comete. Lo que hace es comparar la predicciones del modelo con los valores reales de la variable objetvo

Modelo 1

modelo1 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "svmLinear", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGird = data.frame(C=1) #Cambiar hiperparametros
                 )
resultados_entrenamiento1 <- predict(modelo1, dt_entrenamiento)
resultado_prueba1 <- predict(modelo1, prueba)

mcre1 <- confusionMatrix(resultados_entrenamiento1, dt_entrenamiento$Species)
mcre1
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         39         0
##   virginica       0          1        40
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9917          
##                  95% CI : (0.9544, 0.9998)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.9875          
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9750           1.0000
## Specificity                 1.0000            1.0000           0.9875
## Pos Pred Value              1.0000            1.0000           0.9756
## Neg Pred Value              1.0000            0.9877           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3250           0.3333
## Detection Prevalence        0.3333            0.3250           0.3417
## Balanced Accuracy           1.0000            0.9875           0.9938
mcrp1 <- confusionMatrix(resultado_prueba1, prueba$Species)
mcrp1
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         1
##   virginica       0          0         9
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.8278, 0.9992)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 2.963e-13       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.9000
## Specificity                 1.0000            0.9500           1.0000
## Pos Pred Value              1.0000            0.9091           1.0000
## Neg Pred Value              1.0000            1.0000           0.9524
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3000
## Detection Prevalence        0.3333            0.3667           0.3000
## Balanced Accuracy           1.0000            0.9750           0.9500
#centrar los datos significa que el promedio de una variable se resta de los datos (quitar outliers)
#la cross validation es una tecnica para evalura el rendimiento de un modelo dividiendo los datos en multiples subconjuntos permitiendo mediro su capacidad de generalizacion y evtiar sobreajuste(overfitting)
modelo2 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "svmRadial", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGird = data.frame(sigma = 1, C=1) #Cambiar hiperparametros
                 )
resultados_entrenamiento2 <- predict(modelo2, dt_entrenamiento)
resultado_prueba2 <- predict(modelo2, prueba)

mcre2 <- confusionMatrix(resultados_entrenamiento2, dt_entrenamiento$Species)
mcre2
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         39         0
##   virginica       0          1        40
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9917          
##                  95% CI : (0.9544, 0.9998)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.9875          
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9750           1.0000
## Specificity                 1.0000            1.0000           0.9875
## Pos Pred Value              1.0000            1.0000           0.9756
## Neg Pred Value              1.0000            0.9877           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3250           0.3333
## Detection Prevalence        0.3333            0.3250           0.3417
## Balanced Accuracy           1.0000            0.9875           0.9938
mcrp2 <- confusionMatrix(resultado_prueba2, prueba$Species)
mcrp2
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         2
##   virginica       0          0         8
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9333          
##                  95% CI : (0.7793, 0.9918)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 8.747e-12       
##                                           
##                   Kappa : 0.9             
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.8000
## Specificity                 1.0000            0.9000           1.0000
## Pos Pred Value              1.0000            0.8333           1.0000
## Neg Pred Value              1.0000            1.0000           0.9091
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.2667
## Detection Prevalence        0.3333            0.4000           0.2667
## Balanced Accuracy           1.0000            0.9500           0.9000
modelo3 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "svmPoly", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGird = data.frame(degree=1 , scale=1, C=1) #Cambiar hiperparametros
                 )
resultados_entrenamiento3 <- predict(modelo3, dt_entrenamiento)
resultado_prueba3 <- predict(modelo3, prueba)

mcre3 <- confusionMatrix(resultados_entrenamiento3, dt_entrenamiento$Species)
mcre3
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         40         4
##   virginica       0          0        36
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.9169, 0.9908)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.9000
## Specificity                 1.0000            0.9500           1.0000
## Pos Pred Value              1.0000            0.9091           1.0000
## Neg Pred Value              1.0000            1.0000           0.9524
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3000
## Detection Prevalence        0.3333            0.3667           0.3000
## Balanced Accuracy           1.0000            0.9750           0.9500
mcrp3 <- confusionMatrix(resultado_prueba3, prueba$Species)
mcrp3
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         2
##   virginica       0          0         8
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9333          
##                  95% CI : (0.7793, 0.9918)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 8.747e-12       
##                                           
##                   Kappa : 0.9             
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.8000
## Specificity                 1.0000            0.9000           1.0000
## Pos Pred Value              1.0000            0.8333           1.0000
## Neg Pred Value              1.0000            1.0000           0.9091
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.2667
## Detection Prevalence        0.3333            0.4000           0.2667
## Balanced Accuracy           1.0000            0.9500           0.9000
modelo4 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "rpart", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneLength = 10 #Cambiar hiperparametros
                 )
resultados_entrenamiento4 <- predict(modelo4, dt_entrenamiento)
resultado_prueba4 <- predict(modelo1, prueba)

mcre4 <- confusionMatrix(resultados_entrenamiento4, dt_entrenamiento$Species)
mcre4
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         39         3
##   virginica       0          1        37
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.9169, 0.9908)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9750           0.9250
## Specificity                 1.0000            0.9625           0.9875
## Pos Pred Value              1.0000            0.9286           0.9737
## Neg Pred Value              1.0000            0.9872           0.9634
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3250           0.3083
## Detection Prevalence        0.3333            0.3500           0.3167
## Balanced Accuracy           1.0000            0.9688           0.9563
mcrp4 <- confusionMatrix(resultado_prueba4, prueba$Species)
mcrp4
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         1
##   virginica       0          0         9
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.8278, 0.9992)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 2.963e-13       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.9000
## Specificity                 1.0000            0.9500           1.0000
## Pos Pred Value              1.0000            0.9091           1.0000
## Neg Pred Value              1.0000            1.0000           0.9524
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3000
## Detection Prevalence        0.3333            0.3667           0.3000
## Balanced Accuracy           1.0000            0.9750           0.9500
modelo5 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "nnet", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 trace = FALSE #Cambiar hiperparametros
                 )
resultados_entrenamiento5 <- predict(modelo5, dt_entrenamiento)
resultado_prueba5 <- predict(modelo5, prueba)

mcre5 <- confusionMatrix(resultados_entrenamiento5, dt_entrenamiento$Species)
mcre5
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         36         0
##   virginica       0          4        40
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.9169, 0.9908)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9000           1.0000
## Specificity                 1.0000            1.0000           0.9500
## Pos Pred Value              1.0000            1.0000           0.9091
## Neg Pred Value              1.0000            0.9524           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3000           0.3333
## Detection Prevalence        0.3333            0.3000           0.3667
## Balanced Accuracy           1.0000            0.9500           0.9750
mcrp5 <- confusionMatrix(resultado_prueba5, prueba$Species)
mcrp5
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0          9         0
##   virginica       0          1        10
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9667          
##                  95% CI : (0.8278, 0.9992)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 2.963e-13       
##                                           
##                   Kappa : 0.95            
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            0.9000           1.0000
## Specificity                 1.0000            1.0000           0.9500
## Pos Pred Value              1.0000            1.0000           0.9091
## Neg Pred Value              1.0000            0.9524           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3000           0.3333
## Detection Prevalence        0.3333            0.3000           0.3667
## Balanced Accuracy           1.0000            0.9500           0.9750
modelo6 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "rf", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGrid = expand.grid(mtry = c(2,4,6)),#Cambiar hiperparametros
                 trace=FALSE 
                 )
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
## Warning in randomForest.default(x, y, mtry = param$mtry, ...): invalid mtry:
## reset to within valid range
resultados_entrenamiento6 <- predict(modelo6, dt_entrenamiento)
resultado_prueba6 <- predict(modelo6, prueba)

mcre6 <- confusionMatrix(resultados_entrenamiento6, dt_entrenamiento$Species)
mcre6
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         40          0         0
##   versicolor      0         40         0
##   virginica       0          0        40
## 
## Overall Statistics
##                                      
##                Accuracy : 1          
##                  95% CI : (0.9697, 1)
##     No Information Rate : 0.3333     
##     P-Value [Acc > NIR] : < 2.2e-16  
##                                      
##                   Kappa : 1          
##                                      
##  Mcnemar's Test P-Value : NA         
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           1.0000
## Specificity                 1.0000            1.0000           1.0000
## Pos Pred Value              1.0000            1.0000           1.0000
## Neg Pred Value              1.0000            1.0000           1.0000
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3333
## Detection Prevalence        0.3333            0.3333           0.3333
## Balanced Accuracy           1.0000            1.0000           1.0000
mcrp6 <- confusionMatrix(resultado_prueba6, prueba$Species)
mcrp6
## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         10          0         0
##   versicolor      0         10         2
##   virginica       0          0         8
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9333          
##                  95% CI : (0.7793, 0.9918)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : 8.747e-12       
##                                           
##                   Kappa : 0.9             
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.8000
## Specificity                 1.0000            0.9000           1.0000
## Pos Pred Value              1.0000            0.8333           1.0000
## Neg Pred Value              1.0000            1.0000           0.9091
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.2667
## Detection Prevalence        0.3333            0.4000           0.2667
## Balanced Accuracy           1.0000            0.9500           0.9000
resultados <- data.frame( 
  "SVM Lineal" = c(mcre1$overall["Accuracy"], mcrp1$overall["Accuracy"]),
  "svm Radial" = c(mcre2$overall["Accuracy"], mcrp2$overall["Accuracy"]),
  "svm Polinomico" = c(mcre3$overall["Accuracy"], mcrp3$overall["Accuracy"]),
  "Arbol de decisiones" = c(mcre4$overall["Accuracy"], mcrp4$overall["Accuracy"]),
  "Red neuronal" = c(mcre5$overall["Accuracy"], mcrp5$overall["Accuracy"]),
  "Random Forest" = c(mcre6$overall["Accuracy"], mcrp6$overall["Accuracy"])
)
rownames(resultados) <- c("Precision de entrenamiento", "Precision de prueba")
resultados
##                            SVM.Lineal svm.Radial svm.Polinomico
## Precision de entrenamiento  0.9916667  0.9916667      0.9666667
## Precision de prueba         0.9666667  0.9333333      0.9333333
##                            Arbol.de.decisiones Red.neuronal Random.Forest
## Precision de entrenamiento           0.9666667    0.9666667     1.0000000
## Precision de prueba                  0.9666667    0.9666667     0.9333333
---
title: "actividad 3"
output: 
  html_document:
    toc: TRUE
    toc_float: TRUE
    code_download: TRUE
    theme: "united"
    highlight: "espresso"
date: "2025-02-20"
---

![](/Users/emiliano/Downloads/lirio.jpeg)

# <span style="color: purple;">Teoría</span>
El paquete caret(*Classification and REgression Training*) es una herramienta poderosa para la implementacion de modelos de **Machine Learning**

## <span style="color: purple;">Instalar paquetes y llamar librerias</span>
```{r setup, include=FALSE}
#install.packages("caret") #Algotimyos de aprendizaje automatico
library(caret)
#install.packages("datasets") #para la base de datos de Iris
library(datasets)
library(ggplot2)
#install.packages("lattice") #crear graficos
library(lattice)
#install.packages("DataExplorer") #Analisis descriptivo
library(DataExplorer)
```

## <span style="color: purple;">Importar librerias de datos</span>
```{r}
df <- data.frame(iris)
```

## <span style="color: purple;">Reporte de la base de datos</span>
```{r}
#create_report(df)
plot_missing(df)
plot_histogram(df)
plot_correlation(df)
plot_bar(df)
```
**NOTA: La variable que queremos predecirdebe tener formato de FATOR, que este en caracter no quire decir que esta en factor**

## <span style="color: purple;">Partir los datos 80-20</span>
```{r}
set.seed(123) 
renglones_entrenamiento <- createDataPartition(df$Species, p=0.8, list=FALSE)
dt_entrenamiento <- iris[renglones_entrenamiento, ]
prueba <- iris[-renglones_entrenamiento, ]
```

# <span style="color: purple;">Tipos de modelos de aprendizaje</span>
Los metodosmas utilizados para modelar aprendizaje automatico son:
* **SVM**: *Support vector machine* o Maquina de vectores de soporte. Hay varios subtipos: Lineal(svmlinear), Radial (svmRadial), Polinomico (svmPoly), etc.

* **Arbol de decisiones**: rpart
* **Redes neuronales**: nnet
* **Random forest** o Bosques aleatorios: rf

**Validacion cruzada** (**cross validation**, CV) es una tecnica para evaluar el rendimiento de un modelo dividiendo los datos en multiples subconjuntos permitiendo medir su capacidad de generalizacion y evitar sobreajuste (**Overfitting**)
*Matriz de confusion** permite analizar que tan buen funcuina un modelo uu qye tipos de errores comete. Lo que hace es comparar la predicciones del modelo con los valores reales de la variable objetvo


## <span style="color: purple;">Modelo 1</span>
```{r}
modelo1 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "svmLinear", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGird = data.frame(C=1) #Cambiar hiperparametros
                 )
resultados_entrenamiento1 <- predict(modelo1, dt_entrenamiento)
resultado_prueba1 <- predict(modelo1, prueba)

mcre1 <- confusionMatrix(resultados_entrenamiento1, dt_entrenamiento$Species)
mcre1

mcrp1 <- confusionMatrix(resultado_prueba1, prueba$Species)
mcrp1

#centrar los datos significa que el promedio de una variable se resta de los datos (quitar outliers)
#la cross validation es una tecnica para evalura el rendimiento de un modelo dividiendo los datos en multiples subconjuntos permitiendo mediro su capacidad de generalizacion y evtiar sobreajuste(overfitting)

```
```{r}
modelo2 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "svmRadial", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGird = data.frame(sigma = 1, C=1) #Cambiar hiperparametros
                 )
resultados_entrenamiento2 <- predict(modelo2, dt_entrenamiento)
resultado_prueba2 <- predict(modelo2, prueba)

mcre2 <- confusionMatrix(resultados_entrenamiento2, dt_entrenamiento$Species)
mcre2

mcrp2 <- confusionMatrix(resultado_prueba2, prueba$Species)
mcrp2
```

```{r}
modelo3 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "svmPoly", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGird = data.frame(degree=1 , scale=1, C=1) #Cambiar hiperparametros
                 )
resultados_entrenamiento3 <- predict(modelo3, dt_entrenamiento)
resultado_prueba3 <- predict(modelo3, prueba)

mcre3 <- confusionMatrix(resultados_entrenamiento3, dt_entrenamiento$Species)
mcre3

mcrp3 <- confusionMatrix(resultado_prueba3, prueba$Species)
mcrp3
```
```{r}
modelo4 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "rpart", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneLength = 10 #Cambiar hiperparametros
                 )
resultados_entrenamiento4 <- predict(modelo4, dt_entrenamiento)
resultado_prueba4 <- predict(modelo1, prueba)

mcre4 <- confusionMatrix(resultados_entrenamiento4, dt_entrenamiento$Species)
mcre4

mcrp4 <- confusionMatrix(resultado_prueba4, prueba$Species)
mcrp4
```

```{r}
modelo5 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "nnet", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 trace = FALSE #Cambiar hiperparametros
                 )
resultados_entrenamiento5 <- predict(modelo5, dt_entrenamiento)
resultado_prueba5 <- predict(modelo5, prueba)

mcre5 <- confusionMatrix(resultados_entrenamiento5, dt_entrenamiento$Species)
mcre5

mcrp5 <- confusionMatrix(resultado_prueba5, prueba$Species)
mcrp5
```


```{r}
modelo6 <- train(Species~ ., data = dt_entrenamiento, 
                 method = "rf", #cambiar 
                 preProcess=c("scale", "center"), 
                 trControl = trainControl(method = "cv", number = 10), 
                 tuneGrid = expand.grid(mtry = c(2,4,6)),#Cambiar hiperparametros
                 trace=FALSE 
                 )

resultados_entrenamiento6 <- predict(modelo6, dt_entrenamiento)
resultado_prueba6 <- predict(modelo6, prueba)

mcre6 <- confusionMatrix(resultados_entrenamiento6, dt_entrenamiento$Species)
mcre6

mcrp6 <- confusionMatrix(resultado_prueba6, prueba$Species)
mcrp6
```
```{r}
resultados <- data.frame( 
  "SVM Lineal" = c(mcre1$overall["Accuracy"], mcrp1$overall["Accuracy"]),
  "svm Radial" = c(mcre2$overall["Accuracy"], mcrp2$overall["Accuracy"]),
  "svm Polinomico" = c(mcre3$overall["Accuracy"], mcrp3$overall["Accuracy"]),
  "Arbol de decisiones" = c(mcre4$overall["Accuracy"], mcrp4$overall["Accuracy"]),
  "Red neuronal" = c(mcre5$overall["Accuracy"], mcrp5$overall["Accuracy"]),
  "Random Forest" = c(mcre6$overall["Accuracy"], mcrp6$overall["Accuracy"])
)
rownames(resultados) <- c("Precision de entrenamiento", "Precision de prueba")
resultados
```

