¿Que es Inteligencia Artifical (IA)?

El concepto de IA ha venido sonando con mayor fuerza en las últimas décadas. Pero, ¿a qué hace referencia?.

Según E. Rich, la IA se puede definir como :

“El estudio de cómo hacer que los ordenadores hagan cosas en las que, de momento, las personas son mejores”.

Se puede inferir de la anterior definición que, llegará el momento en que los ordenadores tendrán suficiente capacidad para realizar mejor que las personas, algunas actividades que resultan cotidianas.

Ahora bien, la pregunta importante en este momento es: ¿Pueden los ordenadores aprender?.

Para esto, una rama de la IA nos da la respuesta: Aprendizaje de Máquinas ó Machine Learning.

¿Que es Machine Learning (ML)?

El aprendizaje automático o aprendizaje de máquinas (del inglés, machine learning) es el subcampo de las ciencias de la computación y una rama de la inteligencia artificial, cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan.

Lo anterior, abre la posibilidad a que los ordenadores puedan aprender. El proceso de aprendizaje se basa en algunas técnicas, esta se pueden clasificar de la siguiente manera:

  • Aprendizaje Supervisado: Estas técnicas utilizan un conjunto de datos de entrenamiento etiquetados (preclasificados), los cuales procesan para realizar predicciones sobre los mismos, corrigiéndolas cuando son incorrectas. El proceso de entrenamiento continúa hasta que el modelo alcanza un nivel deseado de precisión.

    • Técnicas de regresión

    • Técnicas de clasificación

  • Aprendizaje No supervisado: El conjunto de datos no se encuentra etiquetado y no se tiene un resultado conocido. Por ello deben deducir las estructuras presentes en los datos de entrada, lo puede conseguir a través de un proceso matemático para reducir la redundancia sistemáticamente organizando los datos por similitud.

    • Técnicas de agrupamiento.

    Tecnicas Aprendizaje

Ruta para implementar técnicas de aprendizaje supervisado

Ciclo de aprendizaje

1. El proceso de aprendizaje comienza con el análisis de una base de datos, este definirá que técnica de aprendizaje se debe utilizar. En este caso, si se debe utilizar una técnica de regresión o de clasificación.

2. Elegir el modelo adecuado para entrenar, en otras palabras, “Colocar a aprender al ordenador”.

3. Realizar la validación del modelo entrenado, analizando las métricas de desempeño.

En la primera parte de este curso,aprenderemos los fundamentos teóricos de una técnica de aprendizaje supervisada. La regresion Lineal.

Regresión Lineal Univariada.

El análisis de regresión es una metodología estadística que utiliza la relación entre dos o más variables cuantitativas para que una variable de respuesta o de salida pueda predecirse a partir de la otra u otras. Algunas áreas donde se utiliza esta técnica puede ser finanzas, Ciencias Sociales, Ciencias Biológicas, entre otras. Algunos ejemplos de aplicación pueden ser:

  1. Las ventas de un producto pueden ser predichas utilizando la relación entre las ventas y la cantidad invertida en gastos de publicidad.

  2. La estancia de un paciente en un hospital después de una cirugía puede predecirse utilizando la relación entre el tiempo que dura en el hospital y la severidad de la intervención quirúrgica.

  • Clases de relaciones entre dos variables

    • Relaciones Funcionales: Una relación funcional entre 2 variables se representa por medio de una formula matemática que las relacione. Esto es, si \(Y\) es la variable dependiente y \(X\) es la variable independiente, una relación funcional se puede expresar como:

      \[Y=F(X)\] Esto es, para cada valor de \(X\), se tiene un valor exacto de \(Y\). Por ejemplo, considere el salario de un trabajador es calculado en función de las horas trabajadas por día, asuma que el valor de la hora es de $10 dolares,podría establecer la siguiente relación para esta situación:

    Salario por dia
    Horas Salario_Dia
    4 40
    6 60
    8 80

¿Podemos establecer una relación matemática para la situación anterior?¿Cual seria?.

  • Relación Estadística: Al contrario de la relación funcional, los puntos no están ubicados exactamente sobre la linea recta, esto quiere decir que, de antemano, no se puede afirmar con total certeza que existe una relación directa entre las variables en estudio. Para ejemplificar esto, asuma la siguiente situación: Supunga que tiene los datos de un vehiculo que supuestamente se mueve a velocidad constante.Los datos de las medidas del tiempo en cuatro posiciones separadas 900 m son las siguientes:

    Desplazamiento del vehiculo
    Tiempo Posicion
    17.6 0
    40.4 900
    67.7 1800
    90.1 2700

Ahora, ¿Cual sería una relación matemática para esta situación?.

Ejercicio 1.

Los miembros de un spa pagan anualmente una membresia de $300 mas un cargo de $2 dolares por cada visita al mismo. Suponga que \(Y\) es el costo anual para un miembro y \(X\) el numero de visitas por miembro durante el año. Exprese matemáticamente esta relación. ¿ Es una relación funcional y estadística?.

Definición formal de un modelo de regresión univariada

Considerando que existe solo una variable independiente relacionada linealmente con una variable de respuesta, se puede plantear el siguiente modelo estadístico para representar esta relación:

\[Y_{i}= \beta_{0} + \beta_{i}X_{i}+ \epsilon_{i}\] Donde,

\(Y_{i}\): es el valor de la variable de respuesta para la observación i.

\(\beta_{0}\) y \(\beta_{i}\): son parámetros.

\(X_{i}\): es el valor de la variable predictora para la observación i.

\(\epsilon_{i}\): Error aleatorio, con media \(E\{\epsilon_{i}\}=0\) y varianza \(\sigma^{2}\{\epsilon_{i}\}= \sigma^{2}\).

Este modelo estadístico se considera simple o univariada, puesto que solo existe una variable independiente o predictora, Lineal en los parámetros puesto que tanto \(\beta_{0}\) y \(\beta_{i}\) presentan grado 1 y lineal en la variable predictora puesto que esta presenta también, grado 1.

Interpretación de los componentes del modelo de regresión univariada.

\(\beta_{0}\) y \(\beta_{i}\) son llamados comúnmente Coeficientes de regresión.

\(\beta_{i}\), es conocido como la pendiente de la función de regresión, que no es mas que, el cambio promedio en la distribución de probabilidad de la variable \(Y\) por cada unidad que se incremente en la variable \(X\).

\(\beta_{0}\), es conocido como el intercepto al eje Y de la función de regresión. Cuando el desarrollo del modelo incluye \(X=0\), este parámetro significa el cambio promedio de la distribución de probabilidad de la variable \(Y\) cuando \(X=0\). Mientras que, si no lo incluye, solo representa el punto de corte al eje Y.