Guía rápida sobre la inteligencia artificial

"Hay tres grandes acontecimientos en la historia. El primero es la formación del universo. El segundo es el comienzo de la vida. El tercero es la aparición de la inteligencia artificial".
—En su entrevista con la BBC, Edward Fredkin, director del laboratorio de informática del MIT.

El término IA fue acuñado en la famosa conferencia de Dartmouth en 1956 por el matemático y científico informático McCarthy. Desde entonces esta tecnología enfrentó un dilatado invierno que frenó su avance. Recién en 2014, gracias al progreso de los ordenadores, el big data y la capacidad de almacenamiento, la inteligencia artificial alcanzó finalmente resultados significativos. Numerosos investigadores, académicos y políticos ven en la IA un desarrollo tecnológico clave del siglo XXI con efectos en la sociedad, cultura y economía.

En la actualidad se usa el término IA generalmente para aludir al aprendizaje automático (machine learning), pues aún no existe un consenso en cuanto a la definición precisa de IA.

Tal vez te interese: ¿Qué es la inteligencia artificial?

El aprendizaje automático(ML) es el campo que busca que la máquina comprenda patrones complejos y pueda tomar decisiones aplicando algoritmos adecuados basados en los datos. Es decir, el aprendizaje automático calcula la mejor manera de combinar entradas para calcular salidas, creando esencialmente algoritmos.

El ML ha cambiado la manera de resolver problemas para las máquinas. Tradicionalmente, se tenía una entrada, se aplicaba un algoritmo y se calculaba la salida. Ahora el ML invierte el proceso; usando los datos y la salida deseada, determina el mejor algoritmo para acercarse a la salida. Parte de los datos y el resultado para determinar la combinación de variables óptima para generar el resultado.

Uno de los conceptos fundamentales para entender el ML es entender la función de recompensa. Nos debemos preguntar "¿Cuál es la función?". Hay tres familias principales de funciones de recompensa: aprendizaje supervisado, aprendizaje por refuerzo y aprendizaje no supervisado.

Aprendizaje supervisado

En este método, el modelo aprende a realizar tareas de clasificación a partir de un conjunto de datos de entrenamiento etiquetados. Parecido a un niño que, a medida que ve más imágenes, va aprendiendo a reconocer las características de cada animal.

Ejemplos:

  • Clasificador de imágenes de gatos y perros.
  • El detector de rostros en las cámaras.
  • Traductor de texto.
  • Los modelos de lenguaje de gran tamaño (LLM): ChatGPT, Gemini, Claude (su entrenamiento también necesitó de aprendizaje por refuerzo mediante retroalimentación humana para afinar el modelo).
  • Todos los generadores de imágenes DALL-E, Stable Diffusion y Midjourney
  • Identificador de señales de tránsito.
  • Convertir voz en texto, como en Google assistant.
  • Corrector de estilo.

Desventajas del aprendizaje supervisado:

  • Requiere un enorme conjunto de datos de entrenamiento.
  • El modelo puede aprender sesgos del conjunto de datos de entrenamiento. Es decir, no generaliza.
    • Las cámaras de los coches pueden fallar en la detección de señales de tránsito cuando se coloca una pegatina en la señal.
    • Las manos mal construidas en los generadores de imágenes denotan una falta de generalización sobre cómo se ve una mano.
    • Sesgos estereotípicos en los LLM (generalizaciones negativas en cuanto a raza, género, religión y otros constructos sociales).

Aprendizaje no supervisado

En contraste al método anterior, el modelo aprende a partir de un conjunto de datos sin etiquetar. Es decir, no recibe información sobre la salida deseada. El objetivo es que el modelo descubra patrones en los datos por sí mismo.

Ejemplos:

  • Recomendación de contenido (Facebook, Youtube, Instagram, Pinterest, y todas las demás).
  • Reducción de dimensionalidad, simplifica un gran conjunto de datos y extrae características significativas para facilitar su manejo.
  • Detección de anomalías, analizar grandes cantidades de datos y descubrir puntos de datos atípicos dentro de un conjunto de datos.
  • Segmentar clientes en grupos con características similares.

Desventajas del aprendizaje no supervisado:

  • Puede ser difícil interpretar los resultados del aprendizaje no supervisado.
  • El modelo puede aprender sesgos del conjunto de datos.

Aprendizaje por refuerzo

En este caso, el modelo aprende a tomar decisiones en función a recompensas y castigos. Aprende a través de prueba y error.

Ejemplo:

  • Juegos, AlphaZero un modelo con nivel de juego sobrehumano en ajedrez, shogi y Go.
    • La máquina recibe objetivos generales.
    • Ejemplo: Obtener puntos o mejorar el mundo, ajustando estrategias.

Cualquiera de estas funciones puede optimizarse con retroalimentación humana (RHF). El aprendizaje supervisado, no supervisado y por refuerzo son tres enfoques fundamentales en el campo del aprendizaje automático, cada uno con sus propias aplicaciones y desafíos.

Next Post Previous Post
No Comment
Add Comment
comment url