El Portal de las Tecnologías para la Innovación

¿Qué es la Inteligencia Artificial?

La IA generativa utiliza nuevos enfoques como transformadores y modelos de difusión para producir texto, imágenes y código similares a los humanos.

Los humanos han soñado con construir máquinas inteligentes desde al menos la época de los antiguos griegos, pero no fue hasta la llegada de las computadoras digitales que la IA se hizo posible. John McCarthy, profesor del Dartmouth College, acuñó el término «inteligencia artificial» en 1955, y a pesar de los periodos fluctuantes de progreso y estancamiento, la IA se ha integrado progresivamente en la vida cotidiana. Hoy en día, la IA está en todas partes, desde sistemas de recomendación basados ​​en aprendizaje automático (Amazon, Netflix), asistentes digitales (Siri, Alexa) y millones de aspiradoras robot.

¿Qué es la IA y de dónde surgió?

 En esencia, la IA utiliza las computadoras para discernir patrones y predecir resultados a partir de conjuntos de datos, grandes o pequeños, ya sean tendencias climáticas, patrones de compra personales o montones de imágenes. Un modelo de IA es un sistema que puede aprender de los datos y tomar decisiones o predicciones sin estar programado explícitamente para ello.

La aceleración del campo se debe en gran medida a la Ley de Moore y a la rápida innovación tecnológica, pero varios cambios estructurales han sido fundamentales:

Big Data: una explosión de generación de datos, incluida la información pública disponible en Internet, ha potenciado el entrenamiento de la IA.

Procesamiento paralelo: la IA ha adoptado técnicas de supercomputación y computación en la nube, lo que permite el uso simultáneo de miles de procesadores.

Aceleradores de hardware:
El hardware especializado aumenta drásticamente la velocidad de ciertos tipos de computación, como la multiplicación de matrices. Los aceleradores abarcan desde dispositivos dedicados hasta piezas de silicio dedicadas y bloques de propiedad intelectual integrados en un microprocesador.

Computación de precisión baja o mixta:
la IA se ha beneficiado al representar números con menos bits, mejorando la velocidad sin comprometer la precisión.

Paralelamente a estos cambios tecnológicos se produjeron avances en un componente central que había sido parte de la IA desde el principio: las redes neuronales.

Las redes neuronales, un tipo de modelo matemático inspirado en el cerebro humano, toman una entrada (es decir, imágenes de automóviles), la pasan a través de neuronas o nodos dentro de capas ocultas de la red para producir una salida (un modelo de un «automóvil»).

Ilustración de un coche amarillo aparcado en una calle gris. La imagen tiene la etiqueta 1. Entrada en la parte superior. El coche se ve desde una vista cenital.

Cómo se construye la IA

El primer paso importante para construir un modelo de IA se llama entrenamiento , que puede requerir una inmensa velocidad y escala computacional (o mucha paciencia).

Al recorrer la red neuronal hacia adelante y hacia atrás en un bucle de retroalimentación rápido y ajustarla a los aspectos conocidos del conjunto de datos, el modelo de IA aprende variables internas, también conocidas como parámetros , que se ajustan durante el entrenamiento para ayudar al modelo a realizar predicciones precisas. El comportamiento de la red depende de la fuerza (o peso ) de las conexiones entre neuronas.

Ilustración que muestra una animación de un coche amarillo que pasa por cuatro etapas: entrada, simulación, entrenamiento y validación. La posición, las imágenes y las anotaciones del coche cambian en cada etapa, lo que demuestra un proceso de evaluación y ajuste.
Lectura de texto 2. Parámetros + Clasificación sobre un recuadro titulado "La IA genera parámetros". Debajo, se encuentran recuadros más pequeños titulados "Árboles de decisión", "Modelos lineales", "Redes neuronales" y "Modelos de diseño". Las flechas los conectan con "Clasificación" en la parte inferior.
Ilustración que muestra un cuadrado blanco con borde azul bajo el encabezado 3. Texto en negrita negra. El cuadrado aparece vacío y está centrado bajo el encabezado.

El siguiente paso es el ajuste , donde el modelo de IA previamente entrenado se ajusta para incorporar nueva información o adaptarse mejor a un conjunto de datos o una tarea específicos.

Una vez que se entrena un modelo, se puede aplicar una y otra vez para realizar inferencias, que utilizan el modelo para tomar nuevas entradas y generar nuevos resultados relevantes.

De la IA que toma decisiones a la IA que crea cosas

El aprendizaje profundo potenció las redes neuronales al incorporar múltiples capas que mejoran la precisión y la eficiencia del entrenamiento. Las redes neuronales y el aprendizaje profundo son la base de muchas de las herramientas más populares y potentes de la IA. (No son las únicas: los grafos de conocimiento, el aprendizaje por refuerzo y la IA neurosimbólica son otros enfoques que están teniendo un impacto).

Los avances tecnológicos más recientes dieron lugar a la IA generativa (GenAI), donde las máquinas pueden crear respuestas similares a las humanas y contenido visual original, algo así como tener un asistente superinteligente y creativo que responde a tus preguntas y mejora sus creaciones. La GenAI actual se presenta en diferentes variantes, cada una posible gracias a varias innovaciones clave.

Los transformadores son un tipo de arquitectura de red neuronal introducida por Google en 2017. Se entrenan con grandes volúmenes de texto y no requieren supervisión humana, ya que procesan oraciones completas simultáneamente, lo que mejora la comprensión de las palabras en contexto al prestar atención a las más relevantes. Ejemplos: GPT (Transformador Generativo Preentrenado), BERT (Representaciones de Codificador Bidireccional a partir de Transformadores). Los transformadores, y los grandes modelos lingüísticos (LLM) que han permitido, revolucionaron la traducción de idiomas, los chatbots y la creación de contenido. Incluso han demostrado capacidades emergentes en la generación de texto, la codificación y la predicción meteorológica. Ejemplos: GPT-3, GPT-4.

Para la generación de imágenes, los modelos de difusión , conceptualizados en Stanford en 2015 e inspirados en los procesos de difusión de la física, han demostrado avances y capacidades increíbles. Ejemplos: DALL-E 2, Difusión estable.

Los modelos multimodales , capaces de interpretar diversos tipos de datos, han mejorado la comprensión y versatilidad de la IA. Ejemplos: CLIP (Preentrenamiento Contrastivo de Lenguaje e Imagen), DALL-E.

Aún estamos en las primeras etapas de la IA. El potencial de este campo para transformar casi todos los aspectos de la vida impulsa una gran inversión en capacidad informática e investigación y desarrollo; al mismo tiempo, genera entusiasmo y preocupación a nivel mundial.

Resumen

  • La IA surgió gracias a procesadores más rápidos, más datos, clústeres de cómputo más grandes y nuevos algoritmos.
  • La IA es un campo amplio que abarca el aprendizaje automático, la visión artificial, las redes neuronales y mucho más.
  • La IA generativa utiliza nuevos enfoques como transformadores y modelos de difusión para producir texto, imágenes y códigos similares a los humanos.
  • Descargue este Tech 101

Intel News. Traducido al español

Artículos relacionados

Scroll al inicio