Uno de los mayores hitos de la IA generativa fue el lanzamiento de ChatGPT en noviembre de 2022 por OpenAI, una organización que ha estado a la vanguardia del desarrollo de modelos de lenguaje de gran escala
Por: Dr. Carlos Boya

El autor es ingeniero y Doctor en Ingeniería Eléctrica, Electrónica e Inteligencia Artificial. Es docente en el ITSE e investigador del Centro de Investigación e Innovación Educativa, Ciencia y Tecnología (CIIECYT-AIP). Tiene amplia experiencia en diseño electrónico y aplicaciones en Ingeniería.
La inteligencia artificial (IA) ha pasado de ser una disciplina de investigación teórica a una revolución tecnológica que está transformando industrias enteras. En este contexto, la IA generativa ha surgido como una de las innovaciones más disruptivas, con aplicaciones que van desde la generación de texto y la creación de imágenes hasta la automatización del diseño y la programación. En el centro de esta revolución se encuentran los modelos de lenguaje masivos, siendo ChatGPT una de las tecnologías más reconocidas, pero también con la reciente irrupción de DeepSeek, un desafío emergente que promete cambiar las reglas del juego.
Aplicaciones prácticas de la IA Generativa
La IA generativa está teniendo un impacto profundo en diversas industrias:
- Educación: Chatbots y asistentes virtuales ayudan a los estudiantes con tutorías personalizadas, generación de resúmenes y traducción de textos. También a los profesores a crear los diseños curriculares del curso o incluso sus presentaciones para las clases.
- Industria: Las IAs pueden optimizar diseños de productos, automatizar tareas de mantenimiento predictivo y mejorar la fabricación con simulaciones avanzadas.
- Comercio: Empresas están utilizando IA generativa para personalizar la experiencia del cliente, generar descripciones de productos automáticamente y mejorar la atención al cliente con chatbots avanzados.
- Sector Legal: Modelos como ChatGPT pueden analizar grandes volúmenes de documentos legales, generar contratos y resumir casos jurídicos en minutos.
- Entretenimiento: La generación automática de guiones, música y arte digital está revolucionando la producción creativa.
La IA generativa y sus pioneros
Los avances en inteligencia artificial generativa no se pueden entender sin mencionar a los grandes pioneros del aprendizaje profundo (deep learning), quienes sentaron las bases para los modelos actuales. Entre ellos destacan Geoffrey Hinton, Yann LeCun y Yoshua Bengio, conocidos como los «padres del aprendizaje profundo», por sus contribuciones en redes neuronales y técnicas de optimización que han permitido la creación de modelos de gran escala.
En 2018, estos investigadores recibieron el Premio Turing por sus contribuciones en IA. Además, es destacable el premio Nobel de Física del 2024 para G. Hinton por la creación de las bases de la IA y el de Química, para Demis Hassabis fundador de DeepMind, con algoritmos de Deep learning.
Otro gran hito fue la introducción de las Redes Neuronales Recurrentes (RNNs) y, posteriormente, de las Long Short-Term Memory (LSTM), creadas por Sepp Hochreiter y Jürgen Schmidhuber en 1997. Estas redes permitieron a las computadoras procesar secuencias de datos, abriendo el camino a aplicaciones como el reconocimiento de voz y la traducción automática.
Sin embargo, las LSTM fueron superadas por una nueva arquitectura presentada en 2017: los Transformers, introducidos en el revolucionario paper «Attention Is All You Need», por Vaswani et al. Esta arquitectura eliminó la dependencia secuencial de las redes recurrentes, permitiendo el entrenamiento masivo en paralelo y facilitando la creación de modelos como GPT-3 (2020), GPT-4 (2023) y otros modelos avanzados.
ChatGPT y la dominación de OpenAI
Uno de los mayores hitos de la IA generativa fue el lanzamiento de ChatGPT en noviembre de 2022 por OpenAI, una organización que ha estado a la vanguardia del desarrollo de modelos de lenguaje de gran escala. Basado en la arquitectura Transformer, ChatGPT ha demostrado una capacidad sin precedentes para generar texto coherente, responder preguntas complejas y realizar tareas creativas.
Los modelos de la serie GPT (Generative Pre-trained Transformer), desde GPT-3 (2020) hasta GPT-4 (2023), han demostrado el poder de la IA generativa en una variedad de aplicaciones, desde chatbots hasta generación de contenido automatizado. Sin embargo, el costo computacional de estos modelos es altísimo, lo que ha llevado a la exploración de nuevas técnicas para hacerlos más eficientes y accesibles.

DeepSeek: El nuevo competidor
En este escenario de monopolio de OpenAI, ha surgido DeepSeek, un nuevo actor en la IA generativa que está desafiando el dominio de los modelos de OpenAI y Google DeepMind. DeepSeek ha logrado optimizar el uso de la IA generativa utilizando un enfoque basado en Mixture of Experts (MoE), una técnica que permite que solo una parte del modelo se active para cada tarea, reduciendo los costos computacionales sin perder potencia en el procesamiento del lenguaje.

Inspirado en investigaciones previas como Switch Transformers (2021) y GLaM (Generalist Language Model, 2022), DeepSeek ha implementado una arquitectura eficiente que le permite operar con 671 mil millones de parámetros, pero utilizando sólo 37 mil millones para cada tarea, lo que representa una optimización significativa respecto a otros modelos tradicionales. Este enfoque ha permitido a DeepSeek competir con modelos como GPT-4 con costos significativamente menores, revolucionando la accesibilidad de la IA generativa.
Impacto de DeepSeek en la Industria Tecnológica
La irrupción de DeepSeek ha tenido un impacto significativo en el mercado tecnológico global. Empresas como NVIDIA y ASML, que lideran la fabricación de hardware avanzado para entrenamiento de modelos de IA, han experimentado caídas en sus valores de mercado. Esto se debe a que la arquitectura de DeepSeek, basada en Mixture of Experts, optimiza los recursos computacionales, reduciendo la necesidad de un gran número de GPUs avanzadas como las que NVIDIA produce. De manera similar, ASML, clave en la producción de equipos para semiconductores, también ha visto una disminución en la demanda esperada de chips de alto rendimiento.

Por otro lado, empresas que se benefician de la accesibilidad y escalabilidad de estas nuevas arquitecturas han experimentado un impacto positivo. Compañías enfocadas en servicios de IA en la nube como Google Cloud, Microsoft Azure y Amazon Web Services (AWS) han ganado terreno, ya que DeepSeek permite que los costos de ofrecer IA generativa sean menores. Además, startups que desarrollan aplicaciones y herramientas basadas en IA también se han beneficiado al acceder a tecnologías más eficientes.
¿Hacia dónde se dirige la IA Generativa?
Con la irrupción de DeepSeek, la competencia en el campo de la IA generativa se ha intensificado. OpenAI, Google DeepMind y otros gigantes tecnológicos ahora enfrentan el desafío de desarrollar modelos más eficientes, accesibles y con menor costo computacional. Por otro lado, la proliferación de estos modelos también plantea preguntas sobre ética, privacidad y uso responsable de la IA.
Lo que es innegable es que la inteligencia artificial generativa ha llegado para quedarse, y estamos presenciando una de las revoluciones tecnológicas más significativas de nuestra era. Con la evolución de modelos como ChatGPT y la aparición de competidores como DeepSeek, el futuro de la IA generativa es más prometedor que nunca.
Por: Dr. Carlos Boya