La llegada de la inteligencia artificial china DeepSeek ha sacudido la industria. Aunque algunos cuestionan su procedencia, lo cierto es que sus innovadores métodos para desarrollar y entrenar los modelos, y su naturaleza de código abierto, llega como un impulso para el desarrollo de la IA abierta.
Imagen: Unsplash
Hasta ahora, Meta era una de las pocas empresas de renombre en apostar por la IA de código abierto con su modelo Llama. Sin embargo, hasta hace poco los desarrolladores más pequeños tenían una gran barrera para competir contra las grandes empresas: las millonarias inversiones que exige el desarrollo y entrenamiento de un modelo de inteligencia artificial.
El lanzamiento DeepSeek rompió el paradigma sobre los altos costos de desarrollar IA, dando un impulso importante para empresas de todo el mundo al dar entrada a lo que sería la democratización de esta tecnología.
El propio Donald Trump, quien hace unos días anunció un fondo de $500.000 millones de dólares para el desarrollo de IA en los próximos cuatro años, aseguró que la llegada de esta nueva inteligencia artificial es “algo positivo” porque «en lugar de gastar miles y miles de millones, gastarás menos y, con suerte, encontraremos la misma solución».
“Esto representa un gran avance en el mundo de la tecnología y agrega competitividad en la forma de desarrollar la arquitectura de las aplicaciones, ya que no solo se trata de crear una arquitectura limpia y que tenga la mayor cantidad de cualidades sistémicas, sino que sea lo menos costosa posible”, explica Esteban Buitrago, desarrollador en Source Meridian.
Los usuarios también se ven beneficiados. Aunque opciones como ChatGPT permiten acceder de manera gratuita, el número de peticiones son limitadas y para acceder a los mejores modelos sin límites es necesario pagar una membresía de $20 dólares al mes o 200 dólares mensuales para los casos más avanzados y tareas de grado de investigación.
Mientras que DeepSeek al ser completamente open source permite a cualquier persona o empresa acceder al código, utilizarlo y modificarlo según sus necesidades. Incluso miles de usuarios ya están descargando este modelo en computadores domésticos para ejecutar la inteligencia artificial de manera local.
Gracias a esa característica, grupos de investigación, desarrolladores y pequeñas empresas puedan adoptar la tecnología, democratizando el acceso a una IA de vanguardia.
La democratización de la IA ha llegado
Muchos analistas y expertos del sector han catalogado el lanzamiento de DeepSeek como un momento “Sputnik” de la época. Esto en referencia al lanzamiento del satélite Sputnik 1 en 1957 por parte de la Unión Soviética, convirtiéndose en el primer satélite artificial de la historia en entrar en órbita alrededor de la Tierra, acontecimiento que llevó al espacio la carrera tecnológica y militar con Estados Unidos.
Según Yahoo Finanzas, el modelo de OpenAI costó más de $100 millones de dólares, mientras que el costo de Gemini de Google rondaría los $191 millones de dólares.
En contraste con las millonarias inversiones de las grandes compañías que están apostando por la IA, se estima que DeepSeek desarrolló sus modelos con un presupuesto de solo 5.6 millones de dólares y GPUs más antiguas debido a los bloqueos que impiden a empresas chinas acceder a tecnología estadounidense.
«Esto demuestra que sí es posible trabajar con inteligencia artificial con menos recursos y se abren nuevos paradigmas en el desarrollo de tecnología, ya que se van a reevaluar nuevas metas con base al proceso que desarrolló e implementó DeepSeek», explica Buitrago.
Si bien la infraestructura avanzada y grandes centros de datos puede ser crucial para garantizar una ventaja competitiva, las grandes empresas ahora tienen claro que sus próximos rivales más fuertes pueden surgir de un laboratorio con recursos más modestos.
¿Cómo se comparan los modelos de IA?
La comparación entre diferentes sistemas de inteligencia artificial depende de muchos factores, incluyendo los objetivos específicos para los que fueron diseñados, las tareas que pueden realizar, y cómo interpretan «mejor» las peticiones de los usuarios.
Por ejemplo la empresa china cuenta con dos modelos. DeepSeek-V3 es un modelo de propósito general que permiten interactuar de manera conversacional, proporcionar información general, y ayudar en una amplia variedad de temas y tareas, desde la escritura creativa hasta la resolución de dudas específicas. Mientras que DeepSeek-R1 se centra en tareas de razonamiento, como matemáticas y programación.
Cada sistema tiene sus fortalezas y debilidades, y lo que puede hacer a uno «mejor» que otro depende de la tarea específica que necesitas realizar, pero a nivel general hay una competencia bastante pareja entre los modelos desarrollado por DeepSeek con una fracción de costo frente a los de OpenAI, Google o Meta.
A partir de ahora inicia una nueva era en la que las empresas estadounidenses buscarán responder a los avances de los ingenieros chinos.