Cuando se lanzó DeepSeek-R1 el 20 de enero , este potente y rentable modelo de razonamiento de IA cautivó tanto a Silicon Valley como a Wall Street. ¿Por qué? Podía razonar tan bien como los mejores modelos de empresas como OpenAI y Anthropic, pero, según se informa, consumía mucho menos recursos y su entrenamiento y uso costaban mucho menos. Solo el mes pasado, el modelo se descargó más de 800.000 veces en Hugging Face . “Fue una llamada de atención”, recordó Larry Li , fundador y socio director de la firma de inversión AMINO Capital, con sede en Palo Alto, en una entrevista reciente con IBM Think . Las nuevas tecnologías suelen ser objeto de ingeniería inversa, dijo. “Pero nadie esperaba que se pudiera hacer tan bien”. “Se trataba simplemente de cambiar la narrativa de que Estados Unidos es el único lugar en el mundo donde se puede innovar”, dijo Matthieu Soulé , director de C.Lab de Cathay Innovation, un fondo que invierte en innovación en IA en la UE y Asia, incluida China. Muchos predijeron que el éxito de DeepSeek revolucionaría la industria y la carrera global de la IA en general. Seis meses después, quisimos comprobarlo: ¿realmente sucedió? Hablamos con algunos de los mismos expertos que entrevistamos en las horas posteriores al lanzamiento de DeepSeek-R1 , así como con varios otros expertos para obtener una imagen holística. ¿Qué cambió después de DeepSeek-R1? En los días posteriores al lanzamiento de DeepSeek-R1, muchos expresaron su preocupación sobre si la empresa había calculado y reportado con precisión los costos totales (no solo el entrenamiento del modelo casi final) y qué componentes habían utilizado de qué empresas. En otras palabras, ¿habían logrado algo realmente revolucionario o se trataba de un progreso más gradual? Algunos, como Kaoutar El Maghraoui, Científica Principal de Investigación de IBM, creen que la verdadera innovación podría haber sido lo que ella llama «eficiencia arquitectónica» o la combinación de técnicas que incluyen «la combinación de expertos, una estrategia de aprendizaje por refuerzo, el diseño de código hardware-software y otros trucos de optimización. Se trata principalmente de una implementación inteligente y eficaz de técnicas ya existentes», afirmó en una entrevista reciente en IBM Think . Aun así, expertos de todo el sector coinciden en que DeepSeek-R1 transformó el panorama global de la IA de varias maneras clave. Por un lado, muchos daban por sentado que las empresas estadounidenses de IA tenían una ventaja casi imposible de recuperar. DeepSeek desmintió esa suposición al reducir las barreras para que desarrolladores y pequeñas empresas accedieran a las herramientas necesarias para desarrollar sus propios LLM. “Los desarrolladores y usuarios ahora tienen acceso al mismo tipo de capacidades que o1 de OpenAI por una fracción del costo”, señaló Abraham Daniels, gerente sénior de productos técnicos de IBM, en una entrevista. El hecho de que DeepSeek abriera sus modelos contribuyó significativamente a aumentar la accesibilidad . «Hemos observado un repunte del interés en el código abierto desde DeepSeek y su contribución a la AI Alliance», afirmó Anthony Annunziata, director de Estrategia Abierta de IA en IBM y la AI Alliance. La AI Alliance es una red internacional de empresas y organizaciones que trabajan para crear una IA abierta y segura, fundada por IBM y Meta. “En toda Europa, en Vietnam, India y Japón, hay empresas regionales de inteligencia artificial que quieren asegurarse de mantener el control soberano de su inteligencia artificial, de poder moldearla como quieran para que se ajuste a sus necesidades culturales, sociales y económicas, que son diferentes a las de Estados Unidos y otros lugares”, afirmó Annunziata. Proteger la investigación nacional en IA es una prioridad. «Existe un verdadero impulso a la soberanía digital, donde los gobiernos intentan descubrir cómo evitar la influencia extranjera en IA», afirmó El Maghroui. La creación de programas de maestría en derecho (LLM) basados en idiomas locales motiva a muchos emprendedores. «La IA se encamina hacia una dirección en la que, como servicio público, cada país o región busca tener su propio modelo lingüístico para, al menos, influir en el comportamiento», afirmó Li. Japón, por ejemplo, promulgó recientemente la Ley de Promoción de la IA para apoyar notablemente la promoción de esta tecnología. A finales de junio, la Alianza de IA lanzó una nueva etapa en Japón para centrarse en dos áreas de gran interés para los emprendedores locales: la soberanía de la IA y la IA en la fabricación. El lenguaje desempeña un papel fundamental en el control de los sistemas de IA, por lo que, a finales de 2024, por ejemplo, un grupo de más de 1500 investigadores del mundo académico y la industria se unió para desarrollar modelos lingüísticos japoneses sólidos y abiertos. Muchos modelos y emprendedores de IA locales también priorizan los intereses económicos locales. En el caso de Japón, muchas de las empresas que se unieron a la Alianza de IA, como Mitsubishi Electric y Panasonic, están desarrollando modelos de IA orientados a aplicaciones industriales y de manufactura, un segmento particularmente importante de la economía japonesa. Boletín de la industria Las últimas noticias tecnológicas, respaldadas por conocimientos de expertos. Manténgase al día con las tendencias más importantes e interesantes del sector en IA, automatización, datos y más con el boletín Think. Consulte la Declaración de Privacidad de IBM . Suscribir Por otro lado, también existe un creciente interés por los modelos locales, afirmó Daisuke Okanohara, director de tecnología y cofundador de Preferred Networks , empresa japonesa de hardware y software que desarrolla software avanzado mediante aprendizaje profundo e IA. En mayo, Preferred Networks lanzó su segunda versión de PLaMo, un modelo compacto que puede ejecutarse localmente y está entrenado en japonés e inglés. «Su rendimiento no es tan competitivo como el de los modelos de vanguardia en general, pero destaca en ciertas tareas específicas», declaró Okanohara durante una entrevista con IBM Think. «En casos de uso con modelos pequeños, como modelos con entre ocho y treinta mil millones de parámetros, supera a CLANG, GPT-4o mini y modelos similares en varias tareas en japonés». Vietnam también ha experimentado un auge en la actividad de LLM empresarial, y la Alianza de IA abrió una sucursal allí en junio de este año.