Los expertos valoran las implicaciones del modelo de código abierto de DeepSeekka y su impacto en la tecnología, la geopolítica, las artes y más. En las últimas semanas, la aparición de DeepSeek de China –, un modelo de lenguaje de código abierto poderoso y rentable –, ha provocado un discurso considerable entre académicos e investigadores de la industria. En el Instituto Stanford para la IA centrada en el ser humano (HAI), los profesores están examinando no solo los avances técnicos de las modelaciones, sino también las implicaciones más amplias para la academia, la industria y la sociedad a nivel mundial. Un elemento central de la conversación es cómo DeepSeek ha desafiado las nociones preconcebidas con respecto al capital y los recursos computacionales necesarios para avances serios en IA. La capacidad de ingeniería inteligente e innovación algorítmica demostrada por DeepSeek puede capacitar a las organizaciones con menos recursos para competir en proyectos significativos. Esta ingeniosa ingeniería, combinada con los pesos de código abierto y un documento técnico detallado, fomenta un entorno de innovación que ha impulsado los avances técnicos durante décadas. Si bien el modelo de peso abierto y el documento técnico detallado son un paso adelante para la comunidad de código abierto, DeepSeek es notablemente opaco en lo que respecta a la protección de la privacidad, el suministro de datos y los derechos de autor, lo que aumenta las preocupaciones sobre el impacto de la IA en las artes, la regulación y la seguridad nacional. El hecho de que DeepSeek fuera lanzado por una organización china enfatiza la necesidad de pensar estratégicamente sobre medidas regulatorias e implicaciones geopolíticas dentro de un ecosistema global de IA donde no todos los actores tienen las mismas normas y donde mecanismos como los controles de exportación no tienen el mismo impacto. DeepSeek ha reavivado las discusiones sobre código abierto, responsabilidad legal, cambios de poder geopolíticos, preocupaciones de privacidad y más. En esta colección de perspectivas, los becarios senior de Stanford HAI ofrecen una discusión multidisciplinaria de lo que DeepSeek significa para el campo de la inteligencia artificial y la sociedad en general. Russ AltmanKenneth Fong Profesor y Profesor de Bioingeniería, de Genética, de Medicina, de Ciencia de Datos Biomédicos, Stanford HAI Senior Fellow, y Profesor, por cortesía, de Ciencias de la Computación En HAI somos académicos, y hay elementos del desarrollo de DeepSeek que proporcionan lecciones y oportunidades importantes para la comunidad académica. En primer lugar, el compromiso con el código abierto (abrazado por Meta y también adoptado por DeepSeek) parece trascender los límites geopolíticos – DeepSeek y Llama (de Meta) brindan una oportunidad para que los académicos inspeccionen, evalúen, evalúen y mejoren los métodos existentes, desde una perspectiva independiente. El movimiento “closed source” ahora tiene algunos desafíos para justificar el enfoque –, por supuesto, sigue habiendo preocupaciones legítimas (por ejemplo, malos actores que usan modelos de código abierto para hacer cosas malas), pero incluso estos son posiblemente mejor combatidos con acceso abierto a las herramientas que estos actores usan para que la gente en la academia, la industria y el gobierno puede colaborar e innovar en formas de mitigar sus riesgos. En segundo lugar, la demostración de que la ingeniería inteligente y la innovación algorítmica pueden reducir los requisitos de capital para los sistemas de IA serios significa que los esfuerzos menos capitalizados en la academia (y en otros lugares) pueden competir y contribuir en algunos tipos de construcción de sistemas. Muchos de nosotros pensamos que tendríamos que esperar hasta la próxima generación de hardware de IA económico para democratizar la IA – este puede ser el caso. Pero incluso antes de eso, tenemos la demostración inesperada de que las innovaciones de software también pueden ser fuentes importantes de eficiencia y costo reducido. En conjunto, ahora podemos imaginar sistemas de IA del mundo real no triviales y relevantes construidos por organizaciones con recursos más modestos. En tercer lugar, el progreso de DeepSeek junto con los avances en los sistemas de IA basados en agentes hace que sea más fácil imaginar la creación generalizada de agentes de IA especializados que se mezclan y combinan para crear sistemas de IA capaces. El monolítico “general AI” todavía puede ser de interés académico, pero será más rentable y mejor ingeniería (por ejemplo, modular) crear sistemas hechos de componentes que se pueden construir, probar, mantener e implementar antes de fusionarse. Un modelo de agentes de IA que cooperan entre sí (y con humanos) replica la idea de “equipos humanos” que resuelven problemas. A veces los problemas son resueltos por un solo genio monolítico, pero esta no suele ser la apuesta correcta. Por lo tanto, DeepSeek ayuda a restablecer el equilibrio al validar el intercambio de ideas de código abierto (los datos son otra cuestión, es cierto), lo que demuestra el poder de la innovación algorítmica continuay permitir la creación económica de agentes de IA que puedan mezclarse y combinarse económicamente para producir sistemas de IA útiles y robustos. Por supuesto, las preguntas permanecen: Choi YejinDieter Schwarz Foundation HAI Professor, Professor of Computer Science, y Stanford HAI Senior Fellow Choi Yejin El éxito del modelo R1 de DeepSeek muestra que cuando hay una “prueba de existencia de una solution” (como lo demuestra OpenAIays o1), se convierte simplemente en cuestión de tiempo antes de que otros encuentren la solución también. La decisión de DeepSeekk de compartir la receta detallada del entrenamiento R1 y los modelos de peso abierto de diferentes tamaños tiene profundas implicaciones, ya que esto probablemente aumentará la velocidad del progreso aún más, estamos a punto de presenciar una proliferación de nuevos esfuerzos de código abierto que replican y mejoran R1. Este cambio indica que la era de la escala de fuerza bruta está llegando a su fin, dando paso a una nueva fase centrada en las innovaciones algorítmicas para continuar escalando a través de la síntesis de datos, nuevos marcos de aprendizaje y nuevos algoritmos de inferencia. Sin embargo, una pregunta importante que enfrentamos en este momento es cómo aprovechar estos poderosos sistemas de inteligencia artificial