Hace dos años, cuando las grandes compañías tecnológicas chinas como Baidu y Alibaba estaban persiguiendo el progreso del Valle de Silicon en inteligencia artificial con anuncios chatbot con salpicaduras y nuevos, Deepseek ha adoptado un enfoque diferente. Fue autorizado en la investigación.
La estrategia dio sus frutas.
La nueva empresa china ha sacudido el mundo de la tecnología con su afirmación de haber creado un poderoso modelo de inteligencia artificial que era significativamente más barato para ser construido en comparación con las ofertas de sus rivales estadounidenses mejor financiados.
En la rivalidad entre China y Estados Unidos para el dominio de la inteligencia artificial, Deepseek parecía salir de la nada. De hecho, en los últimos años ha aumentado a las estrellas en el mundo de la tecnología china con un camino que estaba lejos de ser convencional.
Su misión de realizar la investigación refleja la de compañías como OpenAi, la compañía Silicon Valley que marcó una firma estadounidense en la IA en el otoño de 2022. Pero las similitudes terminan más.
Los orígenes de Deepseek están en finanzas, no tecnológicas para el bien de la tecnología. Su empresa matriz, un fondo de cobertura chino llamado High-Flyer, no ha comenzado como un laboratorio dedicado a la protección de la humanidad de la IA en cuanto al Abierto, sino como una compañía que utiliza la IA para hacer apuestas en las acciones chinas mercado.
El Alta Friggi había prosperado capitalizando un mercado dominado por inversores minoristas chinos, que se sabe que saltaron y fuera de las acciones impulsivamente. En 2021, el flyer alto estaba bajo la presión de las represiones regulatorias en China en un comercio especulativo, que las autoridades de Beijing creían que estaban en contraste con sus intentos de mantener la calma de los mercados.
Entonces, para Alto Frigio, buscó una nueva oportunidad que se ha alineado mejor con las prioridades del gobierno chino: avanzar
“Queremos hacer cosas con mayor valor y cosas que van más allá del sector de la inversión, pero se ha interpretado mal como especulaciones sobre las acciones de la IA”, dijo el CEO de High-Flyer, Lu Zhengzhe, medios estatales chinos en 2023 “Hemos creado un nuevo equipo independiente de la inversión, que es equivalente a una segunda empresa”.
Deepseek nació. Al igual que con muchas otras nuevas empresas chinas, Deepseek ha llegado a un mercado consolidado con un enfoque comercial diferente.
Se cree que el último modelo de inteligencia artificial de Deepseek es casi poderoso como rivales estadounidenses pero mucho más eficientes. Su éxito sugiere que el protagonista de la IA de Silicon Valley se ha reducido. El punto de inflexión de Deepseek, a pesar de los esfuerzos de Washington para limitar el acceso chino a los chips avanzados para la IA, plantea preguntas sobre cuán efectivas son estos controles a largo plazo, aunque el fundador de Deepseek ha reconocido que las restricciones en el chip son una limitación.
Deepseek no se basó en la creación de productos para las revueltas del consumo de ingresos y solo este mes ha lanzado su primer chatbot, que permite a cualquiera generar texto y fotos con comandos simples. En cambio, la compañía usó el dinero que los altos volantes obtuvieron del comercio de capital a la ambiciosa investigación del bankroll. El enfoque lo distingue de los rivales estadounidenses, que al final son empresas tecnológicas de consumo.
Este enfoque no convencional también permitió a Deepsek evadir las rígidas regulaciones que el gobierno chino ha puesto en el uso de la inteligencia artificial por parte del público. Debido a que su objetivo era la investigación y la venta a las empresas que usan su modelo, y, hasta el lanzamiento de su chatbot este mes, no a las aplicaciones de los consumidores, sus primeros trabajos no han desencadenado las mismas restricciones que el gobierno.
Deepseek es administrado por su CEO, Liang Wenfeng, un ingeniero delgado y caminado que estudió en la Universidad de Zhejiang en la ciudad oriental de Hangzhou. Dijo repetidamente en las pocas entrevistas que dio a los medios chinos que para llegar a la innovación estadounidense, las empresas chinas deben poner investigaciones antes de las ganancias. Deepseek y High-Flyer no respondieron a las solicitudes de comentarios.
Lo que las compañías tecnológicas chinas “carecen de innovación ciertamente no son capital, sino una falta de confianza y conocimiento sobre cómo organizar una alta densidad de talentos para obtener una innovación efectiva”, dijo en una entrevista ampliamente extendida con la salida tecnológica china 36KR.
De acuerdo con entrevistas y finanzas públicas.
“Ciertamente es un bajop”, dijo Zihan Wang, un ingeniero informático que trabajó en un modelo profundo anterior, refiriéndose a un tipo de personalidad introspectiva de la prueba de Myers-Briggs, una prueba de personalidad popular entre los jóvenes en China. “Las estrellas son muy buenos investigadores y tienen la voluntad de explorar”, dijo Wang. “No es una de esas personas que quieren controlar todo”.
El Sr. Liang no estaba demasiado molesto por detalles como el momento del proyecto y ocasionalmente envió preguntas de investigación estimulantes a todo el equipo de investigadores, dijo Wang. Pero, sobre todo, el Sr. Liang parecía presionado para avanzar en la tecnología y no se centró en las ganancias.
A diferencia de muchas empresas chinas, que tienden a centrarse en tomar programadores, Liang se ha ganado la reputación de emplear a personas fuera del cálculo. Los principales poetas y humanidades de las mejores universidades chinas en el personal de Deepseek capacitan al modelo para escribir poemas clásicos chinos y preguntas as tomadas del examen de admisión a la difícil universidad del país.
“La mayoría del equipo se graduó en las mejores universidades de China”, dijo Yineng Zhang, un ingeniero de software básico principal de San Francisco que trabaja en Sglang, un proyecto que no es parte de Deepseek que ayuda a las personas a basarse en el sistema Deepseek. “Son muy inteligentes y muy jóvenes”.
Durante años, las compañías tecnológicas chinas han abierto el camino a las aplicaciones de inteligencia artificial utilizadas en la visión artificial, como el reconocimiento facial. Pero el lanzamiento de ChatGPT de Openi ha provocado un cálculo. Cuando ninguna sociedad china emitió algo comparable inmediatamente, muchos concluyeron que las empresas estadounidenses tenían una ventaja de antemano
En China, se decidió a demostrar que podían competir. En 2023, muchas compañías en China publicaron sus grandes modelos de idiomas, la tecnología que respalda los chatbots como chatgpt.
Pero hacer modelos avanzados requeriría el uso de una gran cantidad de chips que costarían cientos de millones de dólares.
Incluso el alto vuelo estaba gastando. Para 2021, era solo un puñado de empresas chinas que habían podido acumular más de 10,000 chips nvidia avanzados.
Sin embargo, la búsqueda de Deepseek le dio una ventaja sorprendente. El año pasado, redujo drásticamente los precios que cobraron a los desarrolladores que construyen aplicaciones usando su modelo, causando la guerra de precios con rivales más grandes.
Wang, el ingeniero que anteriormente trabajó en Deepseek, dijo que hubo pocas discusiones sobre aplicaciones comerciales para la tecnología que estaban construyendo. En cambio, dijo, la compañía se centró en crear un sistema de inteligencia artificial que podría ser utilizado por una serie de personas para muchos propósitos.
“Durante mi período allí, no hablamos mucho sobre cómo hacemos dinero”, dijo Wang. “Solo se centraron en crear un excelente modelo de base”.
Una parte crucial de la popularidad de Deepseek es que hizo públicos a sus desarrolladores. Este tipo de intercambio de información, llamado código abierto, fue un hito del desarrollo del software de computadora, Internet y ahora inteligencia artificial.
En los Estados Unidos, los investigadores y los emprendedores de inteligencia artificial han seguido durante mucho tiempo el progreso de la tecnología Deepseek. El año pasado, la compañía transformó su cabeza cuando lanzó sistemas diseñados para generar sus programas de computadora.
Un nuevo desafío para la compañía podría llegar con su nuevo alto perfil. El mismo día lanzó R1, el modelo detrás de su nuevo chatbot, la semana pasada, el Sr. Liang apareció en una discusión redonda con Li Qiang, primer ministro chino.
La repentina popularidad de Deepseek lo empujó al centro de los esfuerzos del Partido Comunista Chino para estimular la innovación, y esto podría resultar difícil de administrar, dijo Jimmy Goodrich, consultor senior de análisis tecnológico en Rand Corporation, un grupo de expertos financiado en el nivel federal. “Es una gran situación para Deepseek. Estoy seguro de que no estaban en el gobierno del gobierno de cinco años, dijo.
“¿Pueden mantener esta visión despreocupada caótica cuando miran tanto la fiesta como el mundo?”
Zixu Wang Investigación aportada por Hong Kong.
