DeepSeek, la firma tecnológica china, ha presentado este mes su modelo de inteligencia artificial actualizado, el DeepSeek-V3-0324.
Equipado con el sistema de razonamiento R1 y 685.000 millones de parámetros, este desarrollo promete mejoras significativas en generación de código y razonamiento matemático.
Diseñado como herramienta de propósito general, el modelo encuentra aplicaciones en asistentes conversacionales y desarrollo web, destacándose en precisión y funcionalidad.
Una licencia abierta para la innovación
A diferencia de las versiones anteriores, el DeepSeek-V3-0324 opera bajo la licencia MIT, la más utilizada en GitHub, permitiendo su uso, modificación y redistribución sin restricciones comerciales.
Este cambio refuerza el compromiso de DeepSeek con el acceso abierto y la colaboración entre desarrolladores.
Rendimiento sin precedentes
Entre los logros destacados, el modelo obtuvo 59,4 puntos en la American Invitational Mathematics Examination (AIME), superando ampliamente los 39,6 de su versión anterior.
En pruebas de programación como LiveCodeBench, alcanzó 49,2 puntos, generando más de 800 líneas de código sin errores y procesando más de 20 tókens por segundo, evidenciando su eficiencia.
La tecnología detrás del avance
Basado en una arquitectura Mixture-of-Experts (mezcla de expertos), el modelo optimiza tareas mediante módulos especializados, aumentando la eficiencia sin incrementar de manera significativa los costos computacionales.
Usuarios e ingenieros resaltan su precisión y capacidad para generar código funcional a gran escala.
Competencia tecnológica y desafíos políticos
El lanzamiento ocurre en un contexto de competencia entre China y Estados Unidos.
Mientras Washington controla la exportación de semiconductores clave para entrenar modelos de IA, Pekín exige que las tecnologías respeten los valores socialistas fundamentales y prohíban contenidos sensibles.
Además, DeepSeek enfrenta críticas internacionales por evitar temas controvertidos como Tiananmen o Taiwán, cuestionándose su neutralidad.
Proyección internacional
Disponible en plataformas como Hugging Face y servicios en la nube de startups como Hyperbolic, el modelo marca el inicio de una nueva etapa tecnológica.
Según Li Bangzhu, fundador de AIcpb.com, el DeepSeek-V3-0324 podría ser la antesala para el lanzamiento del futuro R2.
Con estos avances del nuevo modelo de DeepSeek, China muestra su capacidad para competir en el panorama global de inteligencia artificial.
¡Síguenos en nuestras redes sociales y descargar la app!