Diciembre ha sido un mes especialmente intenso en el mundo de la inteligencia artificial. Lejos de ser un periodo de transición, las principales novedades han confirmado varias tendencias que ya venían marcando el año: modelos generativos de imagen y vídeo cada vez más sofisticados, una apuesta clara por la IA multimodal y una creciente tensión competitiva entre los grandes actores tecnológicos.

Todo ello se combina con avances técnicos relevantes y movimientos estratégicos que apuntan a cómo será el ecosistema de IA en 2026.

La generación de imágenes entra en una nueva fase de madurez

Google ha vuelto a ocupar una posición destacada en generación de imágenes con la evolución de su ecosistema Gemini Image y la familia de modelos Nano Banana.

El modelo Gemini Pro ha ganado protagonismo por su equilibrio entre calidad visual, rapidez de generación y capacidades de edición integrada directamente desde prompts de texto.

Más allá de generar imágenes desde cero, estos modelos destacan por su capacidad para mantener consistencia visual entre múltiples iteraciones, algo especialmente valioso en contextos de branding, publicidad o producción visual acelerada.

Junto a los lanzamientos confirmados, durante el mes ha cobrado fuerza el rumor de un próximo Nano Banana 2 Flash, una versión más económica que buscaría acercarse a la calidad del modelo Pro reduciendo de forma significativa los costes de cómputo.

De confirmarse, este movimiento reforzaría la estrategia de Google de ofrecer distintos escalones de acceso a la generación visual avanzada, adaptados a diferentes necesidades y presupuestos.

En paralelo, el impacto de la IA en la creatividad no viene solo de los modelos generativos. Herramientas de diseño como Figma han incorporado funciones basadas en IA para eliminar, aislar o expandir objetos dentro de imágenes, integrando capacidades que hasta hace poco estaban reservadas a software especializado como Photoshop.

Este tipo de avances reduce barreras técnicas y acelera los flujos de trabajo, permitiendo que más perfiles puedan crear y editar contenido visual de forma profesional.

El vídeo generado por IA sigue avanzando… y genera nuevos debates

En generación de vídeo, diciembre no ha traído grandes anuncios completamente nuevos, pero sí la consolidación de modelos que ya marcan el estado del arte.

Sistemas como Veo continúan evolucionando con versiones capaces de generar vídeo con audio integrado y un nivel de realismo cada vez mayor a partir de texto o imágenes.

Al mismo tiempo, en la comunidad técnica han circulado mejoras de modelos como Runway Gen-4.5, que avanzan en fidelidad visual, adherencia al prompt y control temporal de las escenas, uno de los grandes retos del vídeo generado por IA.

Sin embargo, la noticia más llamativa del mes en este ámbito ha sido el movimiento estratégico de Disney. La compañía anunció una inversión de 1.000 millones de dólares en OpenAI, acompañada de un acuerdo que permite el uso legal de cientos de personajes icónicos en el generador de vídeo Sora.

Esto abre un escenario completamente nuevo para creadores y estudios, que podrían generar contenido con personajes como Mickey Mouse o franquicias de Marvel de forma oficial, aunque también ha reavivado el debate sobre derechos de autor, creatividad y el papel de la autoría humana.

Este movimiento vino acompañado de tensión legal. Disney envió una carta de cese y desistimiento a Google, acusando a la compañía de utilizar su propiedad intelectual sin permiso para entrenar y generar contenido con modelos como Veo, Imagen o Nano Banana.

Como consecuencia directa, Google retiró decenas de vídeos generados con personajes de Disney de plataformas como YouTube, evidenciando que la batalla legal por los datos y el entrenamiento de modelos seguirá siendo uno de los grandes temas de los próximos años.

Modelos y avances técnicos: competencia abierta y estrategias divergentes

En el terreno de los modelos base, diciembre ha sido especialmente significativo. NVIDIA ha anunciado el lanzamiento de Nemotron 3, una nueva familia de modelos abiertos diseñada para ser eficiente, transparente y fácilmente modificable por equipos de desarrollo.

Con distintas escalas de tamaño y potencia, Nemotron 3 refuerza la transición de NVIDIA desde su rol tradicional como proveedor de hardware hacia un actor cada vez más relevante en el desarrollo de modelos de IA, con un impacto potencial importante en el ecosistema open source.

Por su parte, OpenAI protagonizó uno de los movimientos más inesperados del mes con el lanzamiento extraordinario de GPT-5.2 el 11 de diciembre.

Este lanzamiento no formaba parte del calendario habitual y respondió a una directiva interna de “Código Rojo”, activada tras los excelentes resultados obtenidos por Gemini 3 en benchmarks publicados en noviembre.

La decisión refleja hasta qué punto la competencia entre OpenAI y Google se ha intensificado, acelerando ciclos de lanzamiento y priorizando la reacción rápida ante avances del rival.

Google, mientras tanto, optó por una estrategia complementaria. En lugar de centrarse únicamente en reforzar el modelo base, el 15 de diciembre presentó una actualización clave de su ecosistema de agentes con el lanzamiento del Gemini Deep Research Agent, impulsado por Gemini 3 Pro.

Este agente está orientado a tareas de investigación compleja y de largo recorrido, siendo capaz de descomponer preguntas amplias, planificar búsquedas, consultar múltiples fuentes y generar informes estructurados y citados de forma semi-autónoma.

El anuncio refuerza la apuesta de Google por llevar la IA más allá del chat y convertirla en una herramienta práctica para trabajo intelectual avanzado.

Diciembre confirma que la IA está entrando en una fase de madurez acelerada. La generación de imágenes y vídeo avanza hacia una mayor calidad, control y accesibilidad, los modelos base se refinan en un contexto de competencia feroz, y los agentes comienzan a posicionarse como una de las interfaces clave para interactuar con la IA en tareas complejas.

Lejos de desacelerar, el cierre del año deja claro que 2026 empezará con un ecosistema más potente, más competitivo y también más tensionado desde el punto de vista legal y ético.

Cuéntanos qué te parece.

Los comentarios serán moderados. Serán visibles si aportan un argumento constructivo. Si no estás de acuerdo con algún punto, por favor, muestra tus opiniones de manera educada.

Suscríbete