Xiaomi acelera en IA: más de 16.000 millones de yuanes en 2026 y una familia MiMo V2 pensada para agentes
Xiaomi lleva años intentando demostrar que no es solo una marca de móviles baratos que salieron demasiado bien. Entre coches eléctricos, hogar conectado y wearables, la compañía ya venía ampliando su tablero. Pero ahora quiere entrar de lleno en otro terreno mucho más serio: la inteligencia artificial como plataforma. Y no con un anuncio tímido, precisamente. Su CEO, Lei Jun, dijo que Xiaomi invertirá al menos 60.000 millones de yuanes en IA durante los próximos tres años, y además señaló que el presupuesto de investigación en IA para 2026 ya superó la cifra previamente anunciada de 16.000 millones de yuanes.
Lo interesante no es solo el dinero. Xiaomi acompañó ese mensaje con producto real: la compañía presentó oficialmente MiMo-V2-Pro, MiMo-V2-Omni y MiMo-V2-TTS, una nueva familia de modelos pensada para empujar la era de los agentes de IA. Traducido al idioma humano: Xiaomi no quiere limitarse a tener un chatbot bonito; quiere modelos que planifiquen, usen herramientas, entiendan audio y video, y además puedan hablar con una voz más natural.
Lo más importante en resumen
- Xiaomi invertirá al menos 60.000 millones de yuanes en IA en los próximos tres años, y su presupuesto de IA para 2026 ya está por encima de los 16.000 millones de yuanes que había mencionado antes.
- La nueva familia MiMo V2 incluye un modelo principal para agentes (MiMo-V2-Pro), un modelo multimodal (MiMo-V2-Omni) y un modelo de voz (MiMo-V2-TTS).
- Xiaomi presenta MiMo-V2-Pro como un modelo para cargas de trabajo agentic del mundo real, con más de 1 billón de parámetros totales, 42.000 millones activos y soporte de hasta 1 millón de tokens de contexto.
- Reuters reportó que MiMo-V2-Pro, tras aparecer inicialmente de forma anónima en OpenRouter, ya había procesado más de 1,5 billones de tokens, señal de una recepción fuerte entre desarrolladores.
- Xiaomi ya había mostrado la dirección de su estrategia con MiMo-V2-Flash, un modelo open source con 309.000 millones de parámetros totales y 15.000 millones activos, orientado a razonamiento, código y flujos agentic.
Xiaomi ya no quiere estar solo en la conversación: quiere estar en la infraestructura
Aquí es donde la noticia se pone interesante. Muchas empresas hablan de IA como quien se compra una chaqueta nueva para no quedarse fuera de la fiesta. Xiaomi, en cambio, está intentando construir capas completas: modelo fundacional, acceso por API, herramientas para desarrolladores y productos beta sobre esa base. Es decir, no solo quiere “usar IA” en sus dispositivos; quiere tener su propia pila tecnológica para competir en el nuevo ciclo de software inteligente.
Eso también explica por qué la compañía está hablando de agentes y no solo de asistentes. Reuters apunta que en China la competencia se está moviendo desde chatbots más tradicionales hacia sistemas capaces de ejecutar tareas complejas con menos prompting, algo que consume más tokens y, en teoría, puede abrir nuevas vías de negocio. Xiaomi está entrando justo ahí.
Qué ha presentado exactamente Xiaomi con MiMo V2
MiMo-V2-Pro: el “cerebro” de la familia
MiMo-V2-Pro es el núcleo de la apuesta. Xiaomi lo describe como su modelo insignia para cargas agentic reales: orquestar flujos complejos, apoyar trabajo de ingeniería y actuar como cerebro de sistemas que no solo responden, sino que ejecutan. Según la página oficial, supera el billón de parámetros totales, usa 42.000 millones activos, soporta hasta 1 millón de tokens de contexto y se ofrece por API pública. Xiaomi también afirma que, según el índice de Artificial Analysis, el modelo se sitúa octavo a nivel mundial y segundo entre los LLM chinos.
Además, Xiaomi no lo está posicionando como un simple experimento de laboratorio. En su propia web asegura que MiMo-V2-Pro fue afinado para escenarios agentic con SFT y RL, y que trabaja con frameworks como OpenClaw, OpenCode, KiloCode, Blackbox y Cline. Esa parte importa porque muestra la ambición real: meter el modelo en flujos de trabajo, no dejarlo viviendo en una demo bonita.
MiMo-V2-Omni: ver, escuchar y actuar
Si Pro es el cerebro textual y operativo, MiMo-V2-Omni es la pieza que intenta sacar a Xiaomi del chatbox. La compañía lo presenta como un modelo que integra imagen, video, audio y texto dentro de una misma arquitectura, con soporte para tool calling, ejecución de funciones y grounding de interfaz. Xiaomi lo plantea para casos donde el agente no solo “lee”, sino que percibe el mundo y actúa sobre él.
La parte más agresiva del mensaje está en sus ejemplos: Xiaomi habla de análisis de riesgos en conducción autónoma, comprensión de audio largo de más de 10 horas y tareas agentic en navegadores, apps y flujos complejos. Incluso lo muestra creando un video y subiéndolo a TikTok con OpenClaw como capa de ejecución. Suena ambicioso, sí, pero al menos aquí hay una dirección clara: Xiaomi quiere entrar también en la carrera multimodal de verdad.
MiMo-V2-TTS: la voz como parte del agente
La tercera pata de la familia es MiMo-V2-TTS, centrada en síntesis de voz. Xiaomi la presenta como un modelo propio de speech synthesis entrenado con más de 100 millones de horas de datos de voz, pensado para darle a los agentes algo más que una lectura plana. La compañía promete control fino del estilo, conciencia emocional contextual, prosodia más natural y hasta capacidad de canto. Sí, un agente que además te puede salir artista. Nada mal para un martes. 😄
Más allá del marketing, esta pieza tiene sentido. Si la idea de Xiaomi es construir agentes multimodales útiles en móviles, hogar conectado, coche o servicios, la capa de voz no es un extra decorativo: es parte de la interfaz. Y ahí TTS deja de ser “un narrador bonito” para convertirse en una parte funcional del producto.
El detalle que muchos pasarán por alto: Xiaomi no empezó hoy
Aunque la noticia fuerte es MiMo V2, Xiaomi ya venía preparando el terreno. Su repositorio oficial en GitHub muestra MiMo-V2-Flash, un modelo open source tipo MoE con 309.000 millones de parámetros totales, 15.000 millones activos y foco en razonamiento, código y workflows agentic. Ese detalle cambia bastante la lectura: Xiaomi no llegó ayer a la IA; lo que pasa es que hasta ahora iba más silenciosa que otras marcas.
Y la señal más clara de que quiere llevar esto a producto real está en Xiaomi miclaw, un agente interactivo construido sobre MiMo que ya entró en beta cerrada, según publicaciones de la propia comunidad de Xiaomi. O sea: modelo, plataforma y primer intento de producto agentic. La foto empieza a cuadrar.
¿Por qué esta noticia importa de verdad?
Porque Xiaomi está intentando dejar de ser solo una empresa que integra tecnología ajena para convertirse en una que también compite en la capa fundacional. Y si eso sale medianamente bien, el impacto puede ir mucho más allá del laboratorio. Xiaomi tiene móviles, tablets, wearables, televisores, coche eléctrico, smart home y una base enorme de usuarios. Si conecta esa red de productos con modelos propios y agentes realmente funcionales, su posición puede volverse mucho más fuerte de lo que muchos esperaban.
La clave, claro, está en la ejecución. Una cosa es presentar una familia de modelos prometedora y otra muy distinta convertir eso en experiencias diarias que la gente quiera usar. En IA hemos visto demasiadas demos impresionantes que luego se derriten al primer uso serio. Xiaomi todavía tiene que demostrar consistencia, integración y producto. Pero esta vez, al menos, no parece humo vacío: hay inversión anunciada, modelos publicados, API abierta y primeras señales de adopción real entre desarrolladores.
Lo más honesto que se puede decir ahora mismo
No, Xiaomi no ha ganado la guerra de la IA por lanzar tres modelos y prometer miles de millones. Pero tampoco estamos ante una nota de prensa cualquiera. La compañía ha dejado claro que quiere jugar en serio, con presupuesto fuerte, una hoja de ruta agentic bastante definida y una familia MiMo V2 que cubre texto, multimodalidad y voz. Eso, en 2026, ya es bastante más que subirse a la moda.
La pregunta interesante ahora no es si Xiaomi “también hace IA”. La pregunta interesante es si puede convertir su ecosistema gigante de hardware y servicios en una ventaja competitiva real frente a rivales que hoy dominan la conversación. Y ahí, sinceramente, vale la pena mirar de cerca lo que haga en los próximos meses.
Mini FAQ
¿Xiaomi anunció 16.000 millones de dólares en IA?
No. Lo que Reuters reportó es que el presupuesto de investigación en IA de Xiaomi para este año ya superó la cifra previamente anunciada de 16.000 millones de yuanes, mientras que el plan a tres años asciende a 60.000 millones de yuanes.
¿La familia MiMo V2 es solo un chatbot?
No exactamente. Xiaomi la está planteando como una familia de modelos para la era de los agentes: MiMo-V2-Pro para tareas agentic, MiMo-V2-Omni para percepción multimodal y acción, y MiMo-V2-TTS para voz expresiva.
¿Ya hay un producto real basado en MiMo?
Sí, al menos en fase temprana. Xiaomi ya abrió una beta cerrada de Xiaomi miclaw, descrito por la propia comunidad como un producto interactivo construido sobre Xiaomi MiMo.
Conclusión
Xiaomi está mandando un mensaje muy claro: no quiere quedarse en la periferia de la IA. Quiere estar en el centro, con inversión fuerte, modelos propios y una visión donde los agentes tengan sentido dentro de un ecosistema real de productos. MiMo V2 no garantiza que vaya a destronar a nadie mañana, pero sí coloca a la compañía en una conversación donde antes muchos ni la mencionaban.
Y eso, para una marca que hasta hace no tanto muchos resumían en “móviles con buena relación calidad-precio”, ya es un cambio de escala bastante serio.
¿Te parece que Xiaomi puede convertirse en un jugador grande de la IA o todavía la ves un paso por detrás de los gigantes? Este tema tiene bastante jugo para debatir.


