Google ha dado un paso más en la integración de inteligencia artificial en robótica con el lanzamiento de Gemini Robotics y Gemini Robotics-ER. Estos modelos especializados, desarrollados por DeepMind, prometen revolucionar la capacidad de los robots para adaptarse a su entorno, ejecutar tareas complejas y comprender mejor el mundo físico.
¿Qué es Gemini Robotics y qué lo hace diferente?
Gemini Robotics es una familia de modelos de IA que utiliza Gemini 2.0 como base para mejorar la interacción entre robots y su entorno. Su enfoque se divide en tres áreas clave:
- Adaptabilidad: permite que los robots aprendan sobre la marcha y realicen tareas para las que no fueron programados.
- Interacción: los robots pueden comprender instrucciones en tiempo real y adaptarse a cambios en el entorno.
- Destreza: mejora la ejecución de tareas que requieren motricidad fina, como manipular objetos con precisión.
Estos avances buscan superar las limitaciones actuales de la robótica, especialmente en la manipulación de objetos y la toma de decisiones en entornos dinámicos.
Gemini Robotics vs. Gemini Robotics-ER: ¿cuál es la diferencia?
Aunque ambos modelos están basados en Gemini 2.0, tienen enfoques distintos:
- Gemini Robotics es un modelo de visión-lenguaje-acción, diseñado para que los robots ejecuten acciones físicas con mayor precisión.
- Gemini Robotics-ER es un modelo de visión-lenguaje, que optimiza la comprensión espacial y mejora el reconocimiento de objetos tridimensionales.
Ambos sistemas trabajan en conjunto para permitir que los robots interpreten mejor el entorno y ejecuten tareas con mayor autonomía.
Ejemplo de su funcionamiento: el caso de la taza de café
Uno de los ejemplos más concretos de Gemini Robotics-ER es su capacidad para aprender sobre la marcha. Google explicó que si el robot observa una taza de café, la inteligencia artificial puede deducir cómo sujetarla correctamente y cuál es la trayectoria más segura para acercarse a ella, sin necesidad de instrucciones adicionales.
Este nivel de autonomía es crucial para la evolución de la robótica, especialmente en la creación de robots humanoides funcionales en entornos cotidianos.
Colaboraciones con Apptronik y Boston Dynamics
Para expandir el alcance de Gemini Robotics, Google ha colaborado con empresas líderes en robótica, incluyendo:
- Apptronik, creadores del robot bípedo Apollo, con quien Google trabaja en el desarrollo de nuevos robots humanoides basados en Gemini 2.0.
- Boston Dynamics, conocida por sus robots avanzados como Spot y Atlas, ha sido una de las empresas elegidas para probar Gemini Robotics-ER.
Además, Google ha señalado que la tecnología no solo está diseñada para robots humanoides, sino que puede aplicarse a diferentes tipos de máquinas, desde brazos robóticos con pinzas hasta sistemas de automatización industrial.
Un paso más en la evolución de la robótica
Con el lanzamiento de Gemini Robotics, Google se posiciona en la vanguardia de la inteligencia artificial aplicada a la robótica. La capacidad de estos nuevos modelos para aprender, adaptarse y ejecutar tareas con mayor precisión abre la puerta a una nueva generación de robots más autónomos y eficientes.
A medida que estas tecnologías evolucionen, su impacto podría extenderse a múltiples sectores, incluyendo la industria, la salud, la logística y el hogar.