fbpx
Close

Login

Close

Register

Close

Lost Password

Google I/O 2024: los anuncios más destacados en IA

La conferencia central del Google I/O 2024 se centró en avances en IA, mejoras en Gemini y en su integración con productos de la compañía.

En su conferencia anual de desarrolladores, Google I/O, el gigante de las búsquedas destacó su enfoque en la inteligencia artificial con una serie de actualizaciones de software. El foco estuvo en Gemini, su modelo de IA generativa tanto en sus versiones más avanzadas, como las que podemos encontrar en Vertex AI, como en aquellas diseñadas para ofrecer ayuda a los usuarios menos avanzados.

Gemini Nano

Gemini Nano

Google presentó una importante actualización a su modelo de lenguaje para dispositivos móviles, el Gemini Nano, ahora rebautizado como Gemini Nano con Multimodalidad. Según Sundar Pichai, CEO de Google, esta nueva capacidad del modelo permite “convertir cualquier entrada en cualquier salida”. Esto significa que Gemini Nano puede ahora procesar información de diversas fuentes como texto, fotos, audio, contenido web y vídeos en directo, y utilizarla para generar resúmenes o responder preguntas específicas. Un ejemplo mostrado durante la conferencia fue una demostración en la que una persona escaneaba los libros de una estantería usando la cámara de su teléfono y los títulos se guardaban automáticamente en una base de datos.

Gemini 1.5 Pro disponible para todos

Gemini Pro

Además, Google ha hecho disponible Gemini 1.5 Pro, su sistema de IA basado en la nube más potente, para desarrolladores en todo el mundo. Esta herramienta busca facilitar a los desarrolladores el acceso a tecnología avanzada de IA, permitiéndoles incorporar estas capacidades en sus propias aplicaciones.

Mejoras en Google Fotos

ask photos

Google ha mejorado Google Photos con Ask Photos, una nueva herramienta de búsqueda avanzada que permite a los usuarios buscar en sus fotos de manera más detallada. Utilizando la función Ask Photos, los usuarios pueden solicitar a Gemini que busque en sus fotos y proporcione resultados más específicos. Por ejemplo, al introducir un número de matrícula, el sistema utiliza pistas contextuales para localizar el automóvil en todas las fotos almacenadas. Jerem Selier, ingeniero de software de Google Photos, aseguró en una publicación de blog que esta función no recopila datos de las fotos para otros usos fuera de Google Photos, como servir anuncios o entrenar otros modelos de IA de Gemini. Ask Photos será lanzada este verano.

Gemini en Workplace

circle of search

Google está incorporando inteligencia artificial en su suite de herramientas de oficina, Workplace. Desde hoy, un botón para activar la IA de Gemini estará disponible en el panel lateral de varias aplicaciones de Google, como Gmail, Google Drive, Docs, Sheets y Slides. Este asistente de IA puede responder preguntas, ayudar a redactar correos y documentos, o generar resúmenes de documentos extensos o cadenas de correos electrónicos.

Más allá de las aplicaciones laborales, Google introdujo funciones dirigidas a los padres, como chatbots de IA que pueden asistir a los estudiantes con sus tareas o resumir reuniones. La función Circle to Search, presentada a principios de este año, también recibió actualizaciones y pronto ayudará a los estudiantes a resolver problemas matemáticos.

Las integraciones de Workplace con Gemini fueron un punto focal en la presentación de I/O. Entre ellas, se encuentra un compañero de IA integrado en aplicaciones como Docs y Gmail, llamado en la demostración como “Chip”, que actúa como un asistente de productividad que puede coordinar comunicaciones, seguir proyectos, organizar tareas y monitorear asignaciones, similar a un Slackbot mejorado.

Finalmente, se mostró Gems, una nueva función que permite establecer rutinas automatizadas para tareas que los usuarios desean que Gemini realice regularmente. Estas rutinas pueden activarse mediante comandos de voz o textos.

Gemini 1.5 Flash

gemini flash 1

Google ha introducido dos nuevos modelos de su inteligencia artificial Gemini, cada uno diseñado para optimizar diferentes tipos de tareas. El modelo Gemini 1.5 Flash se destaca por su rapidez y baja latencia, siendo especialmente adecuado para aplicaciones donde el tiempo de respuesta es crítico.

Gemini 1.5 Flash ya está disponible desde la consola de Vertex AI en Google Cloud para desarrolladores. En Crónicatech hemos empezado a realizar pruebas (gran parte de este artículo fue ayudado a construir con el modelo) y hemos podido constatar que el modelo parece ser alrededor de 30-40 % más rápido que el modelo Gemini 1.5 Pro. Este avance en términos de velocidad conlleva a que los ‘outputs’ (es decir, las respuestas) del modelo se den casi de forma instantánea.

Por otro lado, Project Astra representa una evolución del Google Lens. Project Astra funciona como un asistente visual que permite a los usuarios interactuar con su entorno de manera más intuitiva. Con la cámara de un teléfono, los usuarios pueden hacer preguntas sobre objetos o escenarios específicos que los rodean. En la demostración realizada en vivo se vio cómo Astra puede responder a una serie de preguntas consecutivas sobre el entorno, desde identificar la ciudad en la que se encuentra el usuario hasta detalles complejos como el funcionamiento de código en una pantalla de computadora o inventar un nombre creativo para una banda. Astra también se demostró operando a través de una cámara integrada en unas gafas inteligentes, destacando su avanzada comprensión espacial y contextual.

Modelo de generación de imágenes y video

imagefx google

En la misma línea de innovación, Google también destacó el lado creativo de sus desarrollos en IA con nuevas herramientas de la división experimental de IA, Google Labs.

Una de estas herramientas es VideoFX, un modelo de video generativo que trabaja con el generador de video de Google DeepMind, denominado Veo. Este modelo permite crear videos de 1080p a partir de indicaciones de texto, ofreciendo una flexibilidad significativa en el proceso de producción. Su fecha de lanzamiento no fue anunciada.

Además, Google ha mejorado ImageFX con el modelo Image 3, un generador de imágenes de alta resolución que reduce la incidencia de artefactos digitales no deseados en las imágenes generadas, y mejora la interpretación de las indicaciones del usuario para crear imágenes más precisas. Quienes desean probar esta herramienta pueden solicitar acceso a través de labs.google.com

Otra innovación presentada fue el DJ Mode en MusicFX, un generador de música de IA que permite a los músicos crear bucles y muestras de canciones basándose en indicaciones textuales. Esta función fue destacada durante la actuación de Mark Rebillet en la conferencia, mostrando su aplicabilidad en contextos creativos y de entretenimiento.

Google sigue adelante con su plan de expandir la IA a sus resultados de búsqueda

ai overview

Google se mantiene incólume en su propósito de integrar la IA a sus resultados de búsqueda. Las nuevas funcionalidades incluyen una búsqueda organizada por IA que mejora la presentación y legibilidad de los resultados, así como la capacidad de proporcionar respuestas más precisas a consultas complejas y búsquedas basadas en imágenes.

Otra innovación son los resúmenes de IA, que compilan información de diversas fuentes para responder preguntas directamente en los resultados de búsqueda, eliminando la necesidad de visitar otros sitios web. Aunque estos resúmenes han generado controversia entre los editores, que temen perder visitas y relevancia, ya están disponibles para todos los usuarios en los EE. UU. desde hoy y estarán disponibles para el mundo entero a finales de 2024.

Además, Google ha introducido el “Multi-Step Reasoning”, una función que permite desglosar búsquedas en múltiples capas de información para consultas que requieren un análisis más profundo. Un ejemplo dado por Google fue la planificación de un viaje, donde la búsqueda en Maps no solo localiza hoteles, sino que también sugiere itinerarios de transporte y opciones de restaurantes, permitiendo a los usuarios profundizar en detalles como tipos de cocina o alternativas vegetarianas.

Lee también: ¿Google dejará de ser gratis en 2024? Análisis

Para este tipo de consultas, Google puede llegar a generar una página de resultados basada en diferentes clusters (o bloques de contenido) completamente generados por IA. A simple vista, parece tratarse de colecciones de rich snippets, lo que conlleva a pensar que la optimización SEO se concentrará en la implementación de schemas (o datos estructurados en español).

Algunos expertos en SEO han señalado que Google ha empezado a introducir una nueva pestaña en los resultados de búsqueda llamada “Web”, donde solo se muestran los listados de links azules tradicionales. Se desconocen los alcances de esta aproximación en términos de experiencia de usuario.

Finalmente, se mostró una demostración de cómo Google Lens puede responder a preguntas sobre objetos apuntados por la cámara del usuario, una funcionalidad similar a la de Project Astra pero integrada de forma diferente en Lens. En la demostración, Lens ayudó a una usuaria a ajustar un tocadiscos supuestamente roto, identificando el problema específico y ofreciendo soluciones detalladas, incluyendo el modelo y la marca del dispositivo.

Seguridad y protección

synthID google

Al final del Google I/O se introdujo una novedosa función de seguridad para Android, diseñada específicamente para la detección de estafas telefónicas. Esta función puede monitorizar llamadas en tiempo real y detectar lenguaje sospechoso que pueda indicar un intento de estafa, como solicitudes para transferir dinero a cuentas desconocidas.

En caso de detectar un posible fraude, la función interrumpe automáticamente la llamada y sugiere al usuario que cuelgue, mejorando significativamente la seguridad durante las comunicaciones telefónicas.

Un aspecto destacado de esta herramienta es que opera directamente en el dispositivo, asegurando que las llamadas no se envíen a la nube para su análisis, lo que protege la privacidad del usuario.

Además, Google ha mejorado su herramienta SynthID, diseñada para identificar medios generados por inteligencia artificial. Esta herramienta aplica una marca de agua digital imperceptible a simple vista pero detectable mediante análisis de datos a nivel de píxeles, lo que ayuda a identificar contenido falso o manipulado, como deepfakes o spam de phishing.

Las actualizaciones recientes han expandido la capacidad de SynthID para analizar contenido dentro de la aplicación Gemini, en la web y en videos producidos por el generador Veo de Google. Google ha anunciado planes para hacer de SynthID una herramienta de código abierto, disponible para el público a finales de este verano, lo que permitirá a los desarrolladores y al público en general beneficiarse de esta tecnología avanzada en la detección de contenido auténtico versus generado por IA.

Hardware: Trillium y Axion

trillium gemini

Google anunció Trillium, su sexta generación de procesadores Tensor. Los nuevos chips Trillium, que estarán disponibles más adelante este año y son 4,7 veces más rápidos que sus predecesores, mientras Google compite con otros que también están desarrollando nuevos chips de IA. Pichai también destacó Axion, la primera CPU de Google basada en ARM, que la compañía anunció el mes pasado. Además, Google será “una de las primeras” compañías de la nube en ofrecer la GPU Blackwell de Nvidia a partir de 2025.

Anuncios

Suscríbete

Recibe los últimos artículos en tu correo electrónico:

Síguenos

El autor

Edgar Medina es el fundador de Crónicatech. Ha escrito para medios reconocidos como El Tiempo, revista Donjuán, Portafolio, La República, revista Semana y Canal RCN. Ha trabajado en marketing digital con candidatos presidenciales, entidades del sector público como Icetex y la Alcaldía de Bogotá.
0
0

    Escribe tus comentarios

    Tu dirección de correo no será publicada Los campos requeridos marcados con *

    ¡Gracias por tu comentario!

    Anuncios

    Suscríbete

    Recibe los últimos artículos en tu correo electrónico:

    Síguenos

    El autor

    Edgar Medina es el fundador de Crónicatech. Ha escrito para medios reconocidos como El Tiempo, revista Donjuán, Portafolio, La República, revista Semana y Canal RCN. Ha trabajado en marketing digital con candidatos presidenciales, entidades del sector público como Icetex y la Alcaldía de Bogotá.