El nacimiento de una nueva revolución.

Claude 3.5 Sonnet con Computer Use ve tu pantalla y controla el ratón: es lento y caro, pero es la primera vez que un LLM opera en el mundo real autónomamente.

Por primera vez, un modelo de lenguaje ve tu pantalla, mueve el ratón y actúa en el mundo real sin que nadie lo programe paso a paso. Es lento, es caro y todavía falla, pero el umbral que se acaba de cruzar no tiene marcha atrás. Voy con ello.

Hay veces que tienes el privilegio de ver nacer una revolución, y por aquí llevamos años viendo cómo los agentes autónomos, piezas de código basadas en LLMs (modelos de lenguaje de inteligencia artificial), se van desarrollando y creciendo. Todo lo que hemos visto hasta ahora eran líneas de programación que escupían texto en una consola negra y realizaban complejas operaciones por detrás.

Ayer, Anthropic lanzó una nueva versión de su modelo #Claude Sonet, la 3.5, que nos dejó impresionados. Sin embargo, lo que me ha parecido tan fascinante como ver un pollito salir del huevo es la nueva beta que han sacado con esta versión: Computer Use for Coding.

Se trata de un modelo que interactúa con el Mundo Real TM. El programa “ve” tu pantalla de ordenador y utiliza tu ratón y teclado, lo que le permite operar en el mundo real como si fuera una persona.

Sí, es lento, es caro, no va del todo fino… ¡PERO TIENES UN MODELO DE LENGUAJE USANDO TU PC, JOSÉ LUÍS!

Estos productos irán mejorando, harán cada vez más cosas y las harán mejor. El paso definitivo será cuando confiemos lo suficiente como para darles nuestra tarjeta de crédito para que compren por nosotros. En unos años (¿meses?) tendremos productos a los que les encargaremos sacar un billete de tren, y serán ellos los que se peleen con la web de Renfe.

We’re living in the future! (and increasingly so)

Enlace compartido: https://youtu.be/vH2f7cjXjKI?si=Jc0lJVrfQtWTEOzP