divulgacion

Tenemos IA para rato: Los modelos razonadores y el futuro de la inteligencia artificial.

O3 resuelve el 88% de los test ARC donde O1 llegaba al 25%: los modelos razonadores demuestran que el supuesto muro de la IA era una limitación de arquitectura.

Juan Antonio Casado

30 dic. 2024 • 4 min de lectura

Creado: 2024-12-30 16:11

Seguro que habéis leído que la #InteligenciaArtificial estaba chocando contra un muro, un punto de estancamiento, debido a la falta de datos para entrenar modelos más potentes. Pues bien, para terminar el año OpenAI nos ha sorprendido con un avance que, si bien ha pasado desapercibido para los medios generalistas, podría redefinir el avance en el corto y medio plazo de la #IAGenerativa: los modelos razonadores.

La reciente presentación de O3 , el modelo que sigue a O1 (ya, el naming y OpenAI) que ya presentó el pasado septiembre, es una de las noticias más importantes del año no sólo por la potencia del modelo en sí, de la que hablaremos ahora, sino porque ha mostrado un camino diferente hacia el desarrollo de sistemas más capaces y eficientes. ¿Qué implica esto y cómo podría cambiar el futuro de la IA?

De modelos de lenguaje a modelos razonadores

Para entender el impacto de este nuevo modelo recordemos el marco que Sam Altman , CEO de OpenAI, propuso para entender las etapas clave en el desarrollo de la #IA dividiendo su avance en cinco niveles fundamentales:

Nivel 1: Chatbots : Sistemas de IA conversacional que dominan el lenguaje humano y pueden interactuar de manera efectiva en tareas básicas.
Nivel 2: Razonadores : Modelos que alcanzan un nivel de resolución de problemas comparable al humano, abordando problemas abstractos y desafiantes.
Nivel 3: Agentes : Sistemas que no solo comprenden y razonan, sino que también pueden tomar acciones en el mundo real para cumplir objetivos.
Nivel 4: Innovadores : IA que puede contribuir directamente a la invención y la innovación, generando ideas y diseños nuevos.
Nivel 5: Organizaciones : Sistemas de IA que operan como entidades completas, capaces de realizar el trabajo de una organización entera de manera eficiente y autónoma.

Para entender mejor este avance, veamos los tipos de modelos que OpenAI, con la competencia pisándoles los talones, ha desarrollado hasta ahora:

Modelos de lenguaje : Diseñados para procesar y generar texto. Son los más conocidos por el público, como GPT-4. Estos modelos dominan el lenguaje y generan respuestas rápidas y coherentes.
Agentes : Extensiones de los modelos de lenguaje que pueden ejecutar tareas complejas mediante la integración de acciones múltiples en entornos definidos. Estamos avanzando tímidamente en este área y han prometido noticias en 2025 en este campo.
Modelos razonadores : La última y más prometedora categoría. Se enfocan en resolver problemas abstractos y complejos mediante cadenas de pensamiento más largas y profundas, priorizando el razonamiento sobre la mera intuición lingüística. Aquí estarían los modelos O1 y O3.

Además, el lanzamiento de O3 nos demuestra que estos conceptos no son excluyentes, se integran para crear sistemas más potentes.

El reto de los test de evaluación

Estas cosas las soluciona O3 con la gorra (arc prize)

Desde que empezamos a evaluar modelos de IA nos hemos basado en diferentes tipos de test para ser capaces de medir su “inteligencia”. Hasta ahora usábamos algunas pruebas y métricas pero se estaban empezando a saturar. Si los resultados están sistemáticamente por encima del 90% es difícil ver si los modelos realmente mejoran.

Además, cada uno de estos test medía un solo tipo de ejercicios, con lo que un modelo podía ser muy bueno haciendo una tarea pero eso no garantiza que sea capaz de extrapolar ese conocimiento a otra diferente.

Hace unos años, el investigador François Chollet diseñó un conjunto de pruebas para evaluar la capacidad de generalización de los sistemas de IA, los test ARC (Abstraction and Reasoning Corpus).

A diferencia de las pruebas tradicionales, los test ARC miden la inteligencia como la habilidad de aprender nuevas habilidades y adaptarse a problemas completamente nuevos.

O3 sorprendió a todos al lograr unos resultados sin precedentes en estas pruebas. Mientras que los modelos anteriores resolvían apenas un 2% de los problemas más difíciles y O1 estaba en un sorprendente 25%, O3 ha alcanzado casi un 88% en modo de alto cómputo, acercándose al nivel de un ser humano promedio. Esto cambia el paradigma de la IA generativa y demuestra que los modelos razonadores no solo imitan patrones, sino que también pueden desarrollar estrategias complejas para resolver retos abstractos.

La evolución hacia la AGI

El éxito de O3 nos hace plantearnos muchas preguntas sobre el camino hacia la Inteligencia Artificial General (AGI). Aunque estamos lejos de alcanzar una AGI completamente funcional, los avances en modelos razonadores abren una puerta significativa. Los sistemas como O3 demuestran que es posible superar las limitaciones de los datos de entrenamiento tradicionales mediante cadenas de pensamiento más profundas y tiempos de inferencia más largos. Cuando parece que hemos llegado al límite de enseñar a los modelos, podemos mejorar la salida poniendo esfuerzo en pensar y razonar la respuesta.

Barato, barato, … no es que salga

Sin embargo, también hay que tener cautela. A pesar de sus impresionantes resultados, los modelos razonadores como O3 son MUY caros en términos de cómputo y energía. Esto plantea un desafío para su escalabilidad y aplicación masiva. Además, como lo señala Chollet, la verdadera inteligencia no es solo resolver problemas conocidos, sino transferir ese conocimiento a dominios completamente nuevos, algo que O3 ha esbozado pero aún no hemos visto plenamente.

Hacia un futuro prometedor

El avance representado por O3 no solo reactiva el entusiasmo en la comunidad tecnológica, sino que también pone el foco en la necesidad de redefinir cómo medimos y evaluamos la inteligencia artificial. Si bien los test ARC han sido una referencia crucial, el próximo desafío será diseñar pruebas aún más complejas que desafíen las capacidades emergentes de estos sistemas.

Dónde está el muro, que yo lo vea (ARC AGI)

A medida que avanzamos hacia 2025 queda claro que la IA sigue teniendo mucho por ofrecer. Los modelos razonadores podrían ser el puente hacia una nueva generación de sistemas más inteligentes y adaptativos. La clave estará en equilibrar el entusiasmo con una evaluación crítica de sus capacidades y limitaciones.

El camino hacia la AGI será largo y lleno de desafíos, pero con avances como O3, queda claro que seguimos avanzando en la dirección correcta.

¿Cuál es tu punto de vista?

De modelos de lenguaje a modelos razonadores

El reto de los test de evaluación

La evolución hacia la AGI

Hacia un futuro prometedor

Sign up for more like this.