Descartes y los World Models

Descartes separó mente y cuerpo sin saber juntarlos; los LLM repitieron el error. Los World Models son el cuerpo que les falta, y hay 5.000 millones apostando.

Descartes y los World Models.

Ya sabía yo que lo de la filosofía no era buena idea. Desde que empecé el microgrado en Filosofía de la Ciencia no puedo dejar de ver patrones. Voy a intentar no ponerme demasiado pedante, pero no prometo nada.

En 1641, Descartes separó la mente del cuerpo. El pensamiento puro (res cogitans) por un lado, el mundo físico (res extensa) por otro. Genial como planteamiento, pero el problema es que luego no supo volver a juntarlos. Necesitó meter a Dios como pegamento. Literalmente.

La IA ha repetido exactamente el mismo error. Llevamos años construyendo LLMs: máquinas de pensamiento puro. Manipulan símbolos con una elegancia que sería la envidia de Descartes. Hablan de gravedad pero no saben lo que es caerse. Pueden describir un aplauso pero no pueden aplaudir.

Ahora llegan los World Models: modelos que aprenden la estructura de la causalidad, no del lenguaje. No predicen la siguiente palabra, predicen el siguiente estado del mundo en respuesta a una acción.

La diferencia es sutil pero enorme. Un modelo de vídeo genera secuencias que miras sin poder intervenir. Un World Model es un sueño lúcido: actúas y el mundo responde.

Hay una parte técnica detrás que me parece muy potente. Las acciones son la forma última de compresión. Cuando decides esquivar un charco en la calle tu cerebro procesa decenas de variables al mismo tiempo: la acera, el charco, el bus que viene, los peatones… y colapsa todo eso en un movimiento. Si te mira alguien no necesita saber qué pensaste, solo ve el resultado. Toda la complejidad queda comprimida en la acción.

Esto permite simular cosas que antes eran incomputables. Piensa en un concierto con 20.000 personas reaccionando al inicio de un temazo. En computación tradicional, simular las interacciones entre todos ellos tiene un coste que crece exponencialmente. En un World Model, un solo pase por la red neuronal. Coste fijo, independiente de la complejidad.

Los World Models no creo que vayan a sustituir a los LLMs, se apoyarán en ellos. El lenguaje condiciona al World Model: le dice qué escenario imaginar, qué objetivo perseguir. El LLM piensa y el World Model actúa. Mi apuesta es que serán complementarios.

Descartes separó mente y cuerpo y no supo juntarlos. Nosotros construimos primero la mente (LLMs) y ahora estamos construyendo el cuerpo (World Models). El pegamento ahora no es Dios, son las acciones.

Y esto de los modelos del mundo no es un nicho académico. Hay más de 5.000 millones de dólares invertidos en World Models en los últimos meses. Fei-Fei Li ($1B), Yann LeCun ($1B), NVIDIA, Google DeepMind. Cuando ves esos nombres y esas cifras juntas, conviene prestar atención.