Los modelos de lenguaje a gran escala (LLM), como ChatGPT y Google Bard, han demostrado ser útiles para responder a ciertos tipos de preguntas. Sin embargo, a pesar de ser computadoras, aparentemente resultan ser bastante malas para realizar tareas de cálculo. Google ha desarrollado una solución para mejorar la capacidad de estos modelos de lenguaje en tareas computacionales simples, como matemáticas y manipulación de cadenas: hacer que la inteligencia artificial escriba un programa.
Cuando se le formula una pregunta computacional a Google Bard, en lugar de mostrar la respuesta generada por el modelo de lenguaje, este escribe un programa, lo ejecuta y luego muestra el resultado del programa al usuario como respuesta. Esto significa que Google Bard es capaz de resolver problemas que requieren un enfoque más sistemático y lógico.
Para ilustrar cómo funciona Google Bard, se le pide que invierta la palabra "Piruleta", por ejemplo. ChatGPT, el otro modelo de lenguaje no sería capaz de resolver correctamente esta tarea y proporcionaría una respuesta incorrecta, como "ateluruP", debido a que los modelos de lenguaje ven el mundo en fragmentos de palabras o "tokens" y no suelen ser buenos en este tipo de tareas.
Google Bard no solo proporciona la respuesta correcta "ateLurulP", sino que también muestra el código Python que escribió para resolver el problema. Aunque esto puede resultar interesante para los entusiastas de la programación, puede ser confuso y poco relevante para los usuarios comunes. Sin embargo, es un avance significativo en la capacidad de los modelos de lenguaje para resolver problemas computacionales.
El enfoque de Google para lograr que su inteligencia artificial escriba código se inspira en la dicotomía entre dos tipos de pensamiento humano, como se describe en el libro "Pensando, rápido y lento" de Daniel Kahneman:
El pensamiento del Sistema 1 es rápido, intuitivo y sin esfuerzo. Por ejemplo, cuando un músico de jazz improvisa en el momento o alguien escribe rápidamente en un teclado sin mirar las teclas, está utilizando el pensamiento del Sistema 1.
El pensamiento del Sistema 2 es lento, deliberado y requiere esfuerzo. Por ejemplo, cuando alguien realiza una división larga o aprende a tocar un instrumento, está utilizando el pensamiento del Sistema 2.
En esta analogía, los LLM operan principalmente bajo el pensamiento del Sistema 1, generando texto rápidamente, pero sin reflexión profunda. Esto les permite realizar tareas increíbles, pero también les hace fallar en otras, como resolver problemas matemáticos. Por otro lado, la programación se asemeja más al pensamiento del Sistema 2: es sistemática e inflexible, pero puede producir resultados impresionantes si se siguen los pasos adecuados.
El método de escribir y ejecutar código en tiempo real de Google Bard es útil para responder preguntas como: "¿Cuáles son los factores primos de 15683615?" y "Calcula la tasa de crecimiento de mis ahorros". La compañía afirma que este método ha mejorado la precisión de las respuestas de Google Bard a problemas de palabras y matemáticas computacionales en aproximadamente un 30%.
Sin embargo, Google también advierte que Google Bard puede no obtener la respuesta correcta siempre, ya que puede interpretar mal la pregunta o escribir un código que no funcione a la primera, como nos sucede a todos.
Google Bard es un ejemplo innovador de cómo la inteligencia artificial puede mejorar para realizar tareas computacionales simples, como matemáticas y manipulación de cadenas. Al escribir y ejecutar código en tiempo real, Google Bard tiene el potencial de mejorar la precisión y la utilidad de los modelos de lenguaje en una variedad de aplicaciones. A pesar de sus limitaciones y desafíos actuales, Google Bard representa un paso emocionante en la evolución de la inteligencia artificial y los modelos de lenguaje.