Hay una cierta tendencia a pensar que la inteligencia artificial llegó a resolver todos nuestros problemas y que somos superiores en todas las áreas. ¿Ganará Chatgpt Chess? Para verificar su capacidad de poder hacer un pequeño experimento:
Juguemos al ajedrez. Soy blanco: E4
El movimiento del ajedrez se puede reescribir al texto a través de lo que se conoce como notación algebraica estándar, por lo que el sistema que puede generar texto también puede generar movimientos del juego de ajedrez. En el ejemplo, mi oponente reaccionó bien y respondió un movimiento de respuesta razonable. De hecho, se usa más antes de mi movimiento inicial. El juego continuó así:
E4 E5 CF3 CC6 AC4 AC4 AC5 C3 CF6 OO D6 D6 D4 EXID4 CKSD4 AB6 CD2 OO AKSB6 AKSB6 TKSA8 DKSA8

El tablero después del octavo juego.
La figura muestra la placa como se ve después del octavo juego. Gracias a mi maestro de ajedrez, sé que es un juego completamente normal; Miles se pueden jugar en todo el mundo y mucho tiempo en el mundo.
Infiel
En el noveno juego, tuve una trampa para mi rival: sugerí un movimiento imposible, porque ninguna de las piezas blancas puede alcanzar la caja B6. El chatgpt no reveló la inconsistencia, el movimiento aceptado y continuó jugando. En la décima jugada, volví a crecer el movimiento imposible. En respuesta, mi rival continuó con otro movimiento imposible. Lo que comenzó como un juego normal, rápidamente se convirtió en una serie de jugadas completamente superiores.
Es curioso ver cuántos años hay software que puede ganar al mejor hombre, una herramienta que ha revolucionado completamente el panorama de la inteligencia artificial ni siquiera puede detectar movimientos ilegales en un juego muy simple. Y por esa razón, es una magnífica oportunidad para reflexionar sobre el papel desempeñado por un gran modelos de idiomas (LLM) en el mundo de la IA generativa.
Obsesión por responder (cualquier cosa)
La clave de la respuesta a mi noveno movimiento es trabajar en modelos de idiomas grandes: siempre están capacitados para ofrecer una respuesta, sin implicar que es cierto. En este caso, no es mejor ni peor movimiento, sino completamente fuera del sentido.
Un excelente modelo de idioma está entrenado con una tarea muy simple: predecir la siguiente palabra en un orden particular de palabras. Esta capacitación se perfeccionó de tal manera que, actualmente, los modelos pueden generar textos que coinciden perfectamente con la estructura del lenguaje. Es decir, podrían escribirlos.
La generación de texto adecuada no es suficiente para proporcionar funcionalidad comunitaria. Por lo tanto, LLMS se combina con los sistemas de búsqueda de información: podemos especificar el sistema para que pueda extraer de un fragmento de texto grande que contenga una respuesta a la pregunta que hemos hecho previamente.
Además, puede reformular el texto para responder exactamente la pregunta. De hecho, es la base de un sistema de ropa (descarga de generación), capaz de buscar y difundir información.
Es, la capacidad de responder lo que preguntamos es, esencialmente, la capacidad de buscar una respuesta en los textos existentes junto con la posibilidad de reescribir el texto para que la respuesta esté conscientemente acordada con la respuesta.
¿Una buena conversación es sinónimo de inteligente?
Los usuarios atribuyen inconscientemente la inteligencia a este comportamiento, lo cual es realmente muy humano: estamos pronunciados de que la inteligencia se acredita con una persona con buena retórica. Incluso hay estudios que confirman esta conexión.
Este efecto de la inteligencia es limitado, y debemos ser conscientes de este límite, para generar textos con buen lenguaje, incluso cuando usa grandes modelos de resonación grandes (grandes modelos de razonamiento, LRM, entrenados para resolver tareas de razonamiento en varios pasos.

Problema de resolución con Hanoi Tower con cuatro álbumes. Wikimedia Commons., CC de
Como podemos leer en un estudio llamado Illusion of Thinking, los principales investigadores Parshin Shojaee, estos grandes modelos fallan en voz alta cuando probamos sistemáticamente su sentido de razonabilidad. En este artículo, los autores usaron modelos de lenguaje para resolver problemas como un rompecabezas conocido como la Torre Hanian y verificaron que la IA generativa no puede encontrar una solución cuando seis o más discos son complejos.
Programas de ajedrez
Volviendo al caso del ajedrez, sabemos que hay programas como un cuartel o Alphazera, capaces de superar a cualquier hombre. Sin embargo, no, sin embargo, los sistemas basados en modelos de lenguaje, sino que usan otras tecnologías.
Por otro lado, los trabajos de investigación como Chessbench, que aplica la tecnología utilizada en LLM para construir sistemas profesionales en el juego de ajedrez. En lugar de anticipar la siguiente palabra de oración, lo que predice el ajedrez es el próximo movimiento de la cuerda.
No es una buena idea ejecutar chatgpt
Experimentos como el que comienza este artículo nos recuerda que la capacidad de generar textos no significa necesariamente la capacidad de pensar, razón. No debemos atribuir las cualidades de los modelos de idiomas que no tienen.
Sería un error delegar las tareas que nuestro cerebro necesita para trabajar, porque estamos en peligro de mantener textos estructuralmente correctos, pero con errores tan obscenos como si comiera fianza en B6 cuando es claramente imposible moverse.
0 Comentarios