Dos pioneros de la IA ganan el premio Turing

El equivalente al Nobel en el mundo tecnológico

Redacción
Ciencia
Share
Centro de datos en el parque tecnológico Sedenak en Malasia.
Foto: AP

Mountain View, California, EU, 5 de marzo. Enseñar a las máquinas de forma parecida a los entrenadores de animales que moldean el comportamiento de perros o caballos ha sido un método importante para desarrollar la inteligencia artificial (IA) y uno que fue reconocido con el máximo galardón en informática.

Dos pioneros en el campo del aprendizaje por refuerzo, Andrew Barto y Richard Sutton, son los ganadores del Premio A.M. Turing de este año, el equivalente al Nobel en el mundo tecnológico.

La investigación que Barto, de 76 años, y Sutton, de 67, comenzaron a finales de la década de 1970 allanó el camino para algunos de los avances en inteligencia artificial de la última década. Su trabajo giraba en torno a emplear máquinas denominadas “hedonistas” que podían adaptar continuamente su comportamiento en respuesta a señales positivas.

El aprendizaje por refuerzo es lo que llevó a un programa informático de Google a vencer a los mejores jugadores humanos de go, un antiguo juego de mesa chino, en 2016 y 2017. También ha sido una técnica clave para mejorar herramientas de inteligencia artificial populares como ChatGPT, optimizar el comercio financiero y ayudar a una mano robótica a resolver un cubo de Rubik.

Pero Barto señaló que el campo “no estaba de moda” cuando él y su estudiante de doctorado, Sutton, comenzaron a elaborar sus teorías y algoritmos en la Universidad de Massachusetts, Amherst.

“Estábamos un poco en la oscuridad”, indicó Barto en una entrevista con la agencia The Associated Press. “Por eso es tan gratificante recibir este premio, ver que esto se está reconociendo más como algo relevante e interesante. En los primeros días, no lo era.”

Google patrocina el premio anual de un millón de dólares, que fue anunciado este día por la Association for Computing Machinery.

Barto, ahora retirado de la Universidad de Massachusetts, y Sutton, un profesor veterano en la Universidad de Alberta en Canadá, no son los primeros pioneros de la inteligencia artificial en ganar el premio que lleva el nombre del matemático británico, descifrador de códigos y estudioso temprano de la IA Alan Turing. Pero su investigación ha buscado directamente responder al desafío de Turing en 1947 de crear una máquina que “pueda aprender de la experiencia”, lo que Sutton describe como “sin duda la idea esencial del aprendizaje por refuerzo”.

En particular, tomaron prestadas ideas de la psicología y la neurociencia sobre la forma en que las neuronas buscan placer en su respuesta a recompensas o castigos. En un artículo fundamental publicado a principios de la década de 1980, Barto y Sutton aplicaron su nuevo enfoque a una tarea específica en un mundo simulado: equilibrar un palo en un carro en movimiento para evitar que se caiga. Los dos científicos informáticos más tarde coescribieron un libro de texto muy utilizado sobre el aprendizaje por refuerzo.

“Las herramientas que desarrollaron siguen siendo un pilar central del auge de la inteligencia artificial y han generado avances importantes, atraído legiones de jóvenes investigadores y impulsado miles de millones de dólares en inversiones”, dijo Jeff Dean, científico jefe de Google, en un comunicado escrito.