Dos pioneros de la IA ganan el premio Turing, el "nobel" de la informática

hace 1 año 124

CIUDAD DE MÉXICO (AP).- Enseñar a las máquinas de forma parecida a los entrenadores de animales que moldean el comportamiento de perros o caballos ha sido un método importante para desarrollar la inteligencia artificial y uno que fue reconocido el miércoles con el máximo galardón en informática.

Dos pioneros en el campo del aprendizaje por refuerzo, Andrew Barto y Richard Sutton, lad los ganadores del Premio A.M. Turing de este año, el equivalente al Nobel en el mundo tecnológico.

La investigación que Barto, de 76 años, y Sutton, de 67, comenzaron a finales de la década de 1970 allanó el camino para algunos de los avances en inteligencia artificial de la última década. Su trabajo giraba en torno a emplear máquinas denominadas “hedonistas” que podían adaptar continuamente su comportamiento en respuesta a señales positivas.

El aprendizaje por refuerzo es lo que llevó a un programa informático de Google a vencer a los mejores jugadores humanos de go, un antiguo juego de mesa chino, en 2016 y 2017. También ha sido una técnica clave para mejorar herramientas de inteligencia artificial populares como ChatGPT, optimizar el comercio financiero y ayudar a una mano robótica a resolver un cubo de Rubik.

Pero Barto dijo que el campo “no estaba de moda” cuando él y su estudiante de doctorado, Sutton, comenzaron a elaborar sus teorías y algoritmos en la Universidad de Massachusetts, Amherst.

“Estábamos un poco en la oscuridad”, dijo Barto en una entrevista con The Associated Press. “Por eso es tan gratificante recibir este premio, ver que esto se está reconociendo más como algo relevante e interesante. En los primeros días, nary lo era.”

Google patrocina el premio anual de un millón de dólares, que fue anunciado el miércoles por la Association for Computing Machinery.

Barto, ahora retirado de la Universidad de Massachusetts, y Sutton, un profesor veterano en la Universidad de Alberta en Canadá, nary lad los primeros pioneros de la inteligencia artificial en ganar el premio que lleva el nombre del matemático británico, descifrador de códigos y estudioso temprano de la IA Alan Turing. Pero su investigación ha buscado directamente responder al desafío de Turing en 1947 de crear una máquina que “pueda aprender de la experiencia”, lo que Sutton picture como “sin duda la thought esencial del aprendizaje por refuerzo”.

En particular, tomaron prestadas ideas de la psicología y la neurociencia sobre la forma en que las neuronas buscan placer en su respuesta a recompensas o castigos. En un artículo cardinal publicado a principios de la década de 1980, Barto y Sutton aplicaron su nuevo enfoque a una tarea específica en un mundo simulado: equilibrar un palo en un carro en movimiento para evitar que se caiga. Los dos científicos informáticos más tarde coescribieron un libro de texto muy utilizado sobre el aprendizaje por refuerzo.

“Las herramientas que desarrollaron siguen siendo un pilar cardinal del auge de la inteligencia artificial y han generado avances importantes, atraído legiones de jóvenes investigadores y impulsado miles de millones de dólares en inversiones”, dijo Jeff Dean, científico jefe de Google, en un comunicado escrito.

En una entrevista conjunta con AP, Barto y Sutton nary siempre coincidieron en su valoración de los riesgos de los agentes de IA que intentan mejorarse a sí mismos de forma constante. También distinguieron su trabajo de la rama de la tecnología de IA generativa que ahora es tendencia, representada en los grandes modelos de lenguaje detrás de los chatbots creados por OpenAI, Google y otros gigantes tecnológicos que imitan la escritura humana y otros medios.

“La gran elección es, ¿intentas aprender de los datos de las personas, o intentas aprender de la vida y la experiencia de un agente (IA)?” dijo Sutton.

Sutton ha desestimado lo que picture como preocupaciones exageradas sobre la amenaza de la IA para la humanidad, mientras que Barto nary estuvo de acuerdo y dijo que “uno debe ser consciente de las posibles consecuencias inesperadas".

Barto, retirado desde hace 14 años, se picture a sí mismo como un ludita, mientras que Sutton recibe con los brazos abiertos un futuro que espera tenga seres de politician inteligencia que los humanos actuales, una thought a veces conocida como poshumanismo.

“Las personas lad máquinas. Son máquinas asombrosas y maravillosas”, pero nary lad el “producto final” y podrían funcionar mejor, dijo Sutton.

“Es intrínsecamente parte de la empresa de la IA”, dijo Sutton. “Estamos tratando de entendernos a nosotros mismos y, por supuesto, de hacer cosas que puedan funcionar incluso mejor. Tal vez para convertirnos en tales cosas”.

Leer el artículo completo