DeepMind y OpenAI Machine learning para Todos

IInteligencia Artificial para todos

Alpha y Elon Musk abren a la comunidad científica sus plataformas de Inteligencia Artificial

El documental “Most likely to Succed  ” dirigido por Greg Whiteley llamó nuestra atención sobre un hecho poco conocido para el público, el papel disruptivo de la Inteligencia Artificial y su profundo impacto sobre las actividades humanas en comparación con la robótica. La derrota de Ken Jennings el mejor jugador de la historia del concurso Jeopardy (Similar al concurso de RTVE saber y ganar) por el sistema Watson de IBM, el reto superado supuso un salto significativo en el desarrollo de sistemas de inteligencia artificial. Anteriormente Watson venció a Garry Kasparov el mejor jugador de ajedrez del mundo. Estos dos hechos significativos volvieron a la primera plana cuando el mes de marzo AlphaGo la plataforma de Inteligencia Artificial creada por Google ganó a Lee Sedol el mejor jugador del mundo del juego Chino de tablero GO, teniendo en cuenta que este era un reto que superaba en complejidad los dos anteriores.
Humanos contra IA
A partir del mes de diciembre del 2016 las empresas DeepMind perteneciente a Google y OpenAI del grupo de empresas de Elon Musk ofrecen al gran pública soluciones de machine learning e inteligencia artificial desarrollada para aprender a resolver diferentes retos. “…DeepMind Lab es una plataforma similar a un entorno de juego tridimensional adaptado para la investigación de Inteligencia Artificial basada en agentes…” según su blog oficial.

Chess - Go

DeepMind Lab la apuesta de Google por la investigación de Agentes Inteligentes

Google en su ánimo por construir un sistema de Inteligencia Artificial General capaz de resolver cualquier problema, puso su plataforma “DeepMing Lab” a disposición de los interesados, esta ofrece toda la información necesaria y 14 niveles de retos y desafíos que incluyen 59 juegos de Atari, con Alien, Pong, Asteroids y Pac-Man para entrenar a los agentes. Toda la información está disponible en el repositorio de código abierto GitHub.
El agente flota alrededor del ambiente, levitando y moviéndose a través de propulsores, con una cámara virtual que puede rastrear su “cuerpo”. Google describe algunas de las tareas que este puede hacer: “…recolectar fruta, navegar en laberintos, atravesar pasajes peligrosos evitando caer de los acantilados, rebotar a través del espacio usando las almohadillas de lanzamiento para moverse entre las plataformas, jugar a la etiqueta láser y aprender y recordar rápidamente ambientes generados aleatoriamente…

En la documentación publicada podemos visionar videos de los diferentes niveles de los desafíos de DeepMind, en el llamado Laser AI, el sistema compite contra bots.

Matt Burgess en su artículo de la revista WIRED “Elon Musk’s OpenAI and Google’s DeepMind release their AI playgrounds to everyone” (Nov., 2016); el mundo del juego ha ayudado a enseñar a las plataformas de Inteligencia Artificial a desarrollar una memoria a corto plazo (para navegar por el metro de Londres), memoria episódica (similar a cómo los perros y los seres humanos recuerdan), reconocimiento de imágenes y habilidades de navegación. La inclusión de bots en algunos de los retos permite que los sistemas de Inteligencia Artificial aprender a cooperar con ellos para resolver problemas y retos. Shane Legg, uno de los fundadores de DeepMind, concluyó: “…La navegación reúne una serie de desafíos diferentes: es posible que desee recordar la estructura de un laberinto y luego usar lo que ha recordado y aprendido sobre la estructura para planificar su camino a través del laberinto y resolver un problema…“. Y añade “…DeepMind está utilizando Universe para permitir a los Agentes Inteligentes ejecutar gran cantidad de diferentes tipos de tareas; para que puedan desarrollar el conocimiento del mundo y las estrategias de resolución de problemas que se pueden utilizar eficazmente en una nueva tarea…“.
DeepMind Lab
Para facilitar la interacción de los jugadores humanos con los agentes inteligentes, los ingenieros de google usaron el motor de videojuegos Quake III Arena – lanzado hace 17 años, gracias a este las pantallas de los juegos en primera persona pueden parecer familiares. Este motor no fue elegido al azar declara Shane Legg en la entrevista “…Hay ventajas en el uso de software relativamente viejo…“, “…Estaban diseñados para funcionar en computadoras de potencia relativamente baja y obtener un rendimiento bastante bueno…” En efecto el motor antiguo es eficiente consume pocos en recursos y no necesita ser ejecutado con una potente tarjeta gráfica (GPU).

OpenAI y su gimnasio Universe

Elon Musk paralelamente abrió su plataforma OpenAI que incluye un ‘campo de entrenamiento de agentes inteligentes’ una suerte de “gimnasio” llamado Universe. Los responsables de la plataforma OpenAI destacan el siguiente dato “…a pesar de todos estos avances en la IA, los sistemas que se construyen actualmente pertenecen a la categoría de Inteligencia Artificial Limitada. Pueden alcanzar un rendimiento super humano en un dominio específico, pero carecen de la capacidad de hacer algo sensato fuera de él. Por ejemplo, AlphaGo puede derrotarlo fácilmente en Go, pero no le puede explicar las reglas de un juego de mesa diferente y esperar que juegue contigo…
Esta plataforma incluye un Kit de herramientas y algoritmos que ayudan al software de código abierto a jugar, usando “ambientes” en los que los desarrolladores pueden probar sus Agentes Inteligentes, usando esquemas de recompensas “…Universe expone una amplia gama de entornos a través de una interfaz común: el agente opera un escritorio remoto observando píxeles de una pantalla y produciendo comandos de teclado y ratón. El entorno expone un servidor VNC y la biblioteca del universo convierte el agente en un cliente VNC…” Según OpenAI


Entre las numerosas propiedades de OpenAI Universe destacan las siguientes:

General:

Un agente puede usar esta interfaz (originalmente diseñada para humanos) para interactuar con cualquier programa de computadora existente sin requerir un emulador o acceso a los códigos internos del programa. Por ejemplo, puede jugar a cualquier juego de computadora, interactuar con un terminal, navegar por la web, diseñar edificios en software de CAD, operar un programa de edición de fotos o editar una hoja de cálculo.

Familiar para los seres humanos:

Las personas al estar habituados al tándem: usar un aprendizaje supervisado para imitar lo que el humano hace. La interfaz de píxeles / teclado / ratón, pueden operar fácilmente cualquiera los entornos. Se puede utilizar el rendimiento humano como una línea de base significativa, y grabar demostraciones humanas simplemente salvando el tráfico de VNC (Virtual Network Computing).

¿Qué Ganan los Agentes Inteligentes?

Ambas plataformas entrenan sus agentes virtuales usando un sistema de logros o recompensas. OpenAI usa una tabla de clasificación de los sistemas más exitosos como esquema de recompensa. DeepMind Lab usa una clasificación por porcentaje de éxito y versatilidad de los sistemas, algo distinto a las tablas de clasificación tradicionales basadas en listas de puntuaciones altas.

Imágenes: WIRED, OpenAI, DeepMind Lab,

Farid Mokhtar Noriega. Dr. Arquitecto.
Tecnología Educativa UCJC