31. January 2020

Autonome Systeme für Ingenieure: Aus der digitalen Welt der Spiele in die wirkliche Welt

Blog 12_Titelbild

Die Forschung rund um das Thema AI hat in den letzten Jahren grosse Fortschritte gemacht. Jedoch sind für das Training oft immer noch Millionen von Versuchen nötig, um AI-getriebene Systeme zu entwickeln und der damit verbundenen Verantwortung in kritischen Situationen gerecht zu werden.

Stellen Sie sich ein autonom fahrendes Fahrzeug vor, das in einem mit Rauchschwaden durchdrungenen Minenfeld nach Überlebenden, persönlichen Gegenständen oder anderen Hinweisen sucht. Das Fahrzeug identifiziert Objekte, die es sieht, und entscheidet, welchen Weg es zuerst einschlagen soll. Kommt das Fahrzeug an einem Punkt nicht weiter, übernimmt eine auf dem Fahrzeug befindliche Drone, um auch die schwer erreichbaren Bereiche des Minenfelds zu erforschen. All dies geschieht ohne jegliche Kommunikation mit der Aussenwelt. «Glauben Sie es oder nicht, dies ist keine Zukunftsvision!» Das Team «Explorer» von der Carnegie Mellon University und Oregon State University hat genau das im Rahmen der DARPA (Defense Advanced Research Projects Agency) Subterranean Challenge nachgewiesen.

Heute, im Zeitalter der datengesteuerten künstlichen Intelligenz (AI), lösen intelligente Maschinen unter Einberechnung hunderter Millionen von Test- oder Trainingsszenarien hochkomplexe Probleme. Selbst Probleme im Bereich der Wahrnehmung und Entscheidungsfindung, die in der Branche bis vor kurzem noch als unlösbar galten, können mittlerweile mithilfe modernster Techniken wie dem Reinforcement Learning (RL) erfolgreich bewältigt werden. Seit dem ersten Tag meines Promotionsstudiums an der Carnegie Mellon University bin ich fasziniert von der engen Verknüpfung zwischen Wahrnehmung — mittels computergestützter Intelligenz zum Abtasten der Umgebung — und Handlung — mithilfe dieses Feedbacks und von Daten zum Treffen von Entscheidungen. Heute hat unsere Arbeit, Computern das Spielen beizubringen, das Potenzial, die Art und Weise, wie wir Steuersysteme in der Zukunft bauen, sich grundsätzlich verändert. Die daraus resultierenden Anwendungen könnten Einfluss auf zahlreiche Branchen und dort auf Sicherheit und Produktivität haben.

Unterstützung für Ingenieure bei der Erstellung von 
Wahrnehmungs-Handlungs-Schleifen für die wirkliche Welt

Unsere heutigen technisierten Geräte und Systeme verwenden regelbasierte Logiken, um wissenschaftliche Grundsätze, Technologien und Algorithmen, die von Experten und Ingenieuren mühsam entwickelt wurden, miteinander zu vereinen. Wie wäre es jedoch, wenn unsere Ingenieure zukünftig Steuerungen bauen könnten, die über maschinelle Intelligenz verfügen und die regelbasierte Logiken durchbrechen und in Echtzeit auf veränderte Umgebungsbedingungen reagieren könnten? Technologien wie Reinforcement Learning, die bei der Lösungsfindung in Videospielen sehr erfolgreich eingesetzt werden, sind der Schlüssel zur Entwicklung von Entscheidungssequenzen in der echten Welt und bilden die Grundlage für die nächste Generation von autonomen Systemen. 

«Möchte man 
den Erfolg von RL in Videospielen auf autonome Systeme der wirklichen Welt übertragen, ist dies mit grossen Herausforderungen verbunden.»

Möchte man den Erfolg von Reinforcement Learning in Videospielen auf autonome Systeme der wirklichen Welt übertragen, ist dies mit grossen Herausforderungen verbunden; so stirbt bspw. niemand tatsächlich, wenn er in einem Videospiel einen falschen Schritt macht! Eine AI kann nicht so einfach aus ihren Fehlern lernen, wie dies in der wirklichen Welt möglich ist, wo die Kosten von Fehlern möglicherweise gewaltig sein können. Darüber hinaus verschlingen neuere AI-Technologien Unmengen von Daten. So braucht es zum Beispiel hunderte Millionen von Testläufen, bevor eine scheinbar solide Richtlinie für viele dieser Spieleaufgaben trainiert werden kann. Der Einsatz von physischen Systemen zur Erzeugung von Trainingsdaten kann über Millionen von Zyklen hinweg ein sehr teures Unterfangen sein.

Machine Teaching: ein neuer Ansatz, um Lernprozesse auf Grundlage von Expertenwissen zu verbessern
Unsere Forscher haben hart an der Entwicklung von Machine Teaching gearbeitet, um komplexe Probleme auf Grundlage von Expertenwissen und menschlichen Kompetenzen in kleinere und einfachere Aufgaben aufzubrechen. Machine Teaching kann AI-Modellen auch helfen, schneller eine Lösung zu finden, sodass die Zeit zum Trainieren des Modells deutlich reduziert wird. Obgleich AI noch immer das Fundament bildet, können Sie als Experte Szenarien oder Strategien beisteuern, mit denen Lernalgorithmen die entsprechende Aufgabe lösen können. Da Sie derjenige sind, der die Lerninhalte und damit die Ziele, das gewünschte Verhalten und Bedingungen der Sicherheitsgrenzen festlegt, sind auch die darauf basierenden AI-Modelle nach der Anwendung besser erklär- und überprüfbar. Ich selbst würde mir als AI-Modell wohl kaum eine «Black Box» als Regelsystem für meine Systeme wünschen! Um ein Zitat von Alfred Aho und Jeffrey Ullman anzuführen: «Computerwissenschaft ist die Wissenschaft der Abstraktion und generiert das richtige Modell, um über ein Problem nachzudenken und zur Lösung dieses Problems geeignete mechanisierbare Techniken anzubieten.» Machine Teaching scheint mir ebenjene Abstraktion zu sein, die wir erschaffen, das richtige Modell, um über die Anwendung von Expertenwissen auf AI-Systeme nachzudenken. Es kann helfen, eine Verknüpfung zwischen dem modellzentrierten Ansatz der Ingenieure und dem codezentrierten Ansatz der Softwareentwickler herzustellen.

High-Fidelity-Simulationen: Ein kritischer Pfad, um umfassend Erfahrungen zu sammeln
Ähnlich wie Machine Teaching bieten Simulationen eine Möglichkeit, synthetische Daten unter Vermeidung unnötiger Risiken zu generieren. Simulationen sind eine sichere und kostengünstige Möglichkeit zum Trainieren von AI-Modellen. Auf diese Weise können Sie alle möglichen Szenarien einschliesslich von Grenzsituationen simulieren.
Vor diesem Hintergrund haben wir AirSim (Aerial Informatics and Robotics Simulation), einen Open-Source-Simulator für Roboterfahrzeuge, geschaffen. AirSim erlaubt die Simulation einer Vielzahl von Umgebungen, Beleuchtungsbedingungen, Sensoren sowie die Fusion von Sensordaten. Die Fähigkeit von AirSim, ist der Grund, warum das Team «Explorer» zum Gewinner gekürt wurde.

Die Zeit ist reif und die Möglichkeiten sind schier endlos
Wir arbeiten weiter daran, AI den Weg hin zu Ingenieuren und 
Designern zu ebnen, die ihre Expertise und ihr Autonomiewissen als Grundlage für beschleunigte Innovationen nutzen können. Von industriellen Anwendungen bis hin zu Such- und Rettungseinsätzen wie in der DARPA-Challenge sind die Anwendungsmöglichkeiten dieser Technologie schier endlos. Begleiten Sie uns auf dieser Reise und beginnen Sie mit der Erforschung der Zukunft! 


Harry Shum
Harry Shum

Harry Shum ist promovierter Computerwissenschaftler. Seit 1996 forscht
und arbeitet er bei Microsoft. Aktuell ist er Executive Vice President of
Artificial Intelligence & Research bei Microsoft. In dieser Rolle verantwortet
er die Gesamtstrategie und die Forschungsaktivitäten rund um das
Thema AI bei Microsoft.