HAL, lies’ doch mal den Zähler ab

Als eine der bekanntesten Interpretationen künstlicher Intelligenz wird oft HAL 9000, der fiktive Computer aus Stanley Kubricks Science-Fiction-Film »2001: Odyssee im Weltraum« aus dem Jahr 1968 genannt. Wie stark sich die Wirklichkeit dieser Fiktion annähert und welche Bedeutung diese hat, ist vielen nicht bekannt.

Mit IBM’s Deep Blue siegte 1997 erstmals ein Computer über den amtierenden Schachweltmeister Garri Kasparov, und dieses Jahr schlug Google mit Alphago den amtierenden Go-Weltmeister Lee Sedol. 2011 gewann der Großrechner Watson von IBM gegen die Quizchampions Brad Rutter und Ken Jennings in der Fernsehsendung „Jeopardy“. In allen Fällen war eine künstliche Intelligenz am Werk. Nach jedem Sieg einer künstlichen Intelligenz wurde die „Intelligenz“ in Frage gestellt. Zu Recht? Und welche Auswirkung hat das Thema „künstliche Intelligenz“ auf die Energiewirtschaft?

IBM’s Watson bestand zum Zeitpunkt der „Jeopardy“-Aufnahme aus einem drei Millionen US-Dollar teuren Supercomputer, der auf einer vier Terabyte großen Wissensdatenbank aufsetzte. Er errechnete für jede Frage Antworten mit unterschiedlicher Wahrscheinlichkeit und entschied sich für die Antwort mit der höchsten Wahrscheinlichkeit. Viele Beobachter interpretierten diese Eigenschaft als simple Heuristik und nicht als Anzeichen von Intelligenz.

Ein Großteil des menschlichen Gehirns dient der Mustererkennung

In Lebewesen entsteht intelligentes Verhalten durch die Verbindung von Reizen im Neocortex, der Großhirnrinde. Genau betrachtet sind es Muster, die im Neocortex erkannt und verarbeitet werden können. „Durch eine Glasscheibe kann man nicht fliegen“ wäre z.B. ein Muster, das ein Vogel mit Neocortex lernen kann, einer Fruchtfliege aber verwehrt bleibt. Während der Neocortex bei Lebewesen mit einfach strukturiertem Gehirn wie Mäusen glatt ist, ist er beim Menschen vielfach gefaltet und macht einen Großteil des Gewichts des Gehirns aus.
Nach seiner Niederlage wurde Kasparov gefragt, wieviel Schachzüge er sich pro Sekunde überlegen könne. Die Antwort war: weniger als einen. Wie hatte er eine Chance gegen einen Gegenspieler, der mehrere hundert Millionen Züge pro Sekunde berechnen konnte? Die große Fähigkeit des menschlichen Neocortex besteht darin, dass er eine riesige Menge an Muster extrem schnell parallel verarbeiten kann. Um Autofahren zu können, muss der Mensch eine Vielzahl von Mustern erkennen („Ist das ein Auto?“), bewerten („Fährt es auf meiner Spur?“) und darauf agieren („Muss ich bremsen?“) können. Im Falle von Kasparov wird geschätzt, dass er über hunderttausend Positionen (bzw. Muster) gleichzeitig auswerten konnte, um den besten Zug zu bestimmen.

Um Muster zu erkennen, benutzt der Neocortex ein System aus hierarchisch organisierten „Muster-Erkennern“, die jeweils aus ca. 100 Neuronen bestehen. Die „Muster-Erkenner“ erkennen jeweils nur einfach Muster, sind aber miteinander verbunden, und die hierarchische Verknüpfung erlaubt das Erkennen von komplexeren Mustern. Je nach „Sicherheit“ der „Muster-Erkenner“ ist das weitergeleitete Signal stärker oder schwächer. Es gibt auch nicht nur einen „Muster-Erkenner“, sondern eine Vielzahl davon. Je öfter einem bestimmten Reiz oder Muster begegnet wird, desto öfter wird er abgelegt. So können wir eine oft gesehene Person von vielen Seiten her erkennen. Die im Internet beliebten „Captchas“, also die verzerrt dargestellten Buchstaben, beruhen auf der Eigenschaft, dass wir so viele Muster von Buchstaben besitzen, dass auch eine leichte Abwandlung einfach erkannt wird. Einen Computer stellt so etwas vor eine nahezu unlösbare Aufgabe.

1
Abbildung 1: hierarchische Mustererkennung im menschlichen Gehirn als Vorbild für künstliche Intelligenz

Der hierarchische Aufbau der „Muster-Erkenner“ hat aber noch einen anderen Vorteil: Nehmen wir beispielsweise einmal die Bilder von Prominenten, die verändert wurden. Jeder erkennt sie sofort, obwohl – objektiv betrachtet – wesentliche Informationen fehlen oder verändert sind. Einzelne Muster in den Bildern werden sicher erkannt, und diese Sicherheit reicht für die hierarchisch übergeordneten „Muster-Erkenner“ aus, um, trotz – ganzheitlich betrachtet -fehlender Informationen, die prominente Person wiederzuerkennen. Dieses wird dadurch unterstützt, dass die „Muster-Erkenner“ per Synapse nicht nur für sich streng hierarchisch organisiert sind, sondern auch untereinander. Um den Buchstaben ‚Q’ zu erkennen, ist ein Input möglicherweise der komplette Erkenntnisprozess des ‚O’ um dieses mit dem unteren Strich zu kombinieren.

2
Abbildung 2: Das Gehirn kann fehlende Bildteile ohne Probleme kompensieren und die gesehene Person erkennen

Etwas reduziert dargestellt, geben die „Muster-Erkenner“, vergleichbar mit einem elektrischen Schaltkreis, eine Ja/Nein-Antwort… allerdings mit dem Unterschied, dass die Signalstärke, die sie über die Synapsen weiterleiten, eine Aussage über die Wahrscheinlichkeit beinhaltet, wie sicher sie sich sind, ein bestimmtes Muster erkannt zu haben. Denkt man an das Watson-Beispiel zurück und der Kritik, dass es sich hier nicht um Intelligenz handle, muss man womöglich umdenken. Unser Gedankenprozess funktioniert sehr ähnlich und beruht auch auf einem probabilistischen Ansatz.

Künstliche Intelligenz ist ein Schlüsselfeld für die großen Internetunternehmen

Ein sehr beeindruckendes Beispiel für künstliche Intelligenz(KI) tragen mittlerweile nahezu alle von uns mit sich herum. Apple`s „Siri“ kann bereits einfache kontextuale Fragen verstehen und die richtige Antwort liefern. Und alles unmittelbar, obwohl die eigentliche „Denkarbeit“ nicht auf dem Telefon, sondern in einem Rechenzentrum stattfindet. Die Frage „Spielt Bayern München heute?“ mag für einen Menschen leicht zu beantworten sein, beinhaltet aber eine Reihe an Herausforderungen für ein KI-System. „Bayern“ und „München“ haben geographischen Bezug, „Spielt“ eine Konjugation von „Spielen“. Eine Möglichkeit könnte sein, dass einfach ein „mit“ vergessen wurde. Nur mit Kontextwissen, bzw. einem „Muster-Erkenner“ für „Bayern München“ lässt sich diese Frage befriedigend lösen.

Neben Mustererkennung, wie z.B. Bilder oder Geräusche, zählt Sprache mit zu den größten Herausforderungen und gleichzeitig den größten Chancen der KI. Der Mensch denkt und äußert seine Gedanken in Sprache bzw. übersetzt diese behelfsweise mit Tastatur oder Touchpad. Fortschritte in diesem Bereich werden einen starken Einfluss auf unsere Interaktion mit der digitalen Welt haben. Alle großen Internetfirmen haben eigene Initiativen wie Cortana (Microsoft), M (Facebook), Alexa (Amazon oder Siri (Apple). Google stellt einen großen Teil seiner KI-Forschung mit Tensorflow sogar öffentlich zur Verfügung. Facebook baut nach dem missglückten Versuch, 2014 die britische KI-Firma Deepmind zu kaufen (Google kaufte die Firma für angeblich $600 Mio. USD), den Bereich organisch stark aus und stellt die Ergebnisse auch öffentlich zur Verfügung (Facebook AI-Research)

Viele interessante KI-Applikationen für Energieversorger denkbar

Aus Sicht der Energieversorgung kann künstliche Intelligenz an vielen Stellen in der Wertschöpfungskette nützlich eingesetzt werden. Predictive Maintance, d.h. höhere Produktivität durch optimale Wartung, wird bei bei Gasturbinen ein interessantes Feld sein. Oder die Kundenbetreuung mit einer Sprach-KI(„Chatbot“) abzuwickeln, die nie unfreundlich wird und eine sehr umfassende Wissensbasis bereithält. Eines der ersten praktischen Anwendungsfelder mag im Bereich Zählerstandserkennung liegen.

Den Zählerstand per Smartphone erkennen und auszulesen, ist schwerer als man vermutet. Ein paar Faktoren kommen hier zusammen: Unglückliche Beleuchtungssituation, doppelte Glasscheiben in den Fällen, bei denen der Zähler in einem Glasschrank hängt, unterschiedliche Schriftarten des Zählers (sowohl Schriftbild als auch schwarze Schrift auf weißem Hintergrund bzw. umgekehrt) und immer eine leicht andere Perspektive, aus der die Kamera den Zählerstand erkennen soll. Traditionelle Verfahren versuchen die aufgenommen Bilder z.B. durch Kontrastveränderung oder eine Fourier-Transformation zunächst zu bereinigen, damit ein starrer Algorithmus eine Struktur erkennt. Dieser scheitert natürlich schnell, wenn bestimmte Parameter wie Perspektive aus dem zulässigen Bereich fallen.

Die neueste Generation an Bilderkennung nutzt Künstliche Intelligenz genauer gesagt neuronale Netze zur Bilderkennung – auch bei endios ist sie bereits im Einsatz und wird laufend verfeinert. In Anbetracht der Funktionsweise des Neocortex mit seinen unzähligen „Muster-Erkennern“ und biologischem Vorbild ist das eine naheliegende Idee. Die endios-Implementierung setzt auf ein sog. „Feed-Forward-Netz“, also einem Netz, in dem die Neuronen streng hierarchisch angeordnet wurden und das nur eine Flussrichtung der Informationen zulässt. Es existieren zudem noch die sogenannten Backpropagation-Netze, bei denen die Neuronen einer unteren Ebene mit Neuronen einer höheren Ebene vernetzt werden können; es sind in diesen Netzen also zyklische Schlüsse möglich. Das genutzte Feed-Forward-Netz wurde mit hunderten Bildern von verschiedenen Zählern, bei unterschiedlicher Beleuchtung und wechselnder Perspektive trainiert. Eine deutlich höhere Genauigkeit als im erstgenannten Verfahren ist damit möglich. Der einzige Wermutstropfen sind die Ressourcenanforderungen. Derzeit sind sie so hoch, dass die eigentliche Echtzeit-Auswertung der Bilder nicht auf dem Telefon, sondern auf einem Server-Cluster im Rechenzentrum passieren muss. Durch die ständig steigende Rechenleistung der Hauptprozessoren (CPUs), und vor allem auch der Grafikprozessoren (GPUs) in den Smartphones, sind wir optimistisch, dass sie zusammen mit optimierten Algorithmen in Zukunft die Erkennung auf dem Smartphone bald anbieten können. So hätte auch die Künstliche Intelligenz ihren Beitrag dazu geleistet, dass künftig die verschiedenen Zähler im Haushalt einfach und vor allem fehlerfrei abgelesen werden.

3
Abbildung 3: Neuronale Netze greifen auf trainiertes Wissen zur Mustererkennung, z.B. bei der automatischen Erkennung von Zählerständen, zurück

Ausblick

Während ein erheblicher Teil der Theorie um die künstliche Intelligenz bereits im letzten Jahrhundert entwickelt wurde (z.B. die McCulloch-Pitts-Zelle aus dem Jahr 1943, die der Grundbaustein der heutigen modernen künstlichen Neuronen ist), erreicht die Hardware erst langsam die Leistungsfähigkeit, um künstlicher Intelligenz den Sprung in Massenmarkt-Applikationen zu ermöglichen. Auch für die Energiewirtschaft bestehen interessante Möglichkeiten, mit künstlicher Intelligenz besser und schneller mit Daten und Kunden umgehen zu können. Künstliche Intelligenz ist eine Basistechnologie die erst am Anfang steht. Technologie kann, wie beim Internet, der letzten großen Basistechnologie, zu zaghaft handelnde, etablierte Unternehmen vor große Herausforderungen stellen: Amazon vs. Otto sei nur ein Beispiel. Eine Entwicklung bzw. Technologie auszuprobieren ist riskant, bietet aber auch Chancen, und ist oft der einzige Weg das Potenzial richtig einschätzen zu können.

Dieser Beitrag wurde aktuell veröffentlich in der ew – Magazin für die Energiewirtschaft, Ausgabe 6/2016.

Verfasser:
Malte Kalkoffen, Tobias Schmick, Michael Wessendorf

Photos by:
Geralt, Activedia