IOX Experte erklärt: KI & Computer Vision – Einsatz, Chancen & Risiken
KI, Deep Learning, Computer Vision – es gibt zahlreiche Buzzwords und manchmal fällt es gar nicht so leicht, sich im Dschungel der neuen Technologien zurechtzufinden.
In unserem IOX Experten-Interview schafft App- und Software Entwickler Christian Oberdörfer Klarheit und gibt eine Einführung in das komplexe und vielfältige Thema der Künstlichen Intelligenz. Er erklärt die Unterschiede zwischen KI und Computer Vision, Anwendungsbereiche, Chancen und Risiken.
Inhaltsverzeichnis
- Was steckt hinter dem Begriff KI?
- Wie lässt sich nun der Begriff “Deep Learning” in diesen Zusammenhang einordnen?
- Was ist Computer Vision und wo findet diese Technologie Anwendung?
- Wie genau können LKWs durch diese Technologie erkannt werden? Wurde die Kamera schon vorher programmiert?
- Und das funktioniert immer einwandfrei?
- KI ist also an vielen Stellen noch nicht so weit ausgereift bzw. es kann nie eine hundertprozentige Zuverlässigkeit garantiert werden. Wann ist es denn dann sinnvoll, diese Technologie tatsächlich einzusetzen?
- Gibt es denn Gefahren, wenn eine Technologie nicht zu 100% funktioniert?
Was steckt hinter dem Begriff KI?
Christian:. Es gibt heute viele Begriffe, die im Zusammenhang mit künstlicher Intelligenz in den Medien genannt werden. Ich will gerne versuchen, ein wenig Klarheit zu schaffen. Um die Begriffe genauer zu erklären:
KI, also Künstliche Intelligenz, ist sozusagen der Oberbegriff der gesamten Thematik. Die Idee, Computern Intelligenz zu verleihen, geht zurück bis in die Anfangszeit der Informationstechnik, also grob die 50er Jahre. In den 70er Jahren begann das Thema langsam Fahrt aufzunehmen, als die ersten leistungsfähigen Rechner verfügbar wurden. Allgemein ist KI sehr weit gefasst, dennoch lässt sich grundsätzlich zwischen zwei verschieden Bereichen unterscheiden.
Zu der schwachen Künstlichen Intelligenz gehören die Technologien, die ein konkretes Problem lösen können, während starke KIs weit darüber hinausgehen und den menschlichen Intellekt nachbilden sollen. Das ist ein alter Menschheitstraum: Ein echtes menschliches Gehirn digital nachzubilden. Eine Maschine, die denkt wie ein Mensch.
Doch in der Anfangszeit der KI-Forschung trat schnell Ernüchterung ein, als man merkte, dass dieses hohe Ziel nicht einmal ansatzweise erreicht werden konnte. Somit wurden kleinere Ziele gesteckt. Aktuell ist das Thema allerdings wieder stark besetzt und viele Forscher zeigen sich sehr optimistisch, eines Tages doch eine leistungsfähige KI erschaffen zu können.
Dennoch sind für uns und die Industrie in erster Linie schwache künstliche Intelligenzen von Interesse, die als hilfreiche Arbeitsgeräte konkrete Probleme lösen können.
Wie lässt sich nun der Begriff “Deep Learning” in diesen Zusammenhang einordnen?
Christian: Die Erforschung von künstlicher Intelligenz hat verschiedene Entwicklungsschritte durchgemacht. Am Anfang wurde versucht, intelligente Systeme regelbasiert aufzubauen, also einen festen Katalog von Regeln vorzugeben: Wenn A passiert, muss darauf B folgen.
Daraufhin wurden Programmiersprachen entwickelt, die dazu dienen sollten, der Maschine logisches Schlussfolgern beizubringen. Ein sehr komplexes Thema, bei dem es schlichtweg unmöglich ist, alle erdenklichen Regeln aufzustellen. Als Computer dann leistungsfähiger wurden, hat man regelbasierte Systeme durch statistische Systeme ersetzt. Diese Systeme können selbstständig lernen, mit welcher Wahrscheinlichkeit Ereignis B auf A folgt.
Deep Learning ist eine Weiterentwicklung des statistischen Ansatzes einer KI und nutzt statt einfacher Funktionen komplexe neuronale Netze. Die Funktionsweise dieser Technologie ist vom Lernprozess des menschlichen Gehirns inspiriert und eine Abstraktion dessen.
Einfach gesagt handelt es sich um ein Netzwerk aus künstlichen Neuronen, das aus einer Eingabe ein bestimmtes Ergebnis berechnen kann. Das Netzwerk kann durch Training mit bekannten Daten die Verknüpfungen zwischen den Neuronen verändern und so ein Modell der Realität erstellen und speichern. Es “lernt” selbstständig, ohne dass das Modell direkt von außen vorgegeben wird.
Was ist Computer Vision und wo findet diese Technologie Anwendung?
Christian: Computer Vision ist ein sehr spannendes Teilgebiet der künstlichen Intelligenz und befasst sich mit der Auswertung von Bilddaten. Der Einsatz von Kameras in Verbindung mit Deep-Learning-Modellen bringt einen Computer dazu, Gesehenes zu identifizieren, einzuordnen und entsprechend darauf zu reagieren.
Es gibt viele verschiedene Teilgebiete der Computer Vision, eines der wichtigsten für uns ist die Object Detection. Dabei erkennt ein Computer z.B. über Kamerabilder, ob und welche Objekte in einer Szene vorhanden sind. Eine mögliche Anwendung ist die Erkennung von KfZ-Kennzeichen, die wir hier bei IOX schon verwenden.
Eng verbunden mit diesem Ansatz ist die Image Recognition, also die genauere Analyse der erkannten Objekte. Dabei lassen sich dann zum Beispiel Texte aus Bildern extrahieren, in unserem Beispiel die genaue Zahl- und Buchstabenfolge der Kennzeichen.
KI im Allgemeinen aber besonders Computer Vision bietet damit viele Vorteile für Logistikunternehmen. Zum Beispiel kann ein- und ausgehender Lieferverkehr durch Bilderkennung effektiver gesteuert werden. Fahrzeuge und ihre Ladung werden durch Kameras automatisch erfasst und zugeordnet und ihre Daten weiterverarbeitet.
Weiterhin ist Computer Vision auch in der Produktionstechnik und der Prozessüberwachung relevant. Inzwischen findet sie sich sogar in Fotokopierern oder in Digitalkameras, zum Beispiel zur Gesichtserkennung.
Wie genau können LKWs durch diese Technologie erkannt werden? Wurde die Kamera schon vorher programmiert?
Christian: Grundsätzlich ist immer ein Training notwendig, ob es sich jetzt um ein neuronales Netz handelt oder nicht. In der Entwicklung einer KI gibt es 3 wichtige Phasen.
- In der ersten Phase müssen zunächst die Trainingsdaten gesammelt werden. In unserem konkreten Beispiel wird eine Kamera aufgestellt, welche über mehrere Monate vorbeifahrende LKWs aufzeichnet. Dann muss ein Mensch das Bildmaterial sichten und auf jedem einzelnen Bild die Objekte markieren, die später erkannt werden sollen. Da für das Training einer KI große Mengen an Daten benötigt werden, ist dieser Prozess sehr aufwändig.
- Die zweite Phase ist dann die eigentliche Trainingsphase, in der das Modell trainiert wird. Das Ganze ist mathematisch recht komplex, aber man kann sich vereinfacht vorstellen, dass der Computer jedes Trainingsbild analysiert und versucht, ein Muster abzuleiten, mit dem er die gewünschten Objekte erkennen kann. Dieses Training wird auf sehr leistungsfähigen Rechnern durchgeführt und kann selbst in einfachen Fällen bereits Tage oder Wochen in Anspruch nehmen.
- Danach folgt dann die Evaluationsphase der KI. Das Modell wird an neuen, nicht im Training verwendeten Daten getestet. Wenn das Ergebnis dann gut genug ist, also z.B. auf 99% aller Bilder das Kennzeichen korrekt identifiziert wurde, kann das Modell in einem Produkt eingesetzt werden.
Und das funktioniert immer einwandfrei?
Christian: So eine künstliche Intelligenz wie in unserem Anwendungsfall ist natürlich hochspezialisiert. So wird es zum Beispiel zu Problemen kommen, wenn plötzlich unbekannte ausländische Kennzeichen auf dem Bild erscheinen, der Kamerawinkel geändert wird oder eine andere Beleuchtung vorherrscht.
Die KI können immer nur dann zuverlässig Informationen gewonnen werden, wenn die aktuelle Situation der trainierten Situation ähnelt und wenn die gewünschten Objekte im Training gesehen wurden. Aussagen über unbekannte Situationen oder sogar logische Schlussfolgerungen sind nicht möglich.
Doch allgemein sind die Erwartungen an eine KI sehr hoch. Oft suggeriert die Werbung, dass diese Technologien einfach beherrschbar und die meisten Probleme schnell gelöst sind. Doch der Teufel steckt im Detail. Es ist in den meisten Fällen sehr einfach, eine künstliche Intelligenz zu konstruieren, die ein Problem zu 80% löst, doch an 100% oder auch nur 99,9% scheitern die meisten Ansätze.
KI ist also an vielen Stellen noch nicht so weit ausgereift bzw. es kann nie eine hundertprozentige Zuverlässigkeit garantiert werden. Wann ist es denn dann sinnvoll, diese Technologie tatsächlich einzusetzen?
Christian: Überall dort, wo es nicht auf eine absolut hundertprozentige Genauigkeit ankommt, kann Künstliche Intelligenz gut einsetzt werden. Entsprechende Assistenzsysteme lassen sich hervorragend einsetzen, um Metadaten zu sammeln und Menschen bei ihrer Arbeit zu unterstützen. Dadurch können Prozesse verbessert und effizienter gestaltet werden. Es ist dann nicht entscheidend, wenn nicht alle Informationen perfekt von der KI erkannt werden.
Ich sehe aber eine Gefahr darin, dass Künstliche Intelligenzen immer komplexer und leistungsfähiger werden, sodass niemand mehr nachvollziehen kann, was genau passiert und wie das System arbeitet. Das sollte nicht unerwähnt bleiben. Gerade bei neuronalen Netzen ist es nicht möglich, herauszufinden, warum das System bestimmte Entscheidungen trifft. Immer größer werdende Modelle werden auf immer größer werdenden Supercomputern berechnet und oft wird einfach so lange ausprobiert, bis das gewünschte Ergebnisse herauskommt. Am Ende weiß aber niemand, ob die KI in allen Fällen “richtig” entscheiden wird oder ob es zu Überraschungen kommen kann.
Gibt es denn Gefahren, wenn eine Technologie nicht zu 100% funktioniert?
Christian: Schwierig wird es meiner Meinung nach immer, wenn es um die Sicherheit von Menschen oder um absolute Genauigkeit geht. So sollen Künstliche Intelligenzen zum Beispiel Gerichtsurteile fällen oder Kreditwürdigkeiten feststellen. In solchen Anwendungsbereichen würde ich wichtige Entscheidungen nicht den KIs oder Maschinen überlassen. Hier geht es ganz konkret um das Schicksal von Menschen und falsche Entscheidungen können fatale Folgen haben.
Ich erinnere mich an einen Fall, in dem eine KI völlig unvorhersehbar über Kreditwürdigkeiten entschieden hat. Eine genaue Analyse ergab, dass eine Person immer genau dann als kreditwürdig eingestuft wurde, wenn sie ein bestimmtes Produkt in großer Menge in einem Baumarkt gekauft hatte. Man hatte einfach wahllos alle bekannten Daten vergangener Kreditvergaben in das Training gegeben und als einziges relevantes Merkmal für einen erfolgreichen Kreditantrag wurde vom Computer der Einkauf eines bestimme belanglosen Artikels eingestuft.
Noch viel schlimmer sind Fälle, in denen selbstfahrende Autos Verkehrsunfälle bauen, weil irgendeine kleine Information falsch interpretiert wurde. Und niemand kann garantieren, dass die nächste Version der KI diese Fehlinterpretationen nicht mehr machen oder sogar ganz neue Fehler begehen wird. Die aktuellen künstlichen Intelligenzen können nun einmal nicht logisch schlussfolgern, sondern reagieren mit einem völlig unbekannten statistischen Modell auf Situationen. Und das ist sehr beunruhigend.
Natürlich ist es wie bei jedem großen technischen Umschwung.
Es gibt Chancen und Risiken von KI. Aber wir sollten uns sehr genau überlegen, welche Risiken vertretbar sind und welche nicht.
Du hast Fragen zum Thema oder möchtest ein Projekt umsetzen? Wir unterstützen Dich: