3. Deep Learning 1. Was sind neuronale Netze? Zu den bekanntesten Varianten des überwachten Lernens gehören künstliche neuronale Netze (kurz: KNN) und Deep-Learning-Algorithmen. Deep-Learning-Algorithmen sind eine Unterart von künstlichen neuronalen Netzen. Beide Methoden imitieren die Funktionsweise menschlicher Nervenzellen. Eine solche menschliche Zelle hat drei wesentliche Bestandteile: die Synapsen, das Axon und den Zellkörper. Die Synapsen empfangen Reize. Wenn sie eine Aktivität wahrnehmen, geben sie dieses Signal an den Zellkörper weiter. Dort entscheidet die Signalstärke, ob das Signal über das Axon weitergeleitet wird. Dabei arbeiten die einzelnen Neuronen in Verbünden zusammen. Ähnlich ist die Funktionsweise bei KNNs. Auch hier arbeiten die Neuronen nicht einzeln, sondern sind in komplexen Netzwerken zusammengeschlossen. Dieses Netzwerk besteht aus mehreren Schichten („Layer“). Prinzipiell werden folgende Layer unterschieden: das Input Layer, viele Hidden Layer und das Output Layer. Die übers Input Layer eingespeisten Daten werden in den Hidden Layer anhand der Lernregeln verarbeitet und gelangen anschließend zum Output Layer. Wie die Daten dort ankommen, hängt also stark von den Lernregeln der Hidden Layer ab, die während der Trainingsphase verändert werden. Ähnlich wie im menschlichen Gehirn können diese Netzwerke aus künstlichen Neuronen lernen, Signale unterschiedlich zu deuten und anschließend zu gewichten. Sollen zum Beispiel die Zahlen einer handschriftlichen Postleitzahl erkannt werden, ist jedes Pixel eines Fotos vom Briefumschlag ein Neuron des Input-Layers. Die Hidden Layer werden beim Trainieren so angepasst, dass, je nachdem welche Zahl vorliegt, das passende Neuron des Output-Layers aktiviert wird. Das Neuron des Output-Layers beschreibt in diesem Fall für die handschriftliche Ziffer zwischen 0 und 9. So bildet das KNN nach und nach Muster und Zusammenhänge heraus. Als gelesen markieren 2. Was ist Deep Learning? Die entscheidende Arbeit von künstlichen neuronalen Netzen (KNN) leisten die Hidden Layer, die sich zwischen Input- und Output-Layer befinden. Je mehr Hidden Layer sich in einem KNN befinden, umso komplexer ist es. In diesem Zusammenhang sprechen Expert:innen auch von der Tiefe eines KNN und schließlich von einem „Deep Neural Network“. Daher stammt auch der Begriff „Deep Learning“. Deep Learning ist also ein Teilbereich des Machine Learnings, der auf künstlichen neuronalen Netzwerken basiert. Neben einer hohen Anzahl an Neuronen können auch mehrere neuronale Netze „hintereinandergeschaltet“ sein. So ist das Lernen wesentlich komplizierter und langwieriger, aber es können sich auch neue Muster zwischen den KNN ergeben. Der Charme von Deep Learning ist also, dass das Netzwerk selbstständig lernt und dadurch Muster und Zusammenhänge in großen Datenmengen erkennen kann. Dadurch werden Anwendungen im Bereich der Bild- und Spracherkennung möglich, die lange Zeit zu komplex waren. Hierzu zählen z. B. die Objekterkennung und die Verfolgung für selbstfahrende Autos, die Analyse von Patientendaten, Textübersetzungen und auch die Personen- und Gesichtserkennung. Deep Learning ist daher ausschlaggebend für die wachsende Bedeutung von KI. Gleichzeitig hat das auch Nachteile: Wie beim menschlichen Gehirn ist von außen schwer zu erkennen, welche Merkmale das Netzwerk gefunden hat und wo sie gespeichert sind oder warum das Netzwerk sie so bewertet. Deshalb gelten manchen Wissenschaftler:innen tiefe neuronale Netze und andere KI-Algorithmen als Blackbox – man weiß also nicht, was drinsteckt. Entsprechend gibt es bereits erste Forschung zur Explainable Artificial Intelligence (XAI), also zur „erklärbaren“ KI. Die Ansätze sind unterschiedlich, aber alle möchten sicherstellen, dass sich nachvollziehen lässt, wie die KI zu ihren Ergebnissen kommt. Ziel ist es, eine klare Rechenschaftspflicht herzustellen, z. B. bei Unfällen, und das Vertrauen in die Technologie zu gewährleisten. Als gelesen markieren 3. Deep Learning ausprobieren: „Stable Diffusion“ Mittlerweile gibt es zahlreiche Deep-Learning-Angebote im Internet, die sich gratis ausprobieren lassen. Eines davon ist Stable Diffusion. Dieser Bildgenerator wurde an der LMU München entwickelt und verwendet Texteingaben, um daraus neue, bisher nie gesehene Bilder zu komponieren. So zum Beispiel stellt sich die KI ein „Universitätsgebäude in einer deutschen Stadt“ vor: Wer ein wenig damit experimentiert, dem wird auffallen, dass bestimmte Eingaben in englischer Sprache bessere Resultate erzeugen als Eingaben auf Deutsch. Es liegt also nahe, dass die KI stärker mit englischen als mit deutschen Daten trainiert wurde. Tatsächlich bestehen die Trainingsdaten aus frei verfügbaren Bild-Text-Paaren aus dem Internet: Neben Fotos können auch Zeichnungen und Gemälde in den Trainingsdaten landen – Stable Diffusion nutzt einen Datensatz mit solchen Inhalten. Was das für Künstlerinnen und Künstler bedeutet, wird in einem Artikel auf Heise Online beschrieben. Grundsätzlich ist das Verwerten öffentlich zugänglicher Bilddateien in KI-Trainingsdaten urheberrechtlich umstritten. Einige Eingaben offenbaren auch eine grundsätzliche Schwäche von KI: Die Mehrdeutigkeit menschlicher Sprache ist schwierig zu verarbeiten. Oft bezeichnet ein Wort mehrere Dinge, und je nach Kontext entscheiden wir intuitiv, was damit gemeint ist. Das Wort „Lachs“ etwa meint eine Fischart, aber auch eine Speise im Restaurant. Stable Diffusion ist damit überfordert: Insgesamt sind die Resultate von Stable Diffusion aber schon beeindruckend. Noch beeindruckender ist der Bildgenerator DALL E 2 des kalifornischen Unternehmens OpenAI. Auch der besonders leistungsfähige Chatbot ChatGPT stammt von diesem Anbieter. Wer die Angebote testen möchte, muss allerdings eine Handynummer für die SMS-Bestätigung übermitteln. Als gelesen markieren Mein Wissen üben Frage 1 | 4 Zurück - Weiter zurück zu 2. Maschinelles Lernen weiter zu 4. KI im Alltag Mein DiFü Denke daran: Wir können deinen Fortschritt nur dauerhaft speichern, wenn du angemeldet bist. Anmelden Registrieren