Künstliche Intelligenz programmieren – Tutorial für Einsteiger (2021)

Du möchtest eine Künstliche Intelligenz programmieren?

Ich zeige Dir die Grundlagen und 3 Methoden, wie eine KI aussehen kann.

Hier lernst Du wie eine KI Dein Alter vorhersagen kann.

Beginn wir!

Was ist eine Künstliche Intelligenz?

Weil die Informatiker sich bis heute auf keine Definition geeinigt haben, kannst Du jede Software als KI verkaufen. Die meisten Informatiker verbinden mit KI Neuronale Netze, Machine Learning und Big Data.

Funktion von klassischer Software

Um die Idee hinter einer KI zu verstehen, müssen wir die Ideen hinter normaler Software abstrahiert verstehen.

Klassische Software arbeitet nach dem folgenden Schema:

Software + Daten => Ergebnisse

  • Buchungssoftware + unbearbeitete Transaktionslisten => Gebuchte Transaktionen
  • Mailingsoftware + Mailingliste => Gesendeter Newsletter
  • Navigationssysteme + Kartenmaterial => Berechnete Route

Funktion von Künstlicher Intelligenz

Eine Künstliche Intelligenz dreht die Software-Idee auf den Kopf:

Daten + Ergebnisse = > Programm

  • Deutsche Sätze + Korrekturen von Menschen (Korrekt/falsch) => Grammatiksoftware
  • Bilder + Betitelung der Bilder durch Menschen => Bildererkennungssoftware
  • Scans + von Menschen abgetippte Texte => Texterkennungssoftware (OCR)

Die entstandene Software (Model) kann neuartige Anwendungsfälle bearbeiten. Ein Programmierer muss nicht die Logik einprogrammieren, sondern der Computer selbst bringt sich die Fähigkeit bei.

  • Die Grammatiksoftware erkennt Fehler in Sätzen, welche sie nie vorher verarbeitet hat.
  • Die Bilderkennungssoftware betitelt unbekannte neue
  • Die Texterkennungssoftware kann den Text aus unbekannten Scans extrahieren.

Wenn Du mehr über den Unterschied zwischen Künstlicher Intelligenz, Machine Learning und Deep Learning erfahren willst, dann vertiefe Dich in die folgenden Beiträge:

Grundlagen für die Künstliche Intelligenz

Die Schule und Uni vermitteln Theorie Kram, den Du nie wieder brauchst.

Spaß macht die Theorie, wenn Du einen konkreten Anwendungsfall, eine Herausforderung auf den Tisch liegen hast.

Wenn Du Dir das Ziel setzt eine Künstliche Intelligenz zu programmieren, dann hast Du direkt die notwendige Motivation in die theoretischen Grundlagen einzutauchen.

Für Deine KI brauchst Du …

  1. Statistik
  2. Stochastik

Ein Data Scientist nennen die Arbeitgeber die Statistiker von früher. Mit der Umbenennung sind langweilige trockene Fächer auf einmal hipp.

Methoden und Modelle

Eine Künstliche Intelligenz kann auf vielen mathematischen Modelle programmieren (sehr einfach bis hoch-komplex). Du musst austesten, welches Modelle für Deinen Anwendungsfall am besten funktioniert.

Die beliebtesten „hippen“ Methoden sind …

Diese (teils komplexen) Vorgehensweisen produzieren bei  vielen Anwendungsfällen keine besseren Ergebnisse als die „klassischen“ Methoden …

  • Regression
  • Clustering
  • Extremwert Erkennung

Je nach Anwendungsfall muss der Data Scientist mit allen Methoden experimentieren und sich nicht nur auf die hippen Methoden beschränken.

Ergebnisse und Daten zum Trainieren

Alle KI-Methoden brauchen Daten. Die Datengrundlage soll …

  • Quantität: KI-Systeme erstellen mit mehr Trainingsdaten bessere Modelle. Je besser das Modell ist, desto besser sind die Ergebnisse.
  • Qualität: Fehlerfrei beschriftete Datenpunkte sind essenziell, weil die KI etwas Falsches lernt. Die Trainingsdaten sollten möglichst Störfaktor-frei, valide und gefiltert sein.
02 Datensets - Künstliche Intelligenz programmieren Steffen Lippke Coding Series
02 Datensets – Künstliche Intelligenz programmieren Steffen Lippke Coding Series

Link Tipps:

3 Methoden von KI vorgestellt

Ich stelle Dir drei Methoden vor, wie eine KI ausehen kann

Simple Künstliche Intelligenz – Expertensystem

Ein paar verschachtelte if-Anweisungen (Wenn-dann-Verzweigung) dürfte als Künstliche Intelligenz gelten. Dieses einfaches Konstrukt ist die Voraussetzung für ein Expertensystem:

Ist der Drucker eingeschaltet? Wenn(ja) -> X Sonst -> Y

Sind die Patronen voll?

Ist ein Papierstau im Einzug?

00 Experten System - Künstliche Intelligenz programmieren Steffen Lippke Coding Series
00 Experten System – Künstliche Intelligenz programmieren Steffen Lippke Coding Series

Künstliche Intelligenz auf Basis von Web-Mining

Eine KI auf Web-Mining Basis kann aus der Wortwahl der twitternden Menge an Demonstranten vorhersagen, ob Ausschreitungen zu erwarten sind.

Die Stochastik vereinfacht:

Friedliche Demo 0 % – 50 % Ausschreitungen – 100 % Bürgerkrieg

Falls 100 der 1000 Demonstranten Worte tweeten wie „Schlag“, „Ausrasten“, „Polieren“ oder „Werfen“, dann erhört sich die Wahrscheinlichkeit.

Falls der Großteil mehr sachliche Kommentare auf Twitter veröffentlichen senkt die KI die Wahrscheinlichkeit.

05 Common Crawl - Künstliche Intelligenz programmieren Steffen Lippke Coding Series
05 Common Crawl – Künstliche Intelligenz programmieren Steffen Lippke Coding Series

Welche Worte sind für eine solche Analyse relevant oder irrelevant? Ein Machine Learning Programm ermittelt diese. Die KI betrachtet den folgenden Datensatz an

  1. Texte aller Tweet unter dem Hashtag Demo X (30.000 Wörter)
  2. Ausschreitung (wahr, falsch)
  3. Anzahl das Verletzen

Die Beschriftung durch das Feld 2 und 3 helfen der KI, die relevanten Worte zu finden. Was ist die Schnittmenge der Worte aus 60 Demos, wo es zu einer Ausschreitung gekommen ist? Der Algorithmus wird nicht die Worte ausspucken, die Demo-spezifisch (Grund der Demo) oder generische Wörter sind (Stopwords).

Stopwords sind Füllwörter ohne viele inhaltliche Bedeutung (ist, man, du, eine, der, deine, sein, haben).

Link Tipp: Common Crawl für UNgefliterte Webdaten für Deine Analysen

Künstliche Intelligenz via Regression

Die Regression ist ein statistisches Modell, welches versucht den Zusammenhang von Ursache(n) und einem Resultat herzustellen. Die Anwendungen der Regression sind vielfältig:

  • Bruttonationaleinkommen eines Landes auf Basis der Anzahl der Erwerbstätigen vorhersagen
  • Gehalt eines Absolventen anhand der Abgangsnote vorhersagen
  • Anzahl der Punkte in einer Klausur anhand der gelernten Stunden vorhersagen
  • Körpergewicht anhand der täglich konsumierten Kalorien vorhersagen.

Ursachen sind die „unabhängigen“ Variablen, die das Resultat, die abhängige Variable, beeinflusst.

Typen von Variablen sind …

  • Nominale: Geschlecht [Weiblich, Divers, Männlich], Süchte [Raucher / Nicht-Raucher]
  • Ordinale Schulnoten [1,2,3,4,5,6]
  • Metrische: Alter, Gewicht, Größe (Kontinuierliches Maße)

Die Regression eignet sich für die Vorhersage, wie alt Du wirst, wenn Du Deinen Lebensstil nicht änderst.

Beispiel einer Regression

Zwei unabhängige (willkürlich ausgewählte) Faktoren können Deine Lebenszeit bestimmen:

  • Schlaf: Wie viel Stunden / Minuten am Tag schläfst Du? 8 Stunden Schlaf sind optimal und je mehr oder weniger Du schläfst desto früher stirbst Du.
  • Sport: Wie lange am Tag bewegst Du Dich? Je mehr Sport Du treibst, desto länger lebst Du. Wenn Du es übertreibst, kippst Du früher um.

Für repräsentative Daten brauchst Du ca. 1000 Personen. Diese musst Du über ihr Leben beobachten und den Sterbezeitpunkt notieren. Diese Daten Sammeln Forscher über mehrere Generationen, sodass ein großer Datensatz entsteht.

Erste Schritte

Als erstes solltest Du Dir eine Übersicht über die Daten verschaffen. Lasse dazu zwei Punktewolken-Diagramme für Schlaf-Alter und Sport-Alter ausgeben.

03 Linearer Zusammenhang - Künstliche Intelligenz programmieren Steffen Lippke Coding Series
03 Linearer Zusammenhang – Künstliche Intelligenz programmieren Steffen Lippke Coding Series

Jetzt kannst Du entscheiden, ob der Zusammenhang zwischen den Variablen linear oder nicht linear ist. Bei einem linearen Zusammenhang könntest Du durch die Punktewolke eine Gerade ziehen und über eine lineare Gleichung das Alter zu der täglichen Gewohnheit bestimmen.

02 Nicht linearer Zusammenhang - Künstliche Intelligenz programmieren Steffen Lippke Coding Series
02 Nicht linearer Zusammenhang – Künstliche Intelligenz programmieren Steffen Lippke Coding Series

Auswertung und Erstellung des Modells

Wenn Du Dir Objekte gut räumlich vorstellen kannst, kannst Du Dir einen 3-D-Graphen mit Z = Alter, X = Sport und Y = Schlaf ausgeben. Der Plot sollte Dir eine Haube zeigen, die einen Hochpunkt (höchstes Alter) bei optimalen Schlaf- und Sport-Gewohnheiten zeigt.

Das Modell der Künstlichen Intelligenz sieht so aus, wenn ein linearer Zusammenhang besteht

60 + 2 (Stunden Schlaf) + 0.5 (Minuten Sport) = vorhergesagtes Alter

Bei 7 Stunden Schlaf und 30 Minuten Sport pro Tag sind, dass ein Alter von 89 Jahren.


Danke fürs Lesen! Erhalte weitere Tutorials in meinem kostenlosen Newsletter.
Jeden Monat teile ich mit Dir 4 neue praxisnahe Tutorials.
Trage Deine Mail zum kostenlosen Empfang des Newsletters* ein.




Quellenangabe Bilder: Icons und SVG-Grafiken im Titelbild von Microsoft PowerPoint 2019, frei verfügbar nach EULA
*) Mit dem Abonnement des Newsletters erklären Sie sich mit der Analyse des Newsletters durch individuelle Messung, Speicherung und Analyse von Öffnungsraten und der Klickraten in Profilen zu Zwecken der Gestaltung künftig besserer Newsletter einverstanden. Sie können die Einwilligung in den Empfang des Newsletters und die Messung mit Wirkung für die Zukunft widerrufen. Mehr in der Datenschutzerklärung.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.


Jeden Monat teile ich mit den Mitgliedern
4 neue praxisnahe ausführliche Tutorials (je 1000+ Wörter).


Trage Deine Mail, damit Du
Deine Coding + Hacking Skills erweitern kannst!