Das Schlagwort Maschinelles Lernen ist aktuell allgegenwärtig. Egal ob im Kontext von Industry 4.0, E-Commerce oder Marketing, dort wo Daten vorhanden sind ist das maschinelle Lernen grundsätzlich anwendbar. Was jedoch tatsächlich darunter verstanden wird, ist häufig unklar. Der folgende Artikel gibt einen Überblick, was sich wirklich dahinter verbirgt.
Der anerkannte Experte Robert Schapire sieht das maschinelle Lernen als automatisierten Prozess, um auf Basis von historisierten Daten zukünftige Aktivitäten zu optimieren bzw. zu verbessern. Damit wird auch deutlich, warum das Ganze als „Maschinelles Lernen“ bezeichnet wird:
Der Computer beziehungsweise die darin ablaufenden digitalen Prozesse werden auf bereits vorliegenden Daten automatisiert trainiert, um damit die erworbenen Kenntnisse später auf neue Daten und die damit verbundenen Prozesse anzuwenden. Das ist auch der wesentliche Unterschied zu bisherigen analytischen Verfahren, die im Kern eine manuelle Modellbildung vorschalten, um im Anschluss diese Modelle als „statische“ Lösung zu implementieren.
Sollten sich die Prozessbedingungen verändern, führt dies schnell zu fehlerhaften Ergebnissen. Das maschinelle Lernen reduziert diese Art von Fehlern. Dabei werden mit jedem neuen Datensatz mehr Kenntnisse erworben und damit das Modell ständig verbessert. Dies geschieht ohne menschlich gesteuerte Interaktion. Deshalb wird das maschinelle Lernen auch als Unterkategorie der künstlichen Intelligenz verstanden. Der Mensch übernimmt nur noch die Aufgabe, die relevanten Daten und Algorithmen auszuwählen, zu parametrisieren und den Prozess zu überwachen. Es werden vier Typen von Maschinellem Lernen unterschieden:
Überwachtes Lernen impliziert, dass Modelle auf gelabelten Daten trainiert werden. Unter gelabelten Daten werden sowohl unabhängige Variablen (Features) als auch abhängige Variablen (Label) verstanden. Das Label fließt mit in das Modelltraining ein, damit das trainierte Modell bei neuen Daten (ohne Label) das Label vorhersagen kann. Beispielhafte Algorithmen sind: Support Vector Machines, Stochastic Gradient Descent, Naive Bayes Classification, Random Forests und Neural Networks (Supervised).
Unüberwachtes Lernen setzt voraus, dass es keine Trainingsdaten gibt und das Ergebnis unklar ist. Im Gegensatz zum Überwachten Lernen ist kein Label (abhängige Variable) vorhanden. Der Algorithmus verarbeitet vollkommen explorativ die Daten und führt eine eigenständige Klassifikation (Clustering) durch. Ausgewählte Algorithmen sind u.a. K-Means Clustering, Hierarchical Clustering, Affinity Propagation und Principal Component Analysis.
Halb-überwachtes Lernen stellt eine Art Mischung aus den zwei bereits erwähnten Typen dar und kommt häufig dann zum Einsatz, wenn nur ein kleiner Teil der Daten gelabelt ist. Das Ziel dieses Lernansatzes ist, den nicht gelabelten Daten ein Label zuzuweisen. Eine weit verbreitete Methode ist hierbei die Label Propagation. Die Methode weist Ähnlichkeiten mit dem Clustering Algorithmus auf: Daten werden in Cluster geteilt und innerhalb eines jeden Clusters kann dann den nicht gelabelten Daten das gleiche Label zugeordnet werden, das auch die gelabelten Daten aufweisen.
Bestärkendes Lernen bedeutet, dass der Algorithmus eine Strategie (Policy) erlernt, um in einer definierten Umgebung (Environment) an ein bestimmtes Ziel (Goal-State) zu kommen. Dabei wechselt er mittels festgelegten Aktionen von einem Zustand in einen anderen, bis das Ziel erreicht wird. Ein Beispiel dafür ist Markov Decision Process.
Die zwei am meisten zum Einsatz kommenden Arten des maschinellen Lernens sind überwachtes Lernen und unüberwachtes Lernen. Beide werden in einem breiten Anwendungsspektrum zum Einsatz gebracht. So unter anderem bei der Bildanalyse, Bilderkennung, Sprachsteuerung, Spracherkennung, Chatbots, Gesichtserkennung und Sentiment-Analyse.