Klassifizierung von Algorithmen im maschinellen Lernen
- 24-07-2022
- chuong xuan
- 0 Comments
Es gibt viele verschiedene Arten von Lernalgorithmen, die nach vielen verschiedenen Kriterien klassifiziert werden. Je nachdem, wie dieses Modell lernt (Lernstil) oder je nach Funktion, kann es beispielsweise anhand der folgenden Kriterien zusammengefasst werden:
- Braucht der Trainingsprozess menschliche Überwachung? Supervised (beaufsichtigt), Unsupervised (unbeaufsichtigt), Semi-supervised (halb überwacht) und Reinforcement Learning (bestärkendes Lernen).
- Vergleichen Sie die Änderung der Daten, indem Sie die alten Datenpunkte mit den neuen Datenpunkten vergleichen, um Schlussfolgerungen zu ziehen oder Regelmuster für die Trainingsdaten zu erstellen, und erstellen Sie dann Modelle, um wie einige Algorithmen zu raten (instanzbasiertes, modellbasiertes Lernen).
Mục lục
Überwachtes/unüberwachtes Lernen
Dieser Algorithmus wird häufig bei Clustering-/Kennzeichnungsproblemen verwendet.
Überwachtes Lernen
Aus dem Eingabedatenpaar wird (Daten, Label) die Ausgabe neuer Daten und neuer Eingang vorhergesagt. Das heißt, wenn die Eingabe der Satz X = {x1, x2, …, xn} und der entsprechende Etikettensatz Y = {y1, y2, …, yn} ist, wobei X, Y 2 Vektoren sind. Da X und Y Trainingsdatensätze sind, benötigen wir aus diesem Trainingssatz eine Funktion, die jedes Element von X auf ein Element y abbildet, das mit y_pre ~ f(xi) vorhergesagt wird.
Das Problem der Überprüfung von E-Mails auf Spam ist eine praktische Anwendung dieses Modells. Der Algorithmus nimmt als Eingabe E-Mails mit der Kennzeichnung als Spam oder nicht. Und von dort aus bestimmt der auf Ängsten basierende Algorithmus, ob eine E-Mail mit neuen Daten Spam ist oder nicht. Einige überwachte Lernalgorithmen wie lineare Regression, logistische Regression, neuronale Netze, …
Unbeaufsichtigtes Lernen
Bei diesem Algorithmus kennen wir nicht das Ergebnis, sondern nur die Eingabedaten. Bestimmen Sie basierend auf der Datenstruktur, um eine bestimmte Aufgabe auszuführen, wie z. B. Clustering. Das System lernt, ohne dass jemand etwas beibringt.
Zwei Algorithmen können im unüberwachten Lernmodell erwähnt werden, wie zum Beispiel: Clustering oder Assoziation
- Clustering: Hilft, Daten basierend auf ihrer Relevanz aufzuschlüsseln. Beispielsweise die Segmentierung von Kunden in sozialen Netzwerken von dort aus, um das Nutzerverhalten zu analysieren und Daten zu einer Gruppe von Personen mit Ähnlichkeit zu bringen.
- Einige beliebte Clustering-Algorithmen
- K-Mittel
- k-Mediane
- Erwartungsmaximierung
- Hierarchische Clusteranalyse (HCA)
- Einige beliebte Clustering-Algorithmen
- Assoziation: Definiert die Regeln der Daten.
Halbüberwachtes Lernen
Probleme, bei denen wir eine große Datenmenge haben, aber nur ein Teil davon gekennzeichnet ist, werden als halbüberwachtes Lernen bezeichnet. Dieser liegt zwischen Unsupervised und Supervised Learning. Beispielsweise ein Problem, bei dem nur ein Teil eines Bildes oder Textes beschriftet ist (z. B. Bilder von Menschen, Tieren oder wissenschaftlichen oder politischen Texten) und die meisten anderen Bilder/Texte unbeschriftet sind. Tatsächlich fallen viele Probleme des maschinellen Lernens in diese Gruppe, weil das Sammeln von gekennzeichneten Daten viel Zeit in Anspruch nimmt und teuer ist. Viele Arten von Daten erfordern sogar eine fachmännische Kennzeichnung (z. B. medizinische Bilder). Unbeschriftete Daten hingegen können kostengünstig aus dem Internet bezogen werden.
Verstärkungslernen
Die Eingangsdaten des Reinforcement Learning sind nahezu unbestimmt. Was der Algorithmus direkt lernen wird. Je mehr gelernt wird, desto höher wird die Genauigkeit der Ausgabedaten, da jedes maschinelle Lernen mit einer bestimmten Belohnung belohnt wird. AlphaGo zum Beispiel ist ein System, das Reinforcement Learning verwendet und sogar gegen den besten Go-Spieler der Welt gewonnen hat.
Zusammenfassung
Die Bestimmung, zu welchem Modell Ihre Daten gehören, ist ein sehr wichtiger Schritt, um einen Trainingsalgorithmus zu finden, der den Daten- und Problemanforderungen entspricht. Durch diesen Artikel wird hoffentlich jeder mehr über Algorithmen in ML verstehen. In den folgenden Artikeln werde ich mich mit der Erklärung und Analyse jedes der oben genannten Algorithmen befassen.