Classificazione degli algoritmi nell'apprendimento automatico
- 24-07-2022
- chuong xuan
- 0 Comments
Esistono molti tipi diversi di algoritmi di apprendimento, classificati in base a molti criteri diversi. Ad esempio, in base a come quel modello apprende (stile di apprendimento) o in base alla funzione, può essere riassunto dai seguenti criteri:
- Il processo di formazione necessita della supervisione umana? Supervisionato (supervisionato), Non supervisionato (non supervisionato), Semi-supervisionato (metà supervisionato) e Reinforcement Learning (apprendimento per rinforzo).
- Confronta la modifica dei dati confrontando i vecchi punti dati con i nuovi punti dati da cui trarre conclusioni o creare modelli di regole per i dati di addestramento e quindi creare modelli da indovinare come alcuni algoritmi (apprendimento basato su istanze, basato su modelli).
Mục lục
Apprendimento supervisionato/non supervisionato
Questo algoritmo viene spesso utilizzato nei problemi di clustering/etichettatura.
Apprendimento supervisionato
Dalla coppia di dati di input è (dati, etichetta) e prevede l'output di nuovi dati nuovo input. Cioè, quando l'input è l'insieme X={x1, x2,…, xn} e il corrispondente insieme di etichette Y = {y1, y2, .., yn} dove X, Y sono 2 vettori. Dato che X e Y sono set di dati di addestramento, da questo set di addestramento avremo bisogno di una funzione che mappi ogni elemento di X su un elemento y previsto con y_pre ~ f(xi).
Il problema del controllo della posta elettronica per lo spam è un'applicazione pratica di questo modello. L'algoritmo prenderà come input le email con l'etichetta come spam o meno. E da lì, l'algoritmo basato sulle paure determina se un'e-mail con nuovi dati è spam o meno. Alcuni algoritmi di apprendimento supervisionato come Regressione lineare, Regressione logistica, Reti neurali, …
Apprendimento senza supervisione
In questo algoritmo, non conosceremo il risultato ma solo i dati di input. Determinare in base alla struttura dei dati per eseguire una determinata attività come il clustering. Il sistema imparerà senza che nessuno insegni.
Due algoritmi possono essere menzionati nel modello di apprendimento non supervisionato come: Clustering o Association
- Clustering: aiuta a scomporre i dati in base alla loro pertinenza. Ad esempio, segmentare i clienti sui social network da lì per analizzare il comportamento degli utenti e portare dati a un gruppo di persone simili.
- Alcuni popolari algoritmi di clustering
- K-Mezzi
- k-mediane
- Massimizzazione delle aspettative
- Analisi dei cluster gerarchici (HCA)
- Alcuni popolari algoritmi di clustering
- Associazione: definisce le regole dei dati.
Apprendimento semi-supervisionato
I problemi in cui abbiamo una grande quantità di dati ma solo una parte dei quali siamo etichettati è chiamato apprendimento semi-supervisionato. Questo è tra l'apprendimento non supervisionato e quello supervisionato. Ad esempio, un problema in cui solo una parte di un'immagine o di un testo è etichettata (ad es. immagini di persone, animali o testi scientifici o politici) e la maggior parte delle altre immagini/testi non sono etichettati, raccolti da Internet. In effetti, molti problemi di Machine Learning rientrano in questo gruppo perché la raccolta di dati etichettati richiede molto tempo ed è costosa. Molti tipi di dati richiedono addirittura che un esperto li etichetti (immagini mediche, ad esempio). Al contrario, i dati senza etichetta possono essere ottenuti a basso costo da Internet.
Insegnamento rafforzativo
I dati di input dell'apprendimento per rinforzo sono quasi indeterminati. Che l'algoritmo imparerà direttamente. Quindi maggiore è l'apprendimento, maggiore sarà l'accuratezza dei dati di output perché ogni machine learning sarà premiato con una certa ricompensa. AlphaGo, ad esempio, è un sistema che utilizza l'apprendimento per rinforzo e ha vinto anche contro il miglior giocatore di Go al mondo.
Riepilogo
Determinare a quale modello appartengono i dati è un passaggio molto importante per trovare un algoritmo di addestramento che si adatti ai dati e ai requisiti del problema. Attraverso questo articolo, si spera che tutti capiscano di più sugli algoritmi in ML. Nei seguenti articoli, approfondirò la spiegazione e l'analisi di ciascuno degli algoritmi sopra menzionati.