3 Typer maskininlärning

3 Typer maskininlärning - dummies
< Maskininlärning kommer i många olika smaker, beroende på algoritmen och dess mål. Du kan dela maskininlärningsalgoritmer i tre huvudgrupper baserat på deras syfte:

Övervakad inlärning

  • Oövervakad inlärning
  • Förstärkning lärande
  • Övervakat lärande

Övervakat lärande

uppstår när en algoritm lär sig från exempel data och associerade målsvar som kan bestå av numeriska värden eller strängetiketter, t.ex. klasser eller taggar, för att senare kunna förutsäga det korrekta svaret när de ställs med nya exempel. Det övervakade tillvägagångssättet liknar verkligen mänskligt lärande under överinseende av en lärare. Läraren ger bra exempel för att studenten ska kunna memorera, och studenten får då allmänna regler från dessa specifika exempel.

Du måste skilja mellan regressionsproblem, vars mål är ett numeriskt värde och klassificeringsproblem, vars mål är en kvalitativ variabel, till exempel en klass eller en tagg. En regressionsuppgift bestämmer de genomsnittliga priserna på bostäder i Boston-området, och en klassificeringsuppgift skiljer mellan olika irisblommor baserat på deras sepal- och kronbladsåtgärder.

Unsupervised learning

Oövervakad inlärning

uppstår när en algoritm lär sig från vanliga exempel utan något associerat svar, vilket lämnar till algoritmen för att bestämma datormönstret i sig. Denna typ av algoritm tenderar att omstrukturera data till något annat, till exempel nya funktioner som kan representera en klass eller en ny serie okorrelerade värden. De är ganska användbara för att ge människor insikt i betydelsen av data och nya användbara ingångar till övervakade maskininlärningsalgoritmer.

Som en form av lärande liknar den hur människor använder sig för att räkna ut att vissa objekt eller händelser är från samma klass, till exempel genom att observera graden av likhet mellan objekt. Några rekommendationssystem som du hittar på webben i form av marknadsautomatisering baseras på denna typ av lärande.

Marknadsautomatiseringsalgoritmen hämtar sina förslag från vad du har köpt tidigare. Rekommendationerna baseras på en uppskattning av vilken grupp av kunder du liknar mest och sedan avleda dina troliga preferenser baserat på den gruppen.

Förstärkning lärande

Förstärkning lärande

inträffar när du presenterar algoritmen med exempel som saknar etiketter, som i oövervakat lärande. Du kan dock följa ett exempel med positiv eller negativ feedback enligt den lösning som algoritmen föreslår.Förstärkningsinlärning är kopplad till applikationer för vilka algoritmen måste fatta beslut (så produkten är föreskrivande, inte bara beskrivande, som vid oövervakat lärande) och besluten har konsekvenser. I den mänskliga världen är det bara som att lära sig genom försök och fel. Fel hjälper dig att lära dig för att de har böter (kostnad, förlust av tid, ånger, smärta osv.), Lär dig att en viss handlingssätt är mindre sannolikt att lyckas än andra. Ett intressant exempel på förstärkning lärande uppstår när datorer lär sig att spela videospel i sig.

I det här fallet presenterar en applikation algoritmen med exempel på specifika situationer, som att ha spelaren fast i en labyrint samtidigt som man undviker en fiende. Ansökan låter algoritmen känna till resultatet av de åtgärder som krävs och lärandet uppstår när man försöker undvika vad det upptäcker att vara farligt och att överleva. Du kan titta på hur företaget Google DeepMind har skapat ett förstärkningsprogram som spelar gamla Atarias videospel. När du tittar på videon märker du hur programmet är i början klumpigt och oskolat men förbättras stadigt med träning tills det blir en mästare.