Co je supervizované strojové učení?
Při supervizním učení trénujete stroj pomocí dat, která jsou dobře „označena “. To znamená, že některá data jsou již označena správnou odpovědí. Lze to přirovnat k učení, které probíhá za přítomnosti školitele nebo učitele.
Algoritmus supervizovaného učení se učí z označených tréninkových dat, pomáhá vám předvídat výsledky pro nepředvídaná data. Úspěšné vytváření, škálování a nasazování přesného supervizovaného strojového učení Model datové vědy vyžaduje čas a technické znalosti týmu vysoce kvalifikovaných datových vědců. Kromě toho musí datový vědec znovu sestavit modely, aby zajistil, že poskytnuté poznatky zůstanou pravdivé, dokud se data nezmění.
V tomto výukovém programu se naučíte
- Co je supervizované strojové učení?
- Co je učení bez dozoru?
- Proč supervidované učení?
- Proč nekontrolované učení?
- Jak supervidované učení funguje?
- Jak funguje učení bez dohledu?
- Typy technik strojového učení pod dohledem
- Typy technik strojového učení bez dozoru
- Kontrolované vs. nekontrolované učení
Co je učení bez dozoru?
Neřízené učení je technika strojového učení, při které nemusíte dohlížet na model. Místo toho musíte modelu umožnit, aby sám vyhledával informace. Zabývá se hlavně neoznačenými daty.
Algoritmy učení bez dozoru vám umožňují provádět složitější úlohy zpracování ve srovnání s učením pod dohledem. Přestože učení bez supervize může být nepředvídatelnější ve srovnání s jinými metodami hlubokého učení a posilování učení přirozeného učení.
Proč supervidované učení?
- Kontrolované učení vám umožňuje sbírat data nebo vytvářet datový výstup z předchozí zkušenosti.
- Pomůže vám optimalizovat výkonnostní kritéria pomocí zkušeností
- Kontrolované strojové učení vám pomůže vyřešit různé typy problémů s výpočty v reálném světě.
Proč nekontrolované učení?
Zde jsou hlavní důvody pro používání nekontrolovaného učení:
- Strojové učení bez dozoru najde v datech všechny druhy neznámých vzorů.
- Metody bez dozoru vám pomohou najít funkce, které mohou být užitečné pro kategorizaci.
- Probíhá v reálném čase, takže všechna vstupní data musí být analyzována a označena za přítomnosti studentů.
- Je jednodušší získat neoznačená data z počítače než označená data, která vyžadují ruční zásah.
Jak supervidované učení funguje?
Například chcete trénovat stroj, který vám pomůže předpovědět, jak dlouho vám bude trvat cesta domů z vašeho pracoviště. Zde začnete vytvořením sady označených dat. Tato data zahrnují
- Povětrnostní podmínky
- Denní čas
- Dovolená
Všechny tyto podrobnosti jsou vaše vstupy. Výstupem je doba, kterou trvalo v daný den odjet domů.
Instinktivně víte, že pokud venku prší, cesta domů vám bude trvat déle. Ale stroj potřebuje data a statistiky.
Podívejme se nyní, jak můžete v tomto příkladu vyvinout supervizovaný model učení, který uživateli pomůže určit čas dojíždění. První věc, kterou potřebujete k vytvoření, je tréninková datová sada. Tato tréninková sada bude obsahovat celkový čas dojíždění a odpovídající faktory, jako je počasí, čas atd. Na základě této tréninkové sady může váš stroj vidět, že existuje přímý vztah mezi množstvím deště a časem, který vám zabere cesta domů.
Zjistí tedy, že čím více prší, tím déle budete jezdit, abyste se vrátili domů. Může také vidět souvislost mezi časem, kdy odcházíte z práce, a časem, kdy budete na silnici.
Čím blíže jste k 18:00, tím déle trvá, než se dostanete domů. Vaše zařízení může najít některé vztahy s vašimi označenými daty.
Toto je začátek vašeho datového modelu. Začíná to mít vliv na to, jak déšť ovlivňuje způsob, jakým lidé řídí. Začíná to také vidět, že více lidí cestuje během určité denní doby.
Jak funguje učení bez dohledu?
Pojďme si vzít případ dítěte a jeho rodinného psa.
Zná a identifikuje tohoto psa. O několik týdnů později rodinný přítel přivede psa a pokusí se hrát s dítětem.
Dítě tohoto psa dříve nevidělo. Uznává však, že mnoho funkcí (2 uši, oči, chůze po 4 nohách) je jako její pes. Identifikuje nové zvíře jako psa. Toto je učení bez dozoru, kde se neučíte, ale učíte se z údajů (v tomto případě údajů o psu). Kdyby to bylo učení pod dohledem, rodinný přítel by řekl dítěti, že je to pes.
Typy technik strojového učení pod dohledem
Regrese:
Regresní technika předpovídá jednu výstupní hodnotu pomocí tréninkových dat.
Příklad: Pomocí regrese můžete předpovědět cenu domu z tréninkových dat. Vstupními proměnnými budou lokalita, velikost domu atd.
Klasifikace:
Klasifikace znamená seskupit výstup uvnitř třídy. Pokud se algoritmus pokusí označit vstup do dvou odlišných tříd, nazývá se to binární klasifikace. Výběr mezi více než dvěma třídami se označuje jako klasifikace více tříd.
Příklad : Zjištění, zda někdo bude či nebude neplatičem úvěru.
Silné stránky : Výstupy mají vždy pravděpodobnostní interpretaci a algoritmus lze regulovat, aby nedocházelo k přeplňování.
Slabé stránky : Logistická regrese může mít nižší výkon, když existuje několik nebo nelineární hranice rozhodování. Tato metoda není flexibilní, takže nezachycuje složitější vztahy.
Typy technik strojového učení bez dozoru
Problémy s učením bez dohledu se dále seskupily do problémů s klastrováním a přidružením.
Shlukování
Shlukování je důležitým konceptem, pokud jde o učení bez dozoru. Zabývá se hlavně hledáním struktury nebo vzoru ve sbírce nekategorizovaných dat. Algoritmy klastru zpracují vaše data a najdou přirozené klastry (skupiny), pokud v datech existují. Můžete také upravit, kolik klastrů by měly vaše algoritmy identifikovat. Umožňuje vám upravit členitost těchto skupin.
Sdružení
Pravidla přidružení umožňují navázat přidružení mezi datovými objekty uvnitř velkých databází. Tato technika bez dozoru je o objevování vzrušujících vztahů mezi proměnnými ve velkých databázích. Například lidé, kteří kupují nový domov, s největší pravděpodobností kupují nový nábytek.
Další příklady:
- Podskupina pacientů s rakovinou seskupených podle jejich měření genové exprese
- Skupiny nakupujících na základě jejich historie procházení a nákupu
- Skupina filmů podle hodnocení uděleného diváky filmů
Kontrolované vs. nekontrolované učení
Parametry | Technika strojového učení pod dohledem | Technika strojového učení bez dozoru |
Proces | V supervizovaném modelu učení budou uvedeny vstupní a výstupní proměnné. | V modelu bez dozoru budou poskytována pouze vstupní data |
Vstupní data | Algoritmy jsou trénovány pomocí označených dat. | Algoritmy se používají proti datům, která nejsou označena |
Použité algoritmy | Podpora vektorových strojů, neuronové sítě, lineární a logistické regrese, náhodných lesů a klasifikačních stromů. | Neregistrované algoritmy lze rozdělit do různých kategorií: jako Clusterové algoritmy, K-means, hierarchické shlukování atd. |
Výpočetní složitost | Kontrolované učení je jednodušší metoda. | Neřízené učení je výpočetně složité |
Použití údajů | Model supervizního učení využívá tréninková data k učení vazby mezi vstupem a výstupy. | Neupravené učení nepoužívá výstupní data. |
Přesnost výsledků | Vysoce přesná a důvěryhodná metoda. | Méně přesná a důvěryhodná metoda. |
Učení v reálném čase | Metoda učení probíhá offline. | Metoda učení probíhá v reálném čase. |
Počet tříd | Počet tříd je znám. | Počet tříd není znám. |
Hlavní nevýhoda | Klasifikace velkých dat může být v supervizovaném učení skutečnou výzvou. | Nemůžete získat přesné informace týkající se třídění dat a výstup jako data použitá v učení bez dozoru je označen a není znám. |
souhrn
- Při supervizním učení trénujete stroj pomocí dat, která jsou dobře „označena“.
- Neřízené učení je technika strojového učení, při které nemusíte dohlížet na model.
- Kontrolované učení vám umožňuje sbírat data nebo vytvářet datový výstup z předchozí zkušenosti.
- Strojové učení bez dozoru vám pomůže najít v datech všechny druhy neznámých vzorů.
- Například budete schopni určit čas potřebný k návratu zpět na základě povětrnostních podmínek, denní doby a svátků.
- Například Baby může identifikovat další psy na základě učení pod dohledem v minulosti.
- Regrese a klasifikace jsou dva typy technik strojového učení pod dohledem.
- Klastrování a přidružení jsou dva typy učení bez kontroly.
- V supervizovaném modelu učení budou zadány vstupní a výstupní proměnné, zatímco u modelu bez supervize budou uvedeny pouze vstupní data