Stáhnout PDF
1) Co je to strojové učení?
Strojové učení je odvětví informatiky, které se zabývá programováním systému, aby se automaticky učilo a zlepšovalo se zkušenostmi. Například: Roboti jsou naprogramováni tak, aby mohli provádět úkoly na základě dat shromážděných ze senzorů. Automaticky se učí programy z dat.
2) Uveďte rozdíl mezi dolováním dat a strojovým učením?
Strojové učení souvisí se studiem, designem a vývojem algoritmů, které dávají počítačům schopnost učit se bez výslovného programování. Zatímco dolování dat lze definovat jako proces, ve kterém se nestrukturovaná data pokouší získat znalosti nebo neznámé zajímavé vzory. Během tohoto procesního stroje se používají učící se algoritmy.
3) Co je to „Overfitting“ ve strojovém učení?
Ve strojovém učení, kdy statistický model popisuje náhodnou chybu nebo šum namísto základního vztahu, dojde k „overfitting“. Když je model příliš složitý, obvykle se pozoruje overfitting, protože má příliš mnoho parametrů s ohledem na počet tréninkových datových typů. Model vykazuje špatný výkon, který byl přehnaný.
4) Proč dochází k overfittingu?
Možnost overfittingu existuje, protože kritéria použitá pro trénink modelu nejsou stejná jako kritéria použitá k posouzení účinnosti modelu.
5) Jak se můžete vyhnout nadměrnému vybavení?
Použitím velkého množství dat je možné se vyhnout overfittingu, k overfittingu dochází relativně, protože máte malou datovou sadu a snažíte se z ní poučit. Ale pokud máte malou databázi a jste nuceni přijít s modelem založeným na tom. V takové situaci můžete použít techniku známou jako křížové ověření . V této metodě se datová sada rozdělí na dvě části, testovací a tréninkové datové sady, testovací datová sada otestuje pouze model, zatímco v tréninkové datové sadě přijdou datové body s modelem.
V této technice je modelu obvykle dána datová sada známých dat, na kterých je spuštěno školení (datová sada školení), a datová sada neznámých dat, proti kterým je model testován. Myšlenkou křížové validace je definování datové sady pro „testování“ modelu ve fázi školení.
6) Co je to indukční strojové učení?
Induktivní strojové učení zahrnuje proces učení pomocí příkladů, kdy se systém ze sady pozorovaných instancí pokouší vyvolat obecné pravidlo.
7) Jakých je pět populárních algoritmů strojového učení?
- Rozhodovací stromy
- Neuronové sítě (zpětné šíření)
- Pravděpodobnostní sítě
- Nejbližší soused
- Podporujte vektorové stroje
8) Jaké jsou různé techniky algoritmů ve strojovém učení?
Různé typy technik ve strojovém učení jsou
- Kontrolované učení
- Učení bez dozoru
- Učení s částečným dohledem
- Posílení učení
- Transdukce
- Naučit se učit
9) Jaké jsou tři fáze vytváření hypotéz nebo modelu ve strojovém učení?
- Vytváření modelu
- Testování modelu
- Použití modelu
10) Jaký je standardní přístup k učení pod dohledem?
Standardní přístup k učení pod dohledem je rozdělit množinu příkladů na tréninkovou sadu a test.
11) Co jsou „Training set“ a „Test set“?
V různých oblastech informační vědy, jako je strojové učení, se sada dat používá k objevení potenciálně prediktivního vztahu známého jako „Training Set“. Výcviková sada je příkladem poskytnutým studentovi, zatímco Testovací sada se používá k testování přesnosti hypotéz generovaných studentem a jedná se o soubor příkladů zadržovaných studentem. Tréninkový set se liší od Testovacího setu.
12) Seznam různých přístupů pro strojové učení?
Různé přístupy ve strojovém učení jsou
- Koncept Vs klasifikace učení
- Symbolické vs. statistické učení
- Induktivní vs. analytické učení
13) Co není strojové učení?
- Umělá inteligence
- Pravidlo odvozené
14) Vysvětlete, jaká je funkce „Neomezeného učení“?
- Najděte shluky dat
- Najděte nízkodimenzionální reprezentace dat
- Najděte zajímavé směry v datech
- Zajímavé souřadnice a korelace
- Najděte nová pozorování / čištění databáze
15) Vysvětlete, jaká je funkce „Kontrolovaného učení“?
- Klasifikace
- Rozpoznávání řeči
- Regrese
- Předvídat časové řady
- Komentujte řetězce
16) Co je to strojové učení nezávislé na algoritmu?
Strojové učení, kde jsou matematické základy nezávislé na konkrétním klasifikátoru nebo se učící algoritmus označuje jako strojové učení nezávislé na algoritmu?
17) Jaký je rozdíl mezi umělým učením a strojovým učením?
Navrhování a vývoj algoritmů podle chování založeného na empirických datech se označuje jako Machine Learning. Zatímco umělá inteligence kromě strojového učení zahrnuje i další aspekty, jako je reprezentace znalostí, zpracování přirozeného jazyka, plánování, robotika atd.
18) Co je klasifikátor ve strojovém učení?
Klasifikátor ve strojovém učení je systém, který vstupuje do vektoru diskrétních nebo spojitých hodnot funkcí a vydává jednu diskrétní hodnotu, třídu.
19) Jaké jsou výhody Naive Bayes?
V Naïve Bayes klasifikátor konverguje rychleji než diskriminační modely, jako je logistická regrese, takže potřebujete méně tréninkových dat. Hlavní výhodou je, že se nemůže naučit interakce mezi funkcemi.
20) V jakých oblastech se používá rozpoznávání vzorů?
Rozpoznávání vzorů lze použít v
- Počítačové vidění
- Rozpoznávání řeči
- Dolování dat
- Statistika
- Neformální načítání
- Bio-informatika
21) Co je genetické programování?
Genetické programování je jednou ze dvou technik používaných ve strojovém učení. Model je založen na testování a výběru nejlepší volby ze sady výsledků.
22) Co je to induktivní logické programování ve strojovém učení?
Induktivní logické programování (ILP) je podpole strojového učení, které využívá logické programování představující základní znalosti a příklady.
23) Co je to výběr modelu ve strojovém učení?
Proces výběru modelů mezi různými matematickými modely, které se používají k popisu stejné datové sady, se nazývá výběr modelu. Výběr modelu se aplikuje na pole statistiky, strojového učení a dolování dat.
24) Jaké jsou dvě metody použité pro kalibraci v supervizním učení?
Dvě metody používané k předpovědi dobrých pravděpodobností v supervizovaném učení jsou
- Plattova kalibrace
- Izotonická regrese
Tyto metody jsou navrženy pro binární klasifikaci a není triviální.
25) Jaká metoda se často používá k zabránění přeplnění?
Pokud je k dispozici dostatek dat, použije se „izotonická regrese“, aby se zabránilo problému s nadměrným vybavením.
26) Jaký je rozdíl mezi heuristikou pro učení pravidel a heuristikou pro rozhodovací stromy?
Rozdíl je v tom, že heuristika pro rozhodovací stromy hodnotí průměrnou kvalitu řady nesouvislých sad, zatímco studenti pravidel hodnotí pouze kvalitu sady instancí, která je pokryta kandidátským pravidlem.
27) Co je Perceptron ve strojovém učení?
V Machine Learning je Perceptron algoritmem pro kontrolovanou klasifikaci vstupu do jednoho z několika možných nebinárních výstupů.
28) Vysvětlete dvě složky Bayesovského logického programu?
Bayesovský logický program se skládá ze dvou složek. První komponenta je logická; sestává ze sady Bayesianských klauzí, které zachycují kvalitativní strukturu domény. Druhá složka je kvantitativní, kóduje kvantitativní informace o doméně.
29) Co jsou Bayesian Networks (BN)?
Bayesian Network se používá k reprezentaci grafického modelu pro vztah pravděpodobnosti mezi sadou proměnných.
30) Proč se algoritmus učení založený na instancích někdy označuje jako Lazy learning algorithm?
Algoritmus učení založený na instancích se také nazývá Lazy learning algoritmus, protože zpožďují proces indukce nebo generalizace, dokud není provedena klasifikace.
31) Jaké jsou dvě metody klasifikace, které SVM (Support Vector Machine) zvládne?
- Kombinace binárních klasifikátorů
- Úprava binárního kódu tak, aby zahrnoval učení více tříd
32) Co je souborové učení?
K řešení konkrétního výpočetního programu je strategicky generováno a kombinováno několik modelů, jako jsou klasifikátory nebo odborníci. Tento proces je znám jako souborové učení.
33) Proč se používá ansámblové učení?
Ensemble learning se používá ke zlepšení klasifikace, predikce, aproximace funkcí atd. Modelu.
34) Kdy použít souborové učení?
Ensemble learning se používá, když vytváříte klasifikátory komponent, které jsou přesnější a nezávislejší na sobě.
35) Jaká jsou dvě paradigmata souborových metod?
Dvě paradigmata metod souboru jsou
- Sekvenční metody souboru
- Metody paralelního souboru
36) Jaký je obecný princip souborové metody a co je pytlování a posilování v souborové metodě?
Obecným principem metody souboru je kombinovat předpovědi několika modelů vytvořených s daným algoritmem učení, aby se zlepšila robustnost nad jediným modelem. Pytlování je metoda v souboru pro zlepšení nestabilních odhadů nebo klasifikačních schémat. Zatímco metoda zesílení se používá postupně ke snížení zkreslení kombinovaného modelu. Posílení i pytlování mohou snížit chyby snížením termínu odchylky.
37) Co je bias-variance rozklad chyby klasifikace v metodě souboru?
Očekávanou chybu algoritmu učení lze rozložit na zkreslení a rozptyl. Termín zkreslení měří, jak blízko odpovídá průměrný klasifikátor produkovaný algoritmem učení cílové funkci. Termín odchylky měří, nakolik predikce algoritmu učení kolísá pro různé tréninkové sady.
38) Co je to algoritmus přírůstkového učení v souboru?
Metoda přírůstkového učení je schopnost algoritmu učit se z nových dat, která mohou být k dispozici poté, co už byl klasifikátor vygenerován z již dostupné datové sady.
39) Na co se používají PCA, KPCA a ICA?
PCA (Principal Components Analysis), KPCA (Principal Component Analysis) na jádře) a ICA (Independent Component Analysis) jsou důležité techniky extrakce prvků používané pro redukci rozměrů.
40) Co je redukce dimenze ve strojovém učení?
Ve strojovém učení a statistikách je redukce dimenzí procesem snižování počtu náhodných proměnných podle úvah a lze ji rozdělit na výběr prvků a extrakci prvků.
41) Co jsou podpůrné vektorové stroje?
Podpůrné vektorové stroje jsou supervizované výukové algoritmy používané pro klasifikaci a regresní analýzu.
42) Jaké jsou součásti technik relačního hodnocení?
Důležitými složkami technik relačního hodnocení jsou
- Sběr dat
- Získávání pozemské pravdy
- Technika křížové validace
- Typ dotazu
- Bodová metrika
- Test významnosti
43) Jaké jsou různé metody postupného učení pod dohledem?
Různé metody řešení problémů se sekvenčním supervizním učením jsou
- Metody posuvného okna
- Opakovaná posuvná okna
- Skryté modely Markow
- Modely Markow s maximální entropií
- Podmíněná náhodná pole
- Grafové transformátorové sítě
44) Jaké jsou oblasti v robotice a zpracování informací, kde vzniká problém se sekvenční predikcí?
Oblasti v robotice a zpracování informací, kde vzniká problém se sekvenční predikcí, jsou
- Napodobování učení
- Strukturovaná předpověď
- Výztuhy založené na modelech
45) Co je dávkové statistické učení?
Statistické techniky učení umožňují naučit se funkci nebo prediktor ze sady pozorovaných dat, které mohou předpovídat neviditelná nebo budoucí data. Tyto techniky poskytují záruky na výkon naučeného prediktoru budoucích neviditelných dat na základě statistického předpokladu procesu generování dat.
46) Co je PAC učení?
Učení PAC (pravděpodobně přibližně správné) je učební rámec, který byl zaveden za účelem analýzy algoritmů učení a jejich statistické účinnosti.
47) Jaké jsou různé kategorie, které můžete kategorizovat proces sekvenčního učení?
- Posloupnost predikce
- Generování sekvence
- Rozpoznávání sekvencí
- Postupné rozhodnutí
48) Co je sekvenční učení?
Sekvenční učení je metoda výuky a učení logickým způsobem.
49) Jaké jsou dvě techniky strojového učení?
Dvě techniky strojového učení jsou
- Genetické programování
- Induktivní učení
Motor doporučení implementovaný hlavními webovými stránkami elektronického obchodování používá Machine Learning.