Data mining hledá skryté, platné a všechny možné užitečné vzory ve velkých datových sadách. Data Mining je technika, která vám pomůže objevit neočekávané / neobjevené vztahy mezi daty pro obchodní zisky.
Pro dolování dat je k dispozici mnoho užitečných nástrojů. Následuje seznam nejlepších 25 ručně vybraných softwaru pro dolování dat s oblíbenými funkcemi a nejnovějšími odkazy ke stažení. Tento srovnávací seznam obsahuje open source i komerční nástroje.
1) SAS Data mining:
Statistická analýza je produktem SAS. Byl vyvinut pro analytiku a správu dat. Nabízí grafické uživatelské rozhraní pro netechnické uživatele.
Funkce:
- Nástroje pro dolování dat SAS vám pomohou analyzovat velká data
- Je to ideální nástroj pro těžbu dat, těžbu textů a optimalizaci.
- SAS nabízí architekturu zpracování distribuované paměti, která je vysoce škálovatelná
Odkaz ke stažení: https://www.sas.com/en_us/insights/analytics/data-mining.html
2) Teradata:
Teradata je masivně paralelní otevřený systém zpracování pro vývoj rozsáhlých aplikací pro datové sklady. Teradata může běžet na serverové platformě Unix / Linux / Windows.
Funkce:
- Teradata Optimizer dokáže zpracovat až 64 spojení v dotazu.
- Data společnosti Tera mají nízké celkové náklady na vlastnictví. Je snadné jej nastavit, udržovat a spravovat.
- Podporuje SQL pro interakci s daty uloženými v tabulkách. Poskytuje jeho rozšíření.
- Pomůže vám automaticky distribuovat data na disky bez ručního zásahu.
- Teradata poskytuje nástroje pro načítání a uvolňování pro přesun dat do / ze systému Teradata.
Odkaz ke stažení: https://www.teradata.in/Products/Cloud/IntelliCloud
3) Programování R
R je jazyk pro statistické výpočty a grafiku. Používá se také pro analýzu velkých dat. Poskytuje širokou škálu statistických testů.
Funkce:
- Efektivní zařízení pro zpracování a ukládání dat,
- Poskytuje sadu operátorů pro výpočty na polích, zejména matice,
- Poskytuje ucelenou a integrovanou kolekci nástrojů velkých dat pro analýzu dat
- Poskytuje grafické vybavení pro analýzu dat, která se zobrazují na obrazovce nebo v tištěné podobě.
Odkaz ke stažení; https://www.r-project.org/
4) DESKA
Board je Management Intelligence Toolkit. Kombinuje funkce business intelligence a správy výkonu společnosti. Je navržen tak, aby poskytoval obchodní inteligenci a obchodní analytiku v jednom balíčku.
Funkce:
- Umožňuje analyzovat, simulovat, plánovat a předpovídat pomocí jediné platformy
- Vytvářet analytické a plánovací aplikace na míru.
- Board All-In-One kombinuje BI, Corporate Performance Management a Business Analytics.
- Umožňuje podnikům vyvíjet a udržovat sofistikované analytické a plánovací aplikace.
- Patentovaná platforma pomáhá vytvářet přehledy přístupem k více zdrojům dat.
Odkaz ke stažení: https://www.board.com/en
5) Dundas
Dundas je podnikový nástroj pro dolování dat, který lze použít k vytváření a prohlížení interaktivních řídicích panelů, sestav atd. Dundas BI můžete nasadit jako centrální datový portál pro organizaci.
Funkce:
- Serverová aplikace s plnou funkčností produktu
- Integrace a přístup ke všem druhům zdrojů dat
- Přizpůsobitelné vizualizace dat
- Inteligentní nástroje pro přetahování
- Vizualizujte data prostřednictvím map
- Prediktivní a pokročilá analýza dat
Odkaz ke stažení: http://www.dundas.com/support/dundas-bi-free-trial
6) Inetsoft
Inetsoft's Data mining tool style Intelligence is useful data mining and intelligence platform. Umožňuje rychlou a flexibilní transformaci dat z různých zdrojů.
Funkce:
- Pomáhá vám získat přístup ke strukturovaným a polostrukturovaným zdrojům, místním aplikacím
- Umožňuje optimalizovat aplikace pro spotřebu a aktualizaci dat
- Nabídka přizpůsobených a bezpečných úrovní průzkumu a vykazování dat.
- Škálování pro velké datové sady uživatelů pomocí vestavěné platformy Spark
- Generujte stránkované zprávy s vloženou obchodní logikou a parametrizací
Odkaz ke stažení: https://www.inetsoft.com/products/StyleIntelligence/
7) H3O
H3O je další vynikající open source software pro dolování dat. Používá se k provádění analýzy dat na datech uchovávaných v aplikačních systémech cloud computingu.
Funkce:
- H3O vám umožňuje využívat výpočetní výkon distribuovaných systémů a výpočet v paměti
- Umožňuje rychlé a snadné nasazení do produkce pomocí Java a binárního formátu.
- Pomůže vám používat programovací jazyky jako R,
- Python a další k vytvoření modelu v H3O
- Distribuované zpracování v paměti
Odkaz ke stažení: https://www.h3o.ai/
8) Qlik
Qlik je nástroj pro dolování a vizualizaci dat. Nabízí také řídicí panely a podporuje více zdrojů dat a typů souborů.
Funkce:
- Přetažením a vytvořením flexibilních interaktivních vizualizací dat
- Okamžitě reagujte na interakce a změny.
- Podporuje více zdrojů dat a typů souborů
- Umožňuje snadné zabezpečení dat a obsahu na všech zařízeních.
- Umožňuje vám sdílet relevantní analýzy, včetně aplikací a příběhů, pomocí centralizovaného centra.
Odkaz ke stažení: https://www.qlik.com/us/products/qlik-sense
9) RapidMiner:
RapidMiner je bezplatný nástroj pro dolování dat. Používá se pro přípravu dat, strojové učení a nasazení modelu. Nabízí řadu produktů pro vytváření nových procesů dolování dat a prediktivní analýzu nastavení.
Funkce:
- Povolte více metod správy dat
- GUI nebo dávkové zpracování
- Integruje se s vlastními databázemi
- Interaktivní, sdílitelné řídicí panely
- Big Data prediktivní analytika
- Zpracování vzdálené analýzy
- Filtrování dat, spojování, slučování a agregace
- Vytvářejte, trénujte a ověřujte prediktivní modely
- Zprávy a spuštěná oznámení
Odkaz ke stažení: https://my.rapidminer.com/nexus/account/index.html#downloads
10) Oracle BI
Oracle BI je open source strojové učení a vizualizace dat pro nováčky i odborníky. Interaktivní pracovní postupy pro analýzu dat s velkým souborem nástrojů.
Funkce:
- Interaktivní vizualizace dat.
- Nabízí interaktivní průzkum dat pro rychlou kvalitativní analýzu s čistými vizualizacemi.
- Orange podporuje praktická školení a vizuální ilustrace konceptů z oblasti datové vědy.
- Nabízí širokou škálu doplňků pro dolování dat z externích zdrojů dat.
Odkaz ke stažení: https://orange.biolab.si/
11) KNIME
KNIME je open source software pro vytváření aplikací a služeb datové vědy. Tento nástroj pro dolování dat vám pomůže porozumět datům a navrhnout pracovní postupy vědy o datech.
Funkce:
- Pomáhá vám vytvářet pracovní postupy datové vědy typu end to end
- Smíchejte data z jakéhokoli zdroje
- Umožňuje agregovat, třídit, filtrovat a spojovat data buď na místním počítači, v databázi nebo v distribuovaných prostředích s velkými daty.
- Vytvářejte modely strojového učení pro klasifikaci, regrese, redukci dimenzí
Odkaz ke stažení: https://www.knime.com/software-overview
12) Tanagra
Tangra je bezplatný nástroj pro dolování dat pro studijní a výzkumné účely. Nabízí různé metody dolování dat od statistického učení, analýzy dat a strojového učení.
Funkce:
- Nabízí snadno použitelný software pro dolování dat pro výzkumné pracovníky a studenty
- Umožňuje uživateli přidat své metody dolování dat.
Odkaz ke stažení: https://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
13) Řešitel:
Řešitel XLminer je snadno použitelný profesionální nástroj pro dolování dat na vizualizaci dat, prognózy a dolování dat v aplikaci Excel. Nabízí komplexní sadu funkcí pro přípravu dat pro import a čištění vašich dat.
Funkce:
- XLMiner nabízí komplexní sadu analytických funkcí založených jak na statistických metodách, tak na metodách strojového učení.
- Tento nástroj umožňuje pracovat s velkými soubory dat, které mohou překročit limity v aplikaci Excel.
- Nabízí integrované funkce pro průzkum a vizualizaci dat.
- Zkoumání dat nabízí rychlý přehled o skrytých vztazích v datech.
Odkaz ke stažení: https://www.solver.com/xlminer-data-mining
14) Rozum
Sisense je další efektivní nástroj pro dolování dat. Okamžitě analyzuje a vizualizuje velké i různorodé datové sady. Je to ideální nástroj pro vytváření řídicích panelů s širokou škálou vizualizací.
Funkce:
- Umožňuje vytvářet interaktivní řídicí panely bez technických dovedností
- Vytvořte jedinou verzi pravdy s bezproblémovými daty
- Sjednoťte nesouvisející data na jednom centralizovaném místě
- Výchozí uživatelské rozhraní drag-and-drop
- Umožňuje přístup k řídicím panelům i v mobilním zařízení
- Poutavá vizualizace
- Identifikuje kritické metriky pomocí filtrování a výpočtů
- Zachází s velkými daty na jednom komoditním serveru
Odkaz ke stažení: https://www.sisense.com/
15) Data Melt
DataMelt je bezplatný nástroj pro numerické výpočty, matematiku, analýzu dat a vizualizaci dat. Tento program nabízí jednoduchost skriptovacích jazyků, jako jsou Python, Ruby, Groovy, s výkonem stovek balíčků Java.
Funkce:
- DataMelt nabízí statistiky, analýzu velkých objemů dat a vědeckou vizualizaci.
- Můžete jej použít s různými programovacími jazyky na různých operačních systémech.
- Umožňuje vám vytvářet vysoce kvalitní vektorové grafické obrázky (EPS, SVG, PDF atd.), Které lze zahrnout do LaTeXu a jiného textového procesoru.
- Data Melt nabízí použití skriptovacích jazyků, které jsou podstatně rychlejší než standardní Python implementovaný v C.
Odkaz ke stažení: https://jwork.org/dmelt/
16) ELKI:
ELKI je open source nástroj pro dolování dat napsaný v Javě. Tento nástroj nám umožňuje zkoumat algoritmy s důrazem na metody bez dohledu v klastrové analýze a detekci odlehlých hodnot.
Funkce:
- ELKI nabízí rozsáhlou sbírku vysoce parametrizovatelných algoritmů
- Umožňuje snadné a spravedlivé vyhodnocení a srovnávání algoritmů.
- ELKI poskytuje struktury datových indexů, jako je R * -tree, které zlepšují proces dolování dat
Odkaz ke stažení : https://elki-project.github.io/
17) SPMF
SPMF je open-source knihovna pro dolování dat napsaná v Javě. Je distribuován pod licencí GPL. Umožňuje vám integrovat zdrojový kód s jiným softwarem Java.
Funkce:
- Umožňuje dolování pravidel přidružení
- Podporuje sekvenční vzor a sekvenční těžbu pravidel
- Nabízí těžařský model těžby,
- Těžba časových řad.
- Podpora komplexního procesu shlukování a klasifikace
Odkaz ke stažení: http://www.philippe-fournier-viger.com/spmf/
18) Alteryx
Alteryx je řešení podnikové inteligence a analýzy pro podnik. Jedná se o speciálně navržený nástroj pro analytiky dat a obchodní vůdce.
Funkce:
- Analytics pro středně velké firmy
- Umožňuje analýzu ad hoc.
- Nabízí rychlé online analytické zpracování
- Automatické plánované hlášení
- Vysoce přizpůsobitelný řídicí panel
Odkaz ke stažení: https://www.alteryx.com/
19) Enterprise Miner
Enterprise Miner je software SAS, který vám nabízí špičkové algoritmy navržené tak, aby vám pomáhaly řešit nejvýznamnější výzvy, a nabízí nejlepší řešení pro vaše podnikání.
Funkce:
- Pomůže vám zlepšit přesnost predikce. Sdílejte spolehlivé výsledky
- Snadno použitelné grafické uživatelské rozhraní a dávkové zpracování
- Pokročilé prediktivní a popisné modelování
- Nabídky Automatické bodování
- Automatizujte nasazení a hodnocení modelů
Odkaz ke stažení: https://www.sas.com/en_us/software/enterprise-miner.html
20) Datawatch
Datawatch Desktop je řešení pro dolování dat a business intelligence. Umožňuje vám soustředit se na vizualizaci dat v reálném čase. Nabízí nástroje pro sestavení a nasazení jejich monitorovacích a analytických systémů bez nutnosti psát jediný řádek kódu.
Funkce:
- Funkce přetažení umožňuje uživatelům vytvářet přizpůsobené zobrazení dat
- Identifikujte obchodní anomálie
- Analyzujte, jak alternativní scénáře ovlivní výkon pomocí historických dat
Odkaz ke stažení: https://www.datawatch.com/in-action/panopticon-streaming-analytics-platform/
21) Pokročilý horník
Pokročilý horník je užitečný nástroj pro zpracování, analýzu a modelování dat. Jeho uživatelsky přívětivé rozhraní pracovního toku umožňuje prozkoumat různé typy dat.
Funkce:
- Extrakce a ukládání dat z / do různých databázových systémů, souborů a transformací dat
- Nabízí různé operace s daty, jako je vzorkování, připojení datových sad atd.
- Pomáhá vám vytvářet statistické modely, analýzu proměnné důležitosti, shlukovou analýzu atd.
- Snadná a efektivní integrace modelů s externími IT aplikacemi
Odkaz ke stažení: https://algolytics.com/products/advancedminer/
22) Analytický řešič
Analytický řešitel může používat nástroj point-and-click. Umožňuje vám provádět ve vašem prohlížeči analýzu rizik a normativní analýzu. Nabízí úlohy pro těžbu dat s plným výkonem.
Funkce:
- Pomáhá vám začlenit nejistotu a vyřešit pomocí optimalizace simulace, náhodného programování a robustní optimalizace.
- Umožňuje definovat simulační model Monte Carlo pomocí vzorců aplikace Excel
Odkaz ke stažení: https://analyticsolver.com/
23) PolyAnalyst
PolyAnalyst je nástroj pro těžbu dat a analytický nástroj pro získávání použitelných znalostí skrytých a skutečných strukturovaných dat.
Funkce:
- Pomáhá vám přistupovat k datům z různých zdrojů a slučovat data z různých zdrojů
- Můžete si vybrat ze široké nabídky statistických algoritmů a algoritmů strojového učení.
- Nabídne vám vytvoření zprávy o ucpání, kterou lze shrnout a sdělit váš pohled
Odkaz ke stažení: https://www.megaputer.com/polyanalyst/
24) Civis
Civis vám umožňuje činit informovaná rozhodnutí s vědomím datového vědce a rozhodovacího trhu. Umožňuje vašemu týmu efektivně spolupracovat a rychleji hledat řešení.
Funkce:
- Nabízí architekturu, produkty a procesy, které vám pomohou chránit vaše data
- Můžete konfigurovat s knihovnou pro příjem dat a moduly ETL.
- Napište kód do skriptu, nabídněte do pracovního postupu více skriptů nebo úloh a definujte pracovní postup, který se má spouštět podle plánu.
- Umožňuje přeměnit vaši analýzu a modely na aplikace, které běží na flexibilní infrastruktuře na úrovni výroby
Odkaz ke stažení: https://www.civisanalytics.com/civis-platform/
25) Hledání:
Viscovery je softwarová sada zaměřená na pracovní postupy. Je založen na samoorganizujících se mapách a vícerozměrných statistikách pro explorativní dolování dat a prediktivní modelování. Systém vyniká intuitivním vedením uživatele, vyspělou implementací.
Funkce:
- Ideální platforma projektového prostředí pro provoz zaměřený na cíl
- Vyhrazené pracovní postupy, které vám umožňují nabídnout cílenou navigaci
- Vyčistěte kroky pracovního postupu pomocí osvědčeného výchozího nastavení
- Větvení pracovního toku umožňující generování variant modelu
- Funkce pro integrovanou dokumentaci a anotaci
- Více manipulačních nástrojů pro usnadnění používání
Odkaz ke stažení: https://www.viscovery.net/somine/