Diplomová práce se zabývá asociačními metodami v data miningu, asociačními pravidly jakožto vzory chování ukrytými v datech a vizualizací některých problémů pro vybranou data miningovou úlohu.
Cílem práce bylo seznámit se s užitím asociačních metod při řešení data miningových úloh a na základě získaných znalostí vytvořit interaktivní výukovou aplikaci, která bude pracovat s rozsáhlými datovými soubory, těžit z nich informace a odhalovat skryté asociace, a kterou bude možné dále využívat jako podpůrný prostředek při výuce data miningu.
Výsledná aplikace zpracovává transakční data obsažená v textovém souboru, analyzuje je a třídí, dle požadovaných kritérií vyhledává vztahy v podobě asociačních pravidel s využitím některých známých algoritmů zefektivňujících tento proces a výsledky zprostředkovává uživateli vizuálně prostřednictvím přehledů a tabulek.
Aplikace funguje jako výukový nástroj a je částečně výkladová, kromě slovních popisů vybraných pojmů z problematiky asociačních metod obsahuje rovněž grafické vizualizace těchto problémů usnadňujících jejich pochopení a měla by být užitečnou pomůckou studentům data miningu při studiu.
Pro vývoj aplikace byl zvolen programovací jazyk C# a byla vytvořena ve vývojovém prostředí Visual Studio 2015.
Anotace v angličtině
This thesis deals with association methods in data mining, with association rules as behaviour patterns hidden in data and with data visualization of some problems for the selected data mining task.
The aim of this work was to become familiar with using the association methods for solving data mining tasks and on the basis to this knowledge create an interactive educational application, which will work with large data sets, obtain certain information of them and uncover hidden associations, and which will be also used as a support tool for teaching data mining.
This application processes some transactional data contained in a text file, analyses and categorizes them, according to the required criteria it retrieves some relationships in the form of association rules using some well-known algorithms accelerating this process and it conveys these results to a user visually through a variety of reports and tables.
Final application works as a teaching tool and is partly educational. In addition to verbal descriptions of selected terms of the issue of association methods it also includes some graphical visualizations of these problems, which makes them easy to understand and it should by a useful tool for students studying data mining.
For a development of this application was chosen programming language C# and it was created in the integrated development environment Visual Studio 2015.
Klíčová slova
data mining, asociace, asociační metody, asociační pravidla, vizualizace
Klíčová slova v angličtině
data mining, associations, association methods, association rules, visualization
Rozsah průvodní práce
59
Jazyk
CZ
Anotace
Diplomová práce se zabývá asociačními metodami v data miningu, asociačními pravidly jakožto vzory chování ukrytými v datech a vizualizací některých problémů pro vybranou data miningovou úlohu.
Cílem práce bylo seznámit se s užitím asociačních metod při řešení data miningových úloh a na základě získaných znalostí vytvořit interaktivní výukovou aplikaci, která bude pracovat s rozsáhlými datovými soubory, těžit z nich informace a odhalovat skryté asociace, a kterou bude možné dále využívat jako podpůrný prostředek při výuce data miningu.
Výsledná aplikace zpracovává transakční data obsažená v textovém souboru, analyzuje je a třídí, dle požadovaných kritérií vyhledává vztahy v podobě asociačních pravidel s využitím některých známých algoritmů zefektivňujících tento proces a výsledky zprostředkovává uživateli vizuálně prostřednictvím přehledů a tabulek.
Aplikace funguje jako výukový nástroj a je částečně výkladová, kromě slovních popisů vybraných pojmů z problematiky asociačních metod obsahuje rovněž grafické vizualizace těchto problémů usnadňujících jejich pochopení a měla by být užitečnou pomůckou studentům data miningu při studiu.
Pro vývoj aplikace byl zvolen programovací jazyk C# a byla vytvořena ve vývojovém prostředí Visual Studio 2015.
Anotace v angličtině
This thesis deals with association methods in data mining, with association rules as behaviour patterns hidden in data and with data visualization of some problems for the selected data mining task.
The aim of this work was to become familiar with using the association methods for solving data mining tasks and on the basis to this knowledge create an interactive educational application, which will work with large data sets, obtain certain information of them and uncover hidden associations, and which will be also used as a support tool for teaching data mining.
This application processes some transactional data contained in a text file, analyses and categorizes them, according to the required criteria it retrieves some relationships in the form of association rules using some well-known algorithms accelerating this process and it conveys these results to a user visually through a variety of reports and tables.
Final application works as a teaching tool and is partly educational. In addition to verbal descriptions of selected terms of the issue of association methods it also includes some graphical visualizations of these problems, which makes them easy to understand and it should by a useful tool for students studying data mining.
For a development of this application was chosen programming language C# and it was created in the integrated development environment Visual Studio 2015.
Klíčová slova
data mining, asociace, asociační metody, asociační pravidla, vizualizace
Klíčová slova v angličtině
data mining, associations, association methods, association rules, visualization
Zásady pro vypracování
Prostudujte problém asociačních a rozhodovacích pravidel v úlohách data miningu.
Zabývejte se příspěvkem českých vědců k této problematice. Zpracujte jako téma pro kurz Data mining.
Algoritmy, které umí vyhledat vzory chování ukryté ve velkých datech, analyzujte, naprogramujte, případně optimalizujte.
Celé téma zpracujte jako interaktivní výkladovou aplikaci pro e-learningový portál tak, aby student mohl jednotlivé algoritmy testovat.
Zásady pro vypracování
Prostudujte problém asociačních a rozhodovacích pravidel v úlohách data miningu.
Zabývejte se příspěvkem českých vědců k této problematice. Zpracujte jako téma pro kurz Data mining.
Algoritmy, které umí vyhledat vzory chování ukryté ve velkých datech, analyzujte, naprogramujte, případně optimalizujte.
Celé téma zpracujte jako interaktivní výkladovou aplikaci pro e-learningový portál tak, aby student mohl jednotlivé algoritmy testovat.
Seznam doporučené literatury
\renewcommand{\labelenumi}{[\arabic{enumi}]}
BERKA, Petr. Dobývání znalostí z databází. Praha: Academia, 2003, s.18. ISBN 80-200-1062-9
SKALSKÁ, Hana. Data mining a klasifikační modely. Vyd. 1. Hradec Králové: GAUDEAMUS, 2010, 154 s. ISBN 978-80-7435-088-7
MAYER-SCHONBERGER, Viktor; CUKIER, Kenneth. Big Data. Vyd. 1. Praha: Computer Press, 2014, 256 s. ISBN 978-80-251-4119-9
PUDIL, Petr. Metodology and Advances in Feature Selection for Statistical Pattern Recognition. Disertace DrSc., UTIA AV ČR, Praha 2001
HÁJEK P; HAVRÁNEK T. CHYTIL M. METODA GUHA. Automatická tvorba hypotéz. Academia, Praha 1983
Seznam doporučené literatury
\renewcommand{\labelenumi}{[\arabic{enumi}]}
BERKA, Petr. Dobývání znalostí z databází. Praha: Academia, 2003, s.18. ISBN 80-200-1062-9
SKALSKÁ, Hana. Data mining a klasifikační modely. Vyd. 1. Hradec Králové: GAUDEAMUS, 2010, 154 s. ISBN 978-80-7435-088-7
MAYER-SCHONBERGER, Viktor; CUKIER, Kenneth. Big Data. Vyd. 1. Praha: Computer Press, 2014, 256 s. ISBN 978-80-251-4119-9
PUDIL, Petr. Metodology and Advances in Feature Selection for Statistical Pattern Recognition. Disertace DrSc., UTIA AV ČR, Praha 2001
HÁJEK P; HAVRÁNEK T. CHYTIL M. METODA GUHA. Automatická tvorba hypotéz. Academia, Praha 1983
Přílohy volně vložené
1 CD ROM
Přílohy vázané v práci
tabulky
Převzato z knihovny
Ano
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Průběh obhajoby je zveřejněn pouze přihlášenému uživateli.