Portál TUL - Prohlížení

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Tisk/export:

Export dat do formátu PDF - který můžete pohodlně vytisknout...

Tento odkaz můžete zkopírovat a použít například jako záložku prohlížeče pro zobrazení aktuální pozice v Prohlížení IS/STAG.

Nepřihlášenému uživateli se zobrazují pouze již odevzdané práce.

Osobní čísla studentů se zobrazují pouze přihlášenému uživateli.

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Nalezeno 1 záznamů Tisk Export do Xls URL na seznam

Příjmení (rod. přijm.)	Jméno	Název	Stav práce		Vedoucí/školitelé	Oponenti	Typ práce	Dat. obhaj.	Název
Student	Typ práce	-	-	-	-	-	-	-	-	-	-
Kratochvíl	Filip	Vybrané problémy v přípravě dat pro data miningové úlohy			Císařová Klára	Gúčiková Erika	bakalářská	12.06.2018	Vybrané problémy v přípravě dat pro data miningové úlohy
Filip Kratochvíl	bakalářská	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX

Informace o kvalifikační práci Vybrané problémy v přípravě dat pro data miningové úlohy

Základní údaje

Anotace
Dokument, ke kterému přistupujete, podléhá autorskému zákonu. Jeho porušením se můžete vystavit trestnímu postihu!
Jméno	Kratochvíl Filip
Akad. rok	2017/2018
Zadávající pracoviště	MTI
Datum obhajoby	12. 6. 2018
Typ práce	bakalářská
Stav práce	Dokončená práce s úspěšnou obhajobou (DUO).
Úplnost vyplnění požadovaných údajů	- Všechny požadované údaje o této VŠKP jsou vyplněny.
Hlavní téma	Vybrané problémy v přípravě dat pro data miningové úlohy
Hlavní téma v angličtině	Selected Issues in Data Preparation for Datamining Tasks
Název dle studenta	Vybrané problémy v přípravě dat pro data miningové úlohy
Název dle studenta v angličtině	Selected Issues in Data Preparation for Datamining Tasks
Souběžný název	-
Podnázev	-
Vedoucí	Císařová Klára, RNDr. Ph.D.
Oponent	Gúčiková Erika, Ing.
Anotace	Data mining je v poslední době hojně využívaným nástrojem k získávání nových znalostí z již existujích dat, která donedávna nebylo možné zpracovávat, zejména kvůli nedostatečnému výkonu počítačových systémů. Práce shrnuje data miningový proces, popisuje jednotlivé metodologie a podrobněji je věnována přípravě dat pro data miningový proces. V rámci přípravy dat je velká pozornost věnována kategorizaci a imputaci chybějících hodnot spolu se statistikami, které jsou v řešení těchto problematik využívány. Výsledkem bakalářské práce je aplikace implementující nesupervizovanou a kombinovanou kategorizaci, prostou imputaci dat a vícerozměrnou regresní imputaci.
Anotace v angličtině	Data mining is widely used tool for getting new knowledge from existing data, which we were not able to process, because of their high quantity and low computing performance of computing systems, at that time. The Bachelor thesis summarizes the data mining process, describes used methodologies and also describes, in more detail, the preparation of data for the process, such as categorization of numerical data, imputation of the missing data and some of statistics used for these issues resolution. Thesis results in to the application implementing some of described issue resolutions, such as unsupervised, supervised and combined categorization, or simple one-dimensional and multidimensional regressive imputation.
Klíčová slova	Data mining, CRISP-DM, příprava dat, kategorizace dat, imputace chybějících hodnot
Klíčová slova v angličtině	Data mining, CRISP-DM, Data Preparation, Data Categorization, Imputation of Missing Values
Rozsah průvodní práce	47 s.
Jazyk	CZ
Data mining je v poslední době hojně využívaným nástrojem k získávání nových znalostí z již existujích dat, která donedávna nebylo možné zpracovávat, zejména kvůli nedostatečnému výkonu počítačových systémů. Práce shrnuje data miningový proces, popisuje jednotlivé metodologie a podrobněji je věnována přípravě dat pro data miningový proces. V rámci přípravy dat je velká pozornost věnována kategorizaci a imputaci chybějících hodnot spolu se statistikami, které jsou v řešení těchto problematik využívány. Výsledkem bakalářské práce je aplikace implementující nesupervizovanou a kombinovanou kategorizaci, prostou imputaci dat a vícerozměrnou regresní imputaci.
Anotace v angličtině
Data mining is widely used tool for getting new knowledge from existing data, which we were not able to process, because of their high quantity and low computing performance of computing systems, at that time. The Bachelor thesis summarizes the data mining process, describes used methodologies and also describes, in more detail, the preparation of data for the process, such as categorization of numerical data, imputation of the missing data and some of statistics used for these issues resolution. Thesis results in to the application implementing some of described issue resolutions, such as unsupervised, supervised and combined categorization, or simple one-dimensional and multidimensional regressive imputation.
Klíčová slova
Data mining, CRISP-DM, příprava dat, kategorizace dat, imputace chybějících hodnot
Klíčová slova v angličtině
Data mining, CRISP-DM, Data Preparation, Data Categorization, Imputation of Missing Values
Zásady pro vypracování	Prostudujte metodologii CRISP DM, velkou pozornost věnujte etapě přípravy dat pro DM úlohy. Zabývejte se speciálně problémem a také důvody pro kategorizaci dat, metodami optimální kategorizace, řešením chybějících hodnot a mnohonásobnou imputací. Vybrané problémy a návrh vlastních algoritmů naprogramujte v libovolném programovacím jazyku jako výkladovou aplikaci, kterou bude zároveň možné použít pro základní analýzu libovolné datové matice. Kvalitu aplikace z pohledu podpory porozumění uvedeným problémům testujte se studenty předmětu Data Mining.
Zásady pro vypracování
Prostudujte metodologii CRISP DM, velkou pozornost věnujte etapě přípravy dat pro DM úlohy. Zabývejte se speciálně problémem a také důvody pro kategorizaci dat, metodami optimální kategorizace, řešením chybějících hodnot a mnohonásobnou imputací. Vybrané problémy a návrh vlastních algoritmů naprogramujte v libovolném programovacím jazyku jako výkladovou aplikaci, kterou bude zároveň možné použít pro základní analýzu libovolné datové matice. Kvalitu aplikace z pohledu podpory porozumění uvedeným problémům testujte se studenty předmětu Data Mining.
Seznam doporučené literatury	\renewcommand{\labelenumi}{[\arabic{enumi}]} BERKA, Petr. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9. HENDL, Jan. Přehled statistických metod: analýza a metaanalýza dat. Páté, rozšířené vydání. Praha: Portál, 2015. ISBN 978-80-262-0981-2. NABARESEH, Stephen. Predictive analytics: a data mining technique in customer churn management for decision making Zlín: Tomas Bata University in Zlín, 2017. ISBN 978-80-745 PEKÁR, Stanislav a Marek BRABEC. Moderní analýza biologických dat. Brno: Masarykova univerzita, 2012. ISBN 978-80-210-5812-5.
Seznam doporučené literatury
\renewcommand{\labelenumi}{[\arabic{enumi}]} BERKA, Petr. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9. HENDL, Jan. Přehled statistických metod: analýza a metaanalýza dat. Páté, rozšířené vydání. Praha: Portál, 2015. ISBN 978-80-262-0981-2. NABARESEH, Stephen. Predictive analytics: a data mining technique in customer churn management for decision making Zlín: Tomas Bata University in Zlín, 2017. ISBN 978-80-745 PEKÁR, Stanislav a Marek BRABEC. Moderní analýza biologických dat. Brno: Masarykova univerzita, 2012. ISBN 978-80-210-5812-5.
Přílohy volně vložené	1 CD
Přílohy vázané v práci	-
Převzato z knihovny	Ano
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby	Průběh obhajoby je zveřejněn pouze přihlášenému uživateli.
Soubor s průběhem obhajoby

Prohlížení - Portál TUL

Navigace první úrovně

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Informace o kvalifikační práci Vybrané problémy v přípravě dat pro data miningové úlohy