Diplomová práce se zabývá metodami zpracování Big dat s bližším zaměřením na data nestrukturovaná. Teoretická část práce je zaměřena na charakteristiku Big dat, specifikaci zdrojů nestrukturovaných dat a na popis dostupných metod pro zpracování dat z těchto zdrojů prostřednictvím v současné době existujících nástrojů, dále se teoretická část práce zaměřuje na popis aplikačních oblastí těchto metod a také na přínosy zpracování Big dat. V praktické části práce jsou nestrukturovaná data z různých zdrojů zpracována vybranými nástroji, které jsou popsány v teoretické části této práce. Na závěr je definován a zhodnocen výsledek zpracování nestrukturovaných dat.
Anotace v angličtině
The diploma thesis focuses on methods of processing Big Data with a closer look at unstructured data. The theoretical part is concentrated on characterization of Big Data, specification of unstructured data sources and description of available methods for data processing from these sources through the currently available tools. Furthermore this thesis aims on the description of the scope in which these methods are used and also on the benefits of processing Big Data. In the practical part of the thesis unstructured data are processed by selected tools, which are described in the theoretical part of this thesis. Finally the result of unstructured data processing is defined and evaluated.
Klíčová slova
Analýza sentimentu, Big data, detekce podvodů, nestrukturovaná data, datové proudy, strojové učení, umělá inteligence, analýza dat v reálném čase, zpracování přirozeného jazyka.
Klíčová slova v angličtině
Sentiment Analysis, Big data, Fraud detection, Unstructured data, Streaming data, Machine Learning, Artificial Intelligence, Real Time Data Analysis, Natural Language Processing.
Rozsah průvodní práce
162 s. (131 857 znaků)
Jazyk
CZ
Anotace
Diplomová práce se zabývá metodami zpracování Big dat s bližším zaměřením na data nestrukturovaná. Teoretická část práce je zaměřena na charakteristiku Big dat, specifikaci zdrojů nestrukturovaných dat a na popis dostupných metod pro zpracování dat z těchto zdrojů prostřednictvím v současné době existujících nástrojů, dále se teoretická část práce zaměřuje na popis aplikačních oblastí těchto metod a také na přínosy zpracování Big dat. V praktické části práce jsou nestrukturovaná data z různých zdrojů zpracována vybranými nástroji, které jsou popsány v teoretické části této práce. Na závěr je definován a zhodnocen výsledek zpracování nestrukturovaných dat.
Anotace v angličtině
The diploma thesis focuses on methods of processing Big Data with a closer look at unstructured data. The theoretical part is concentrated on characterization of Big Data, specification of unstructured data sources and description of available methods for data processing from these sources through the currently available tools. Furthermore this thesis aims on the description of the scope in which these methods are used and also on the benefits of processing Big Data. In the practical part of the thesis unstructured data are processed by selected tools, which are described in the theoretical part of this thesis. Finally the result of unstructured data processing is defined and evaluated.
Klíčová slova
Analýza sentimentu, Big data, detekce podvodů, nestrukturovaná data, datové proudy, strojové učení, umělá inteligence, analýza dat v reálném čase, zpracování přirozeného jazyka.
Klíčová slova v angličtině
Sentiment Analysis, Big data, Fraud detection, Unstructured data, Streaming data, Machine Learning, Artificial Intelligence, Real Time Data Analysis, Natural Language Processing.
Zásady pro vypracování
1. Charakteristika Big Dat a metod zpracování nestrukturovaných dat.
2. Možnosti zpracování nestrukturovaných dat současnými nástroji.
3. Zpracování nestrukturovaných dat vybranými nástroji.
4. Zhodnocení řešení.
Zásady pro vypracování
1. Charakteristika Big Dat a metod zpracování nestrukturovaných dat.
2. Možnosti zpracování nestrukturovaných dat současnými nástroji.
3. Zpracování nestrukturovaných dat vybranými nástroji.
4. Zhodnocení řešení.
Seznam doporučené literatury
HOFMAN, Markus a Andrew CHISHOLM. 2015. Text Mining and Vizualization: Case Studies Using Open-Source Tools. 1st edition. Boca Raton: Chapman and Hall/CRC. ISBN 978-1482237573.
AGGARWAL, Charu C. 2015. Data Mining: The Textbook. Springer. ISBN 978-3-319-14141-1.
MAYER-SCHÖNBERGER, Viktor a Kenneth CUKIER. Big Data. 2014. Brno: Computer Press. ISBN 978-80-251-4119-9.
HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. 2015. Praha: Grada. ISBN 978-80-247-5466-6.
PROQUEST. 2017. Databáze článků ProQuest [online]. Ann Arbor, Ml, USA: ProQuest.
[cit. 2017-09-28]. Dostupné z: http://knihovna.tul.cz/
Seznam doporučené literatury
HOFMAN, Markus a Andrew CHISHOLM. 2015. Text Mining and Vizualization: Case Studies Using Open-Source Tools. 1st edition. Boca Raton: Chapman and Hall/CRC. ISBN 978-1482237573.
AGGARWAL, Charu C. 2015. Data Mining: The Textbook. Springer. ISBN 978-3-319-14141-1.
MAYER-SCHÖNBERGER, Viktor a Kenneth CUKIER. Big Data. 2014. Brno: Computer Press. ISBN 978-80-251-4119-9.
HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. 2015. Praha: Grada. ISBN 978-80-247-5466-6.
PROQUEST. 2017. Databáze článků ProQuest [online]. Ann Arbor, Ml, USA: ProQuest.
[cit. 2017-09-28]. Dostupné z: http://knihovna.tul.cz/
Přílohy volně vložené
CD
Přílohy vázané v práci
ilustrace, grafy, schémata, portréty, tabulky
Převzato z knihovny
Ano
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Průběh obhajoby je zveřejněn pouze přihlášenému uživateli.