Detail kurzu
Text mining
ACREA SR, spol. s r.o.
Popis kurzu
Kurz je realizovaný prezenčne (v Prahe) aj online.
Tradičné dataminingové postupy umožňujú extrahovať a využiť užitočnú informáciu z elektronických dát uložených v štruktúrovanom tabuľkovom formáte. Väčšina elektronických dát je však neštruktúrovaná. Textové dokumenty, ako sú napríklad emaily, novinové články, vedecké publikácie, zápisky z call centier, korešpondencia na sociálnych sieťach alebo len komentáre k produktom, ponúkajú tiež množstvo skrytej informácie, ktorá môže významne skvalitniť dataminingové predikcie. Skrytú informáciu v textoch je potrebné extrahovať do štrukturálnych atribútov, aby sa dala použiť pre následné modelovanie. Vďaka vlastnostiam a bohatosti prirodzených jazykov je extrakcia kľúčových atribútov z textu špecifická, atribúty musia byť naviac citlivo vybrané i s ohľadom na riešenú textminingovú alebo dataminingovú úlohu.
Obsah kurzu
Program kurzu:
- úlohy text miningu
- štruktúrovaná reprezentácia textových dokumentov
- získanie a indexácia textovej kolekcie
- procedúry spracovania textu a ich radenie
- extrakcia konceptov, ich vlastností a komplexných vzorov
- redukcia dimenzionality extrahovaných príznakov
- analýza obsahu
- klasifikácia a zoskupovanie dokumentov
- vyhľadávanie v kolekciách
- dataminingové úlohy s podporou textových dát
- správa a modifikácia lingvistických zdrojov
Cieľová skupina
Kurz je určený pre analytikov, marketingových pracovníkov, žurnalistov a vyšetrovateľov, ktorí potrebujú spracovať väčšie množstvo textov bez toho, aby museli všetky dokumenty prečítať, a využiť získanú informáciu k rozhodovania.