Detail kurzu

Popis kurzu

Kurz je realizovaný prezenčne (v Prahe) aj online.

Tradičné dataminingové postupy umožňujú extrahovať a využiť užitočnú informáciu z elektronických dát uložených v štruktúrovanom tabuľkovom formáte. Väčšina elektronických dát je však neštruktúrovaná. Textové dokumenty, ako sú napríklad emaily, novinové články, vedecké publikácie, zápisky z call centier, korešpondencia na sociálnych sieťach alebo len komentáre k produktom, ponúkajú tiež množstvo skrytej informácie, ktorá môže významne skvalitniť dataminingové predikcie. Skrytú informáciu v textoch je potrebné extrahovať do štrukturálnych atribútov, aby sa dala použiť pre následné modelovanie. Vďaka vlastnostiam a bohatosti prirodzených jazykov je extrakcia kľúčových atribútov z textu špecifická, atribúty musia byť naviac citlivo vybrané i s ohľadom na riešenú textminingovú alebo dataminingovú úlohu. 

Obsah kurzu

Program kurzu:

  1. úlohy text miningu
  2. štruktúrovaná reprezentácia textových dokumentov
  3. získanie a indexácia textovej kolekcie
  4. procedúry spracovania textu a ich radenie
  5. extrakcia konceptov, ich vlastností a komplexných vzorov
  6. redukcia dimenzionality extrahovaných príznakov
  7. analýza obsahu
  8. klasifikácia a zoskupovanie dokumentov
  9. vyhľadávanie v kolekciách
  10. dataminingové úlohy s podporou textových dát
  11. správa a modifikácia lingvistických zdrojov

Cieľová skupina

Kurz je určený pre analytikov, marketingových pracovníkov, žurnalistov a vyšetrovateľov, ktorí potrebujú spracovať väčšie množstvo textov bez toho, aby museli všetky dokumenty prečítať, a využiť získanú informáciu k rozhodovania.

Hodnotenie




Organizátor



Ďalšie termíny kurzu
Termín Cena Miesto konania Zarezervovať