Aj voli volili
Nedávno sme u nás vytvorili nový produkt (Cyclone3 Profanity Filter), ktorý má za úlohu vyčistiť diskusné fóra od nevhodných komentárov, čoho je dosahované pomocou celej škály analýz textu. A keď už sú tie voľby prezidenta, napadlo ma čo nám môžu o sebe povedať voliči keď budeme analyzovať texty ich diskusných komentárov.
Ako zdroj sme použili komentáre z diskusií sme.sk ktoré nám predtým poslúžili ako testovacia vzorka našich filtrov :-). Komentáre sme preriedili a vybrali také, ktoré sa mohli jednoznačne zaradiť do dvoch skupín: "antiradičovci" a "antigašparovičovci".
Texty sme podrobili jednak jednoduchej frekvenčnej analýze slov, našej sémantickej analýze, vylúčili sme bezvýznamné slová, atď... proste sme sa vyhrali s celým arzenálom funkcií pre analýzu textu a jeho významu našich kategorizačných filtrov. (na slová bola aplikovaná tiež lowercase a unicode2ascii funkcia preto sú slová bez diakritiky)
Výsledkom je tagcloud výrazov, ktoré sa vyskytujú v diskusných príspevkoch a sú umiestné v cloude podľa analyzovaných súvislostí. Pobavte sa :-)
Antigašparovičovci:
Antiradičovci:

