Tato agregační analýza sociálních sítí je unikátní tím, že jsme se u ní snažili vyloučit negativní zmínky a zároveň minimalizovat vliv informačního šumu. Proto jsme pro každého kandidáta definovali 333 až 425 větných spojení (překlepy a varianty typu typu: hanig/hannig) zachycující kladné sympatie autora zmínky devíti osobnostem naši politické scény. Výsledkem je 3782 kombinací klíčových slov, jejichž výskyt jsme na sociálních sítích několik hodin před volbami hledali. Nejedná se klasický předvolební průzkum (neprováděli jsme dotazy), jedná se o pouhou statistickou agregaci volně přístupných dat.

Jako výchozí zdroj údajů pro analýzu jsem zvolil export dat ze systému SentiOne. Tento mezinárodní systém již několik let monitoruje evropský internet a nabízí aplikační platformu založenou na nejkomplexnější databází dat ze sociálních sítí  (Facebook, Twitter, Google+) a navíc monitoruje ještě: diskuzní fóra, články i diskuze pod články, produktové recenze, YouTube a Instagram.

Průzkum se prováděl  3782 variantami prohlášení typu: “budu, chci, hodlám, půjdu, fandím, hodím to, věřím, podporuji, zvolím, nejlepší je, jsem rozhodnutý pro…”. Data byla z období 3-11. ledna.

Zmínky byly očištěné – omezené na jeden příspěvek na účet, smazaný je jak spam, tak opakující se zmínky.

Pokud ba Vás zajímala klíčová slova, tak ta byla volená tak, aby nechávaly místo na špatnou interpretaci. Zmínka musí jednoznačně podporovat kandidáta. Příklady konkrétních slov pro pana Horáčka ukazuje následující screenshot: