Biežākās datu vizualizācijas kļūdas
Neatbilstoša grafika izvēle
Katrai datu kopai ir savs atbilstošs vizualizācijas formāts. Visvieglāk ir nokļūdīties, lietojot apļveida diagrammas jeb “pīrāgus”. Ikonisks piemērs, kurā dati, kas piemēroti stabiņveida diagrammai, izmantoti “pīrāgā”, ir FOX News 2012. gada prezidenta vēlēšanu kandidātu reitingu salīdzinājums.
Vizualizācijas autors, iespējams, atcerējās, ka procentus vislabāk attēlo “pīrāgs”, taču pīrāgs attēlo procentuālo sadalījumu starp kategorijām, kas veido vienu veselumu. Šajā gadījumā procentuālo vērtību summa pārsniedza vienu veselu jeb 100%. To pamanīja konkurenti NBC un izsmēja kanāla darbinieku matemātikas spējas.
Vēl redikālāks piemērs ir šis:
ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:
Stabiņu diagramma.
Vēlme grafiku padarīt “interesantāku”
Iemesls neatbilstošai grafika izvēlei bieži ir vēlme padarīt vizualizāciju “interesantāku”, jo stabiņi un līnijveida grafiki visiem ir apnikuši. Zemāk redzamās vizualizācijas autors nolēma “pīrāgus” izmantot, lai attēlotu kā mainījās 10 gadu laikā to organizāciju īpatsvars, kuras uztraucas par klientu noturēšanu un kuras ne.
ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:
Lai gan paši “pīrāgi” ir izmantoti pareizi – katrs attēlo divas kategorijas, kas kopā veido 100%. – izmaiņu organizāciju attieksmē laikā vizlabāk parādītu līnijveida grafiks.
Tumšā līnija ar svārstībām tiecas uz augšu, bet gaišā – uz leju. Ir skaidri redzams, ka pēc 2012. gada to organizāciju, kurām rūp klientu noturēšana, īpatsvars pārsniedza vienaldzīgās.
Vēlme padarītu grafiku “interesantāku” bieži noved arī pie pārāk radošiem un sarežģītiem vizuāliem risinājumiem. Zemāk redzams ļoti netradicionāls datu vizualizācijas risinājums, kura nolasīšana prasa pamatīgu iedziļināšanos.
Sarežģīta datu vizualizācija pati par sevi nav kļūda, bet var “pašaut garām” savai mērķauditorijai, kas, iespējams, nevēlēsies iedziļināties.
ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:
Šajā gadījumā jāiekāpj lasītaja “kurpēs” un jāsaprot, kā lasītājs lasa grafiku. Grafiks,kurā leģenda ir garāka par pašu grafiku, noteikti nav labākais risinājums lasītāja uzrunāšanai.
Pārsātinājums ar datiem
Vēl viena izplatīta vizualizācijas kļūda ir pārsātinājums, kas visbiežāk izpaužas vēlmē attēlot visus pieejomos datus vienā vizualizācijā vai infografikā.
ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:
Labākais risinājums ir vispirms saprast, kādu ziņu ar šī grafika palīdzību autors vēlas nodot, un attēlot tikai to. Pilno datu kopu var augšuplādēt kādā failu apmaiņas vietnē un hipersaiti pievienot vizualizācijas aprakstā.
Šādas datu vizualizācijas sastopamas arī Latvijā.
ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:
Ja datu kopā ir kategorijas, kuru vērtības salīdzinot ar pārējām ir tik lielas, ka pārējās “pazūd”, bieži izmantots risinājums ir iznest “mazos datus” citā grafikā un parādīt to svārstības bez lielajiem izņēmumiem gluži kā caur palielināmo stiklu.
Turpinājumā vairāki piemēri, kuros grafika kļūdas pavisam vienkārši varētu atrisināt, ja pirms publicēšanas ar vizualizāciju padalītos ar draugiem vai kolēģiem un ļautu vienkārši pārlasīt. Ja teksts ir saprotams un loģisks, tas būs saprotams arī lasītājiem.
Vizualizācijas rīka ierobežojumi
Zemāk redzamajā vizualizācijā, kas radīta, izmantojot Piktochart, 100% absolventu sadalījumu pa fakultātēm attēlo 99 trijstūrīši, nevis 100. Tas radies, jo autors izmantojis tiešsaistē pieejamos rīkus, nepamanot to ierobežojumus.
“WTF” kļūdas
Citreiz datu vizualizācija nemaz nav datu vizualizācija, bet gan skaitļu un vārdu virknējums dažādos fontos un ģeometriskās formās.
Sastopama ir arī vizuālo elementu, piemēram, stabiņu garuma, neatbilstība skaitļiem, kas tiem būtu jāattēlo.
Dažkārt vizualizācju autori arī neprot vai nevēlas skaitīt.
________
Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 3. aprīlī rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.