Datavisualisering er opprettelsen og vitenskapen om visuell representasjon av «data», definert som informasjon som er blitt abstrahert i en slags skjematisk form, som inneholder attributter eller variabler for informasjons-enhetene.

En datavisualisering av Wikipedia som en del av World Wide Web

Oversikt rediger

Hovedmålet med datavisualisering er å formidle informasjon effektivt og klart. For å gjøre dette må både estetikk og funksjonalitet gå hånd i hånd. Dette vil si at datavisualisering ikke trenger å se kjedelig ut for å være funksjonelt, eller se ekstremt sofistikert ut for å være estetisk. Man er derfor nødt til å balansere mellom design og funksjon for å formidle informasjon effektivt og klart.[1] En kjent fallgruve er å produsere vakre datavisualiseringer som ikke klarer å tjene sitt hovedmål – å formidle informasjon.

Fernanda Viegas og Martin M. Wattenberg har antydet at en ideell visualisering ikke kun skal formidle klart, men også stimulere fantasien og oppmerksomheten til seere.[2] Et kjent eksempel på dette er TED-talken til den svenske statistikeren Hans Rosling om verdens helse.[3] Her bruker han bevegelse, energi og farger i sine visualiserings verktøy til å fange fantasien og oppmerksomheten til millioner av seere over hele verden. Dette er spesielt viktig i vår informasjonsalder, som ofte føles som en æra av informasjons overbelastning. De klareste, mest presise data i verden formidler ingenting hvis ingen ser på dem.[4] Dette vil ikke si at klarhet og nøyaktighet har mistet sin betydning.

Datavisualisering er nært relatert til informasjon visualisering, vitenskapelig visualisering og lignende fagområder.

Visuell representasjon rediger

 
En datavisualisering av sosial media

Visuelle representasjoner av data tar sikte på å utnytte menneskets intuitive evne til å gjenkjenne struktur og mønstre.[5] Dette kan være viktig for å få en helhetlig oversikt over data, slik at man kan dra fordeler av den. Det blir for eksempel brukt til å presentere Big Data i selskapers søk etter bedre beslutninger.[6] Det er flere metoder som kan benyttes til å representere data. Forskjellige representasjoner kan finne helt andre mønstre ved dataen. Selve oppgaven med å velge en passende representasjon er vanskelig hvis flere variabler skal presenteres eller sammenlignes for relasjoner. Ifølge Friendly(2008) har datavisualisering hovedsakelig fokus på to forskjellige representasjoner: statistisk grafikk og tematisk kartografi. Begge er opptatt av den visuelle representasjonen av kvantitative og kategoriske data, men drevet av ulike representasjons mål. Kartografisk visualisering er primært opptatt av representasjon av et geografisk/romlig domene, mens statistisk grafikk kan benyttes i alle domener og spesielt til å visualisere kvantitative data i statistisk analyse. Det er mye overlapping, men kartografi og statistisk grafikk deler felles mål for visuell representasjon for utforskning og oppdagelse. Disse spenner fra enkel kartlegging av steder(landmasse, elver, terreng), til romlige fordelinger av geografiske karakteristikker(arter, sykdom, økosystemer), til det store utvalget av grafiske metoder som brukes til å beskrive mønstre, trender, og indikasjoner.[7]

Verktøy rediger

Det finnes flere forskjellige verktøy for å utvikle datavisualiseringer. Det er hovedsakelig to forskjellige type verktøy. Verktøy som brukes for å lage utforskende visualiseringer eller forklarende visualiseringer.

Utforskende verktøy rediger

Dette er ofte verktøy for å utvikle raske visualiseringer, hovedsakelig i programvare, men også på Web. Disse verktøyene produserer predefinerte visualiseringer, altså man benytter programvarens forskjellige visualiserings mønstre som linjegraf, sektordiagram, søylediagram, osv for å finne mønstre i et gitt datasett.

Forklarende verktøy rediger

Disse verktøyene er primært ment for å kun kommunisere de viktigste punktene i det du allerede har oppdaget. De støtter flere forskjellige visualiserings mønstre, men er ikke ment for å raskt kunne bytte mellom dem. Det er ikke fokus på å masseprodusere visualiseringer, men å ta hensyn til det unike datasettet og visualisere det slik at brukeren kan lett, effektivt og nøyaktig oppfatte historien datasettet presenterer.

D3 rediger

D3(Data-Driven Documents) også referert til som d3.js er et open source JavaScript bibliotek for å utvikle datavisualiseringer. Det ble annonsert i 2011 og er etterfølgeren til det tidligere Protovis rammeverket. Dataen D3 bruker er gitt av brukeren, dokumentene er web-baserte, som betyr alt som kan gjengis av en nettleser, slik som HTML eller SVG. D3 gjør samkjører det, i den forstand at den kobler brukeren sin data til web-dokumentet. Biblioteket er blitt så populært at det også er bygget verktøy på toppen av D3, for å generere D3 visualiseringer uten å faktisk skrive noe D3 kode. Ettersom D3 kun bruker "native" nettleserteknologi er det et av de mest brukte verktøy for å produsere interaktive web-visualiseringer.

Referanser rediger

  1. ^ Vitaly Friedman (2008) "Data Visualization and Infographics" in: Graphics, Monday Inspiration, January 14th, 2008
  2. ^ Fernanda Viegas and Martin Wattenberg, "How To Make Data Look Sexy", CNN.com, April 19, 2011. http://edition.cnn.com/2011/OPINION/04/19/sexy.data/index.html
  3. ^ Hans Rosling, "New insights on poverty", TED.com, Mars, 2007. http://www.ted.com/talks/hans_rosling_reveals_new_insights_on_poverty
  4. ^ Fernanda Viegas and Martin Wattenberg, "How To Make Data Look Sexy", CNN.com, April 19, 2011. http://edition.cnn.com/2011/OPINION/04/19/sexy.data/index.html
  5. ^ Philip K. Robertson (1990). A Methodology for Scientific Data Visualisation: Choosing Representations Based on a Natural Scene Paradigm"
  6. ^ Dorie Clark, "Data Visualization Is The Future - Here's Why", CNN.com, Mars 10, 2014. http://www.forbes.com/sites/dorieclark/2014/03/10/data-visualization-is-the-future-heres-why/
  7. ^ Michael Friendly (2008). "Milestones in the history of thematic cartography, statistical graphics, and data visualization"