Brede og smale data

to ulike metoder for å presentere data i en tabell

Brede og smale tabeller er to alternative metoder for å presentere tabelldata.[1]

  • En bred tabell[2] er en tabell hvor hver variabel har en egen kolonne, altså at tabellen er «brettet ut».
  • En smal tabell er en tabell hvor det brukes en egen verdikolonne og tilhørende variabelkolonne som angir kontekst. Man kan dermed bruke færre kolonner, men flere rader, for å angi de samme dataene. Tabellen blir dermed «stablet» i høyden.

Det er mulig å konvertere tabeller fra den ene typen visningen til den andre.

Brede tabeller rediger

I en bred tabell vises de forskjellige variablene i hver sin kolonne:

Person Alder Vekt Høyde
Jakob 32 168 180
Nora 24 150 175
Olivia 64 144 165

Smale tabeller rediger

I en smal tabell vises noen av variablene i en variabelkolonne, og den tilhørende verdien for hver enkelte variabel i en egen verdikolonne som inneholder alle verdiene. Man kan si at variabelkolonnen viser konteksten til verdien.

Person Variabel Verdi
Bob Alder 32
Bob Vekt 168
Bob Høyde 180
Alice Alder 24
Alice Vekt 150
Alice Høyde 175
Steve Alder 64
Steve Vekt 144
Steve Høyde 165

En fordel med smale tabeller i datasystemer (samt med penn og papir, forøvrig) er at det er enklere å endre dem siden det å legge til en ny variabel ikke krever endringer i strukturen til tabellen. De kan også være enklere å implementere teknisk. Ulempen er at de er mindre leselige for mennesker.

Implementeringer rediger

Mange systemer for statistikk og databehandling har funksjoner for å konvertere mellom brede og smale tabeller. Programmeringspråket R har for eksempel pakken tidyr med flere, og i Python har pandas-pakken funksjonen melt for å konvertere fra bred til smal tabell.

I forbindelse med datatransformasjon blir prosessen med å konvertere en tabell fra smal til bred noen ganger kalt «pivotering»,. I pandas-pakken for Python kan funksjonen pivot brukes for å omforme (transformere) fra smal til bred.

Se også rediger

Referanser rediger

  1. ^ Chantala, K. (2006) "Using STATA to Analyze data from a Sample Survey" Arkivert 20. september 2008 hos Wayback Machine.. 1-10-2001. UNC Chapel Hill, Carolina Population Center. 10-1-2006.
  2. ^ «INF 3100 Databasesystemer, side 12, "Klassiske valg" - Per Øyvind Øverli, Aibel A/S» (PDF).