OpenRefine, tidligere kalt Google Refine og Freebase Gridworks, er et frittstående skrivebordsverktøy basert på åpen kildekode for å vaske og transformere data til andre format, det som på engelsk kalles «data wrangling».[6] Verktøyet er ligner på et regneark, og det kan da også behandle filer fra flere typer rgeark, men strukturen minner mer om en database.

OpenRefine
Utvikler(e)Google, Metaweb, Antonin Delpeuch[1]
Nyeste versjon3.8.1 (21. mai 2024)[2]
Kodelagerhttps://github.com/OpenRefine/OpenRefine
OperativsystemMicrosoft Windows macOS Linux
Skrevet iJava,[3] JavaScript
TypeDataavstemming, dataadministrasjon, datavisualisering, data reconciliation, berike,[4] redaksjon,[4] datavask,[4] transformasjon[4]
LisensBSD-lisensen
Nettstedopenrefine.org (en)[5]

Programmet opererer på rader (rows) av data som har celler med verdier organisert i kolonner (columns), som er mer likt en relasjonsdatabase enn et regneark. Et prosjekt i OpenRefine er definert som en tabell. Brukeren kan filtrere rader ved å bruke fasetter (facets) som definerer filterkriterier. Et eksempel på en slik fasett er å vise rader hvor en gitt kolonne inneholder verdier. Ulikt regneark blir de fleste operasjoner i OpenRefine gjort mot alle synlige rader under en kolonne,[7] opprettelse av en ny kolonne basert på eksisterende data fra en annen kolonne, og så videre. Alle aksjoner som blir gjort på et datasett blir lagret i et prosjekt og kan senere bli avspilt på andre tilsvarende datasett.

Referanser

rediger

Litteratur

rediger

Eksterne lenker

rediger