Wikipedia:Skole og universitetsprosjekt/Kvalitetsmål i Wikipedia

Forslag til oppgave for studenter ved høyskoler eller lignende

Kvalitetsmål i Wikipedia gjør det mulig å få objektive mål for hvor gode artikler er utfra gitte kriterier. Det er flere slike objektive kvalitetskriterier som kan brukes. Noen av disse målene er entrofi og en hel serie lesbarhetsindekser. Disse målene brukes så på en spesialside som stiller disse opp for enkeltsider, samlinger av sider og kategorier.

Typer kvalitetsmål rediger

Lesbarhetsindekser er flere mål på hvor lett en side er å lese. Noen av disse indeksene kan beregnes uten ekstra lagret informasjon. Det gjør dem velegnet som kvalitetsmål på artikler. De mest vanlige er forskjellige former for lesbarhetsindeks, og flere former er kjent.

Entrofi er et mål som sier hvor mye innhold det er i en artikkel. Hvis dette målet normaliseres mot artikkelens størrelse så blir det et mål på informasjonstetthet i artikkelen som kan tolkes som hvor distinkt den er skrevet. Et problem med entrofi er at målet krever en omfattende frekvenstabell for ord i teksten, dermed trenger en noen form for webservice som kan brukes for selve analysen. Nært knyttet til entrofi er bruk av tf-idf som analyseverktøy for å si noe om en teksts velformethet.

Det finnes også flere adhoc-mekanismer for å vurdere kvalitet til artikler, slik som eksistens av kategorier og lignende. Det er også publisert noen vitenskapelige artikler om automatisert kvalitetsvurdering av artikler på Wikipedia. Spesielt er det aktuelt å se på bruk av support vector machine og neural net for å estimere kvalitet utfra feature vectors.

Valg av artikler og kvalitetsmål rediger

Det skal kunne defineres enkeltartikler, et sett av artikler eller en kategori ved å oppgi navn på disse. Dette må kunne angis som en URL på kortform. Det må også være mulig å angi enkeltartikler, et sett av artikler eller en kategori ved å oppgi artikkelid, eller ved å oppgi revisjonsid. Det er ikke nødvendig å kunne angi disse parametrene når URLen er på kortform.

Det skal kunne velges hvilken kvalitetsmål som er aktive og hvorvidt deler av teksten skal tas med eller utelates fra prosesseringen. Alle parametre som definerer kvalitetsmålene skal kunne settes via URLen til siden. Det er ikke nødvendig å angi disse parametrene når URLen er på kortform.

Estimering av kvalitet utfra brukerinvolvering rediger

Det er noen arbeider som indikerer at kvalitet kan estimeres utfra brukerinvolvering.[1] [2] Arbeidene har delvis sammenfallende konklusjon og delvis er de divergerende. Det kan likevel synes som om de underliggende mekanismene er tydelige, men at utvalget av artikler er slik at forskjellige konklusjoner understøttes.

Idéen som ligger til grunn er at brukere bidrar på forskjellig vis, de befinner seg på en inequality scale, og at det må finnes en tilstrekkelig blanding av brukertyper for å oppnå en kvalitetsartikkel. Brukere koples til artikkelen via bidrag på diskusjonssiden, flere bidrag er antatt å gi bedre artikkel gjennom samarbeid. I praksis kan det vise seg at det arbeidene påviser er involvering av administratorer som følge av konflikt om artiklenes innhold.

Tiltro og omdømme rediger

Det er flere metoder for å produsere tiltro og omdømme for artikler og bidragsytere. Et problem med flere av metodene er imidlertid at de i korte trekk estimerer tiltro og omdømme utfra levetiden forfatterens redigeringer har på Wikipedia. Dette er en kraftig overforenkling, men er brukt i flere systemer. Av de mest kjente er WikiTrust.

Rapporteingsmekanismer rediger

Rapporter presentert på spesialsidene vil typisk være lister om det kun brukes et kriterie, det vil være sorterbare tabeller om det brukes flere kriterier, og tabeller og grafer i kombinasjon om flere sider sammenlignes. Siden bør kunne transkluderes, eventuelt bør den ha en tilsvarende parserfunksjon, slik at denne kan brukes for å dokumentere forhold ved sider under avstemminger. Som minimum skal det være tilgjengelig en parserfunksjon for å hente ut måltall for enkeltartikler.

Referanser rediger

Eksterne lenker rediger