Taksonomi for søkemotorer

Taksonomi av enheter for søkemotorer er utformet for å forbedre relevansen i vertikale søk. Taksonomier av enheter er trær med noder der enhetene har etiketter som samsvarer med forventede søketermer i et nettsøk. Trærne blir brukt til å koble søkeord fra søket med søkeord fra svarene (kalt snippets).

Taksonomier, synonymordbøker og konsepthierarkier er sentrale komponenter for mange anvendelser av informasjonshenting, prosessering av naturlig språk, og kunnskapsforvaltning. Å bygge, justere og administrere taksonomier og ontologier er ganske kostbare prosesser siden det krever mange manuelle operasjoner. En rekke studier har foreslått automatisert bygging av taksonomier basert på språklige ressurser og/eller statistisk maskinlæring [1].

Web gruvedrift er en av tilnærmingene for å bygge taksonomier for søkemotorer ved nettsøk. Byggeprosessen starter fra en frøenhet og graver i tilgjengelige kildedomener etter nye enheter knyttet til frøenhetene. Nye enheter blir dannet ved å anvende maskinlæring på det foreliggende søkeresultatet for å påvise fellestrekk mellom dem. De felles uttrykkene danner deretter parametere av eksisterende enheter, og blir til nye enheter ved neste iterasjon.[2].

Referanser rediger

  1. ^ Vicient, Carlos; Sánchez, David; Moreno, Antonio (1. mars 2013). «An automatic approach for ontology-based feature extraction from heterogeneous textualresources». s. 1092-1106. doi:10.1016/j.engappai.2012.08.002. Besøkt 21. november 2015. 
  2. ^ Galitsky, Boris A. (1. november 2013). «Transfer learning of syntactic structures for building taxonomies for search engines». s. 2504-2515. doi:10.1016/j.engappai.2013.08.010. Besøkt 21. november 2015.