Åpne hovedmenyen

Talesyntese, syntetisk tale eller kunstig tale er et tekst til tale system. Tekst som vises på en dataskjerm kan ved hjelp av et skjermleserprogram og en enhet for syntetisk tale bli opplest med en kunstig stemme. Det finnes eldre systemer som gjør dette helt syntetisk mens nyere systemer bruker lyder generert av en naturlig menneskelig stemme.

Ulike metoder for talesynteseRediger

Talesynteseprogram har lenge brukt den såkalte difonmodellen, i de siste årene har man også brukt Hidden Markov Models, eller HMM. Tidligere anvendte man en fullstendig syntetisk tale, der fonemene (lydenhetene) var produsert med å kombinere formantane for hver lyd. Problemet med den syntetiske innfallsvinkelen er at resultatet blir syntetisk, en stemme med «robotklang». De fonetiske egenskapene til menneskelig tale er langt mer komplisert, og består ikke bare av de kjente fonemene. I difonbaserte systemer tas med overgangene mellom de enkelte fonemene. Disse stemmene høres mye mer naturlig ut enn kun fonembaserte systemer.

Det motsette av talesyntese er talegjenkjenning, et dataprogram som er i stand til å overføre tale til tekst.

ApplikasjonerRediger

Per dags dato finnes det mange ulike norske talesynteser, både kvinne- og mannsstemmer. I begynnelsen av 2012 kommer den første barnestemmen på markedet [1].

Norske syntetiske stemmerRediger

  • Acapela Bente[2]
  • Acapela Elias[3]
  • Acapela Emilie[4]
  • Acapela Kari[5]
  • Acapela Olav[6]
  • IVONA Liv
  • LingSpeak Arne[7]
  • Lingit Isak (SAPI-kompatibel, bokmål/nynorsk)[8]
  • Lingit Inger (SAPI-kompatibel, bokmål/nynorsk)[9]
  • NLB Brage[10]
  • Nuance Stine[11]
  • Loquendo Henrik[12]
  • Loquendo Vilde[13]
  • eSpeak (under arbeid)[14]

MediaLT har en test av norske talesynteser med lydeksempler.[15]

MS WindowsRediger

I MS Windows brukes vanligvis SAPI baserte stemmer. SAPI (Speech Application Programming Interface) er et standardisert talegrensesnitt mellom f.eks. syntetisk taleenhet og en applikasjon som støtter taleteknologi. På denne måten kan man bruke en syntetisk stemme til ulike Windows applikasjoner framfor å kjøpe et system til hver applikasjon.

Mac OSRediger

Mac OS har også innebygd talesyntese som standard. Applikasjonene kan benytte seg av denne tilgjenglighetsfunksjonen.

iOSRediger

iOS støtter også talesyntese ved hjelp av den innebygde skjermleseren "VoiceOver". Denne funksjonen finner man under innstillinger - generelt - tilgjengelighet. På denne måten kan også en synshemmede person bruke de fleste funksjonene i iPhone og iPad.

ReferanserRediger

  1. ^ Prosjekt "Barnestemme", MediaLT [1]
  2. ^ Acapela Bente «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  3. ^ Acapela Elias «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  4. ^ Acapela Emilie «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  5. ^ Acapela Kari «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  6. ^ Acapela Olav «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  7. ^ LingSpeak Arne «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  8. ^ Lingit Isak «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  9. ^ Lingit Inger «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. 
  10. ^ NLB Brage «Arkivert kopi». Arkivert fra originalen 28. september 2013. Besøkt 26. september 2013. 
  11. ^ Nuance Stine «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013. 
  12. ^ Loquendo Henrik «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013. 
  13. ^ Loquendo Vilde «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013. 
  14. ^ eSpeak [2]
  15. ^ MediaLT: test av norske talesynteser med lydeksempler [3]