Talesyntese

Talesyntese, syntetisk tale eller kunstig tale er et tekst til tale system. Tekst som vises på en dataskjerm kan ved hjelp av et skjermleserprogram og en enhet for syntetisk tale bli opplest med en kunstig stemme. Det finnes eldre systemer som gjør dette helt syntetisk mens nyere systemer bruker lyder generert av en naturlig menneskelig stemme. Teknologien kan tas i bruk for mennesker med lesevansker som dysleksi eller for synshemmede.

Ulike metoder for talesyntese

Talesynteseprogram har lenge brukt den såkalte difonmodellen, i de siste årene^[når?] har man også brukt Hidden Markov Models, eller HMM. Tidligere anvendte man en fullstendig syntetisk tale, der fonemene (lydenhetene) ble produsert ved å kombinere formantane for hver lyd. Problemet med den syntetiske innfallsvinkelen er at resultatet blir syntetisk, en stemme med «robotklang». De fonetiske egenskapene til menneskelig tale er langt mer komplisert, og består ikke bare av de kjente fonemene. I difonbaserte systemer tas med overgangene mellom de enkelte fonemene. Disse stemmene høres mye mer naturlig ut enn kun fonembaserte systemer.

Det motsette av talesyntese er talegjenkjenning, et dataprogram som er i stand til å overføre tale til tekst.

Applikasjoner

Per dags dato finnes det mange ulike norske talesynteser, både kvinne- og mannsstemmer. I begynnelsen av 2012 kommer den første barnestemmen på markedet ^[1].

Norske syntetiske stemmer

Acapela Bente^[2]
Acapela Elias^[3]
Acapela Emilie^[4]
Acapela Kari^[5]
Acapela Olav^[6]
Acapela Thomas^[6]
IVONA Liv
LingSpeak Arne^[7]
Lingit Isak (SAPI-kompatibel, bokmål/nynorsk)^[8]
Lingit Inger (SAPI-kompatibel, bokmål/nynorsk)^[9]
NLB Brage^[10]
Nuance Stine^[11]
Loquendo Henrik^[12]
Loquendo Vilde^[13]
eSpeak (under arbeid)^[når?]^[14]

MediaLT har en test av norske talesynteser med lydeksempler.^[15]

MS Windows

I MS Windows brukes vanligvis SAPI-baserte stemmer. SAPI (Speech Application Programming Interface) er et standardisert talegrensesnitt mellom for eksempel syntetisk taleenhet og en applikasjon som støtter taleteknologi. På denne måten kan man bruke en syntetisk stemme til ulike Windows applikasjoner framfor å kjøpe et system til hver applikasjon.

Mac OS

Mac OS har også innebygd talesyntese som standard. Applikasjonene kan benytte seg av denne tilgjenglighetsfunksjonen.

iOS

iOS støtter også talesyntese ved hjelp av den innebygde skjermleseren VoiceOver.

Referanser

^ Prosjekt «Barnestemme», MediaLT [1]
^ Acapela Bente «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.
^ Acapela Elias «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.
^ Acapela Emilie «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.
^ Acapela Kari «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.
^ ^a ^b Acapela Olav «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.
^ LingSpeak Arne «LingSpeak Arne (Arkivert kopi)». Lingit. Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. «Lingspeak Arne er en såkalt difonsyntese som Lingit har videreutviklet fra Telenors talesyntese "Telenor Talsmann". Lingit ferdigstilte Lingspeak Arne i 2008. | Lingit leverer i dag stemmer av høyere kvalitet basert på såkalt HTS-teknologi. Les mer om Lingits nye stemmer Isak og Inger her.»
^ Lingit Isak «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.
^ Lingit Inger «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.
^ NLB Brage «Arkivert kopi». Arkivert fra originalen 28. september 2013. Besøkt 26. september 2013.
^ Nuance Stine «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013.
^ Loquendo Henrik «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013.
^ Loquendo Vilde «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013.
^ «eSpeak». Teksten «http://espeak.sourceforge.net/languages.html» ignoreres (hjelp); Manglende eller tom |url= (hjelp)
^ MediaLT: test av norske talesynteser med lydeksempler [2]

[1] Prosjekt «Barnestemme», MediaLT [1]

[2] Acapela Bente «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.

[3] Acapela Elias «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.

[4] Acapela Emilie «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.

[5] Acapela Kari «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.

[:0-6] Acapela Olav «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.

[7] LingSpeak Arne «LingSpeak Arne (Arkivert kopi)». Lingit. Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013. «Lingspeak Arne er en såkalt difonsyntese som Lingit har videreutviklet fra Telenors talesyntese "Telenor Talsmann". Lingit ferdigstilte Lingspeak Arne i 2008. | Lingit leverer i dag stemmer av høyere kvalitet basert på såkalt HTS-teknologi. Les mer om Lingits nye stemmer Isak og Inger her.»

[8] Lingit Isak «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.

[9] Lingit Inger «Arkivert kopi». Arkivert fra originalen 27. september 2013. Besøkt 26. september 2013.

[10] NLB Brage «Arkivert kopi». Arkivert fra originalen 28. september 2013. Besøkt 26. september 2013.

[11] Nuance Stine «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013.

[12] Loquendo Henrik «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013.

[13] Loquendo Vilde «Arkivert kopi». Arkivert fra originalen 20. september 2013. Besøkt 26. september 2013.

[14] «eSpeak». Teksten «http://espeak.sourceforge.net/languages.html» ignoreres (hjelp); Manglende eller tom |url= (hjelp)

[15] MediaLT: test av norske talesynteser med lydeksempler [2]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]