Kezdőoldal » Számítástechnika » Programozás » Egészen pontosan hogy működnek...

Egészen pontosan hogy működnek a text to speech programok?

Figyelt kérdés
Valahol olvastam, hogy karakterenként letárolják a hangokat, de azt nem tartom valószínűnek. Van valami más módszer is? Egészen pontosan hogy működik?
2021. máj. 19. 01:58
 1/5 anonim ***** válasza:
37%

Nem fogom leírni egészen pontosan, mert úgy sem olvasnád végig.

Az emberi beszéd legkisebb egységei a hangok.

Ezek a hangok un. felharmonikusokból állnak.

Ezek a felharmonikusok bizonyos frekvenciájú hanghullámok.

A más és más ember által kiejtett ugyanazon hangokban sok a különbözőség, de sok az azonosság is.

Ezeket az azonosságokat keresik matematikai módszerekkel.

Hogy ez miképpen történik, azt már nem részletezem mert az itt megforduló, nem szakmabeli, wannabe hurvinyekek maguk alá huggyantanának, na meg, amúgy sincs semmi szükség a programozásban a matematikára, legalábbis szerintük.

2021. máj. 19. 07:47
Hasznos számodra ez a válasz?
 2/5 anonim ***** válasza:
hangok = hangzók
2021. máj. 19. 07:48
Hasznos számodra ez a válasz?
 3/5 anonim ***** válasza:
72%

#1-nek: Én azért szívesen olvastam volna tovább is... :-)


"...mert az itt megforduló, nem szakmabeli, wannabe hurvinyekek maguk alá huggyantanának..."


Nem azért de te most merre fordulsz meg? Itt vagy ott, esetleg amott??? :-)

2021. máj. 19. 08:28
Hasznos számodra ez a válasz?
 4/5 anonim ***** válasza:
46%

A text to speech programok szerkezetileg elég egyszerű dolgok, hiszen nem szükségesek azok a lépések, amelyeket az 1. hozzászólásban írtam. Mindössze az a feladat, hogy a leírt szöveget hanggá alakítsák. Ehhez nem kell más, mint vagy bedigitalizált hangokból összerakni a szövegben előforduló szavakat és a hangszórón keresztül megszólaltatni őket, vagy a hangokat szintetizálva beszédet képezni.


Az előbbi módszer, tehát egy-egy hang megfeleltetése a leírt, soron következő betűvel, elég furcsa eredményt ad, ugyanis a természetes hangképzés során bizonyos hangok képzésekor az adott hangot megelőző hang is befolyással van a képezni kivánt hangra. Ha ezt figyelmen kívül hagyjuk, akkor abból elég rossz eredmény születik.

Ezért az okosabb emberek, a hangforrás bedigitalizálásánál az ABC helyett konkrét szövegmintákat olvastatnak be az alanyokkal. Ez arra jó, hogy a kettőshangokra is kapjanak megfelelő mintát és a szöveg hanggá alakításánál nem csak egy-egy betű hangi megfelelőjét szólaltatják meg, hanem azt a hangot is, ami előtte vagy utána következik.


Ugyanerre a szintetikus hangképzésnél is figyelemmel kell lenni.

2021. máj. 19. 09:07
Hasznos számodra ez a válasz?
 5/5 A kérdező kommentje:
köszi
2021. máj. 19. 13:33

Kapcsolódó kérdések:




Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!