Hullámformából visszaalakítás hanggá?
Az állóképes hullámforma alatt ezt érted:
Ez ugye a jel időfüggvénye, de a videóban található, azaz egy képkocka az viszont egy pillanatnyi érték lehet, frekvencia és amplitudó függvénye. Az már mindegy, hogy ez 2 vagy 3 dimenziós. A képkockákból ki kellene nyerni az egyes frekvenciákhoz tartozó amplitudókat és ezeket a szinuszos jeleket kellene összegezni a megfelelő időtartamokig. Ez egy fordított Fourrier felbontás.
Mivel a képanyag nagyjából 20-25db/sec sebességű, de az amplitudó szerinti felbontást saccoljuk 8 bitesnek.
Az átvitel elég jó lehet, a felbontás is körülbelül egy telefonbeszélgetéssel ér fel, de a probléma a minták frissítésével van. Fordított esetben ez alulmintavételezés, de itt a frekvenciaösszetevők megvannak, csak a frissítési gyakoriság a kérdéses, mert analóg módon össze tudjuk keverni az összes frekvenciaösszetevőt. Talán egy szűrő megoldja a többit.
Attól függ, hogy a videó jelből milyen felbontásban állapítható meg, hogy mekkora az adott összetevők amplitudója és frekvenciája.
Igen, a videóban lévő az frekvencia és amplitúdó függvénye. másodpercenként akár 60 képkockával, és frekvenciatartományonként kb. 256 lehetséges értékkel. Frekvenciatartományból változó, hogy mennyi van, de legyen mondjuk 24.
Nem mindent értettem meg abból, amit leírtál, de a lényeg, hogy akkor lehetséges lenne. Csak kéne valami program, ami megcsinálja.
Ugye egy normál hang mintavételezés úgy működik, hogy mintákat vesznek az analóg jelből bizonyos időközönként (44K,48K, 192K/s), minimum a jelben jelenlévő maximális frekvencia kétszeresével. Ezek a minták csakis amplitudó értékeket tartalmaznak.
Ez ha nem periódikus, akkor nem is bontható fel szinuszos jelekre, de ha az, akkor a sűrű mintákból visszaállítható a jel is.
A videó viszont amplitudó és frekvencia értéket tartalmaz, de most tekintsünk el attól, hogy az milyen jel (négyszög, háromszög, vagy szinusz is lehet).
Egy ilyen képkockából azt deríthetjük ki, hogy milyen harmonikusokból áll a minta és milyen amplitudóból, azaz Képezhetünk egy fordított Fourrierrel egy jelet erre az időtartamra. A probléma, hogy ennek nagyon kicsi a frissítési sebessége, egy videónál 20-25 képkocka/sec, ez 25Hz. De ez a kis frissítési sebesség mégsem a frekvenciabeli visszaadást korlátozza, mert azok az információk jelen vannak a vizuális képben teljesen, hanem valami mást...
Szerintem olyan lenne, mint egy rossz telefon, vagy egy robothang.
Ki kellene próbálni, egy egyszerű mikrovezérlővel megoldható, hogy tömbben eltároljuk a képből visszaalakított értéket és másodpercenként ~25ször adjunk új értékeket a dac-nak.
Az átalakításra meg írható e olyan program, ami táblázatot generál a megadott frekvencia és amplitudó értékekből.
További kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!