Mit jelent szövegszerkesztőkben a BOM nélkül?
(Google: UTF-8 BOM, második találata. Ha az első nyitod meg, ott pedig még többet magyaráz[na]).
Byte Order Mark.
Csak hogy lásd, nem mindenkinek törik le a keze, ha egy link helyett leírja a választ.
A különböző Unicode kódolások megkülönböztetésére szolgál. Ugyanis Unicode (UTF) kódolásokból is van több. Talán a ma leggyakoribb az UTF-8, aminek az a lényege, hogy az alap ASCII karakterek 1 bájton tárolódnak, a különleges, illetve nemzeti karakterek pedig 2, 3, vagy 4 karakteren. Emellett létezik még UTF-16 is, ahol minden karakter, ami "belefér" a 16 bites kódtérbe, az 2 bájton, azaz 16 biten tárolódik. Ami nem, az meg 3, vagy 4 bájton, de ezek azért tekintélyesen ritkák, Az UTF-32 pedig minden karaktert 4 bájton tárol. Ez a legsimább ügy, de ugyanakkor a legpazarlóbb is.
Ráadásul az UTF-16-nál és UTF-32-nél az sem mindegy, hogy a kétbájtos karakterkódok melyik bájtja van elől. Ugyanis lehet az alacsony, és magas helyiértékűvel is kezdeni.
Azért találták ki a BOM-ot, hogy a szoftverek automatikusan felismerjék, hogy az 5 lehetséges Unicode kódolás közül melyikben készült a szövegfájl.
De!
UTF-8 esetén nem igazán ajánlott BOM-ot használni. Vannak mellette is érvek, de az ASCII kompatibilitás miatt egyre inkább az a trend, hogy az UTF-8-nál nem teszik ki a BOM-ot. Így azok az elvileg UTF-8 kódolású fájlok, amikben csak az alap ASCII karaktereket használják (gyakorlatilag az összes angol nyelvű szöveget tartalmaző szövegfájl ilyen), azok kompatibilisek maradnak a ASCII szöveget kezelő alkalmazásokkal. Ugyanis BOM nélkül a csak alap ASCII karaktereket tartalmazó fájl egyben ASCII kódolású fájlnak is tekinthető.
A leírt válasz érthetőbb.
Köszönet! :)
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!