1
Vývoj / Re:Je utf8 univerzální?
« kdy: 04. 07. 2018, 21:39:41 »UTF8 má rozsah 32 bitů a měly by tam být všechny Unicode znaky. Narazit lze leda v Javě, kde UTF8 má limit 16 bitů. To je ale vada Javy, ne UTF.
Máte to trochu pomíchané. Unicode je 21 bitový. Pokud použiteje k zapsání unikodu UTF-8, pak jeden unicode znak je kódován pomocí jednoho až čtyř bajtů (což plně pokryje těch 21 bitů). Pokud použijete UTF-16, pak jeden unicode znak je kódován pomocí jednoho až dvou 16 bitových hodnot (což opět pokryje plně těch 21 bitů). Java používá UTF-16 a není to vada :-)