Protože se nikdo za x let neobtěžoval pořádně implementovat základní knihovny pro práci s textem, zváště pak utf-8, ve většině jazyků a knim patřícím základním knihovnám většina readrů má dodneska problém s BOM, prostě ho při čtení hezky prdnou na začátek stringu. A podobných nesmyslných chování, kdy se spoláš na to, že ti knihovna s něčím pomůže je více.
Dalším problémem je jak psali výše, že tentýž znak má x variant, je to dáno tím, že když se unicod tvořil byli lidi líní nad tímhle přemýšlet nedej bože to sjednotit, a tak za sebe vrazili x abeced.
A to že se někdo diví, že na to nejsou testy, tak já se ani nedivím, způsob jakým se testy tvoří v podstatě odhalu jen jednoduché chyby, komplexní chybu nelze zachytit, navíc pokud na porovnání výsledů použijete systémovou knihovnu která má své chyby.