Plný unicode font se všemi znaky

Plný unicode font se všemi znaky
« kdy: 11. 05. 2025, 19:58:05 »
potreboval jsem do aplikace tinymediamanager font, ktery by obsahoval korejske, japonske i cinske znaky. prekvapive to byl problem.

Nakonec jsem skoncil u pisem Noto.
ale prekvapilo, ze CE jazyky nejsou podporovane. presneji e  s hackem zobrazuje, treba r s hackem nikoli.

to je fakt takovy problem najit univerzalni font? jsem myslel ze od toho vznikl unicode.

potom se lidi divi, ze nekteri lidi vzdali diakritiku




Re:plny unicode font?
« Odpověď #1 kdy: 11. 05. 2025, 20:08:01 »
To máte nějakou špatnou variantu písma. Noto podporuje znaky středoevropských jazyků: https://fonts.google.com/noto

Re:Plný unicode font se všemi znaky
« Odpověď #2 kdy: 11. 05. 2025, 20:16:43 »
jak jsem rekl, hledal jsem JEDEN font. co podporuje japo. cins. korejstinu a cestinu.
ktery noto konkretne?

Re:Plný unicode font se všemi znaky
« Odpověď #3 kdy: 11. 05. 2025, 20:32:47 »
Máš v systéme nainštalovane fonts-noto-cjk? T. j. aj keď font Noto podporuje všetky znaky, nemusíš mať nainštalovane všetky intervaly UNICODE pre fontu Note.

Re:Plný unicode font se všemi znaky
« Odpověď #4 kdy: 11. 05. 2025, 20:46:39 »
Tak v Unicode máte připravených 17 rovin (plane) s 2^16 možnými položkami v každé, teď je v součtu obsazených asi 150 tisíc znaků :) Přirozeně to nebude mít každý font všechno pokryté.

Pokud ale budete vybírat mezi nejrozšířenějšími fonty, co se typicky používají na UI, tak tam to bude docela obstojné.
Je fakt, že některé fonty, mají ještě specifické CJK varianty právě pro ty asijské jazyky. Bude dost záležet na použití, kdy se třeba někdy nehodí načítat vždycky obrovský font, co má hromady glyphů a definovaných znaků. Samozřejmě se z toho může udělat i víc verzí, jedna kompozitní, kde je víceméně všechno, a pak zmíněné jednotlivé menší regionální varianty.

Nicméně třeba Liberation, Dejavu, nová Adwaita, některé fonty od Adobe, z Windows pak Arial, Segoe, Consolas, Andale atd.. vypadají, že Češtinu, Korejštinu i Japonštinu zvládají bez problémů.

Příliš žluťoučký kůň úpěl ďábelské ódy
速い茶色の狐が怠惰な犬を飛び越える。
빠른 갈색 여우가 게으른 개를 뛰어넘는다。

Jen jsem vložil ukázkový text do GNOME Font Manageru a bez potíží se mi to zobrazilo.


RDa

  • *****
  • 3 038
    • Zobrazit profil
    • E-mail
Re:Plný unicode font se všemi znaky
« Odpověď #5 kdy: 11. 05. 2025, 20:50:03 »
Treba u toho noto je cjk jako zvlast balicek (lze nainstalovat primo nebo skrze USE flag dependency), pak jeste je tam neco s emojis jako extra.

Kód: [Vybrat]
$ USE=cjk emerge media-fonts/noto media-fonts/noto-emoji -pv

These are the packages that would be merged, in order:

Calculating dependencies... done!
Dependency resolution took 8.63 s (backtrack: 0/30).

[ebuild  N     ] media-fonts/noto-cjk-20190416::gentoo  USE="X" 1,838,037 KiB
[ebuild  N     ] media-fonts/noto-emoji-20241003::gentoo  USE="X -icons" 202,212 KiB
[ebuild   R    ] media-fonts/noto-20250501::gentoo  USE="X cjk* extra" 0 KiB

Total: 3 packages (2 new, 1 reinstall), Size of downloads: 2,040,248 KiB

alex6bbc

  • *****
  • 1 768
    • Zobrazit profil
    • E-mail
Re:Plný unicode font se všemi znaky
« Odpověď #6 kdy: 11. 05. 2025, 22:45:05 »
tipuju, ze takovy font ani neexistuje.
cinstina ma podle me uplne jiny pristup k pismu, nez evropsti tiskari.

ja bych cekal, ze je potreba zkombinovat vice fontu, aby slo vypsat vsechny znaky unicode.

Re:Plný unicode font se všemi znaky
« Odpověď #7 kdy: 12. 05. 2025, 10:51:19 »
Tak to jenom vypadaji, mozna jine varianty v linuxu.

Arial urcite ne (mozna si mel na mysli Arial Unicode MS, ktery nikdy nebyl ve Windows jenom v Office a uz je to dlouho co byl odstranen, zrejme licencni spory.
Consolas - jenom vietnam
Andale mono - vubec nic
Segoe - ani jedna z 11 variant
Liberation - nemam ve windows, dle explicitniho seznamu kodu ve wiki nepodporuje.
Dejavu jsem stahl z githubu, cestina jo, asijskyho nic

Tak v Unicode máte připravených 17 rovin (plane) s 2^16 možnými položkami v každé, teď je v součtu obsazených asi 150 tisíc znaků :) Přirozeně to nebude mít každý font všechno pokryté.

Pokud ale budete vybírat mezi nejrozšířenějšími fonty, co se typicky používají na UI, tak tam to bude docela obstojné.
Je fakt, že některé fonty, mají ještě specifické CJK varianty právě pro ty asijské jazyky. Bude dost záležet na použití, kdy se třeba někdy nehodí načítat vždycky obrovský font, co má hromady glyphů a definovaných znaků. Samozřejmě se z toho může udělat i víc verzí, jedna kompozitní, kde je víceméně všechno, a pak zmíněné jednotlivé menší regionální varianty.

Nicméně třeba Liberation, Dejavu, nová Adwaita, některé fonty od Adobe, z Windows pak Arial, Segoe, Consolas, Andale atd.. vypadají, že Češtinu, Korejštinu i Japonštinu zvládají bez problémů.

Příliš žluťoučký kůň úpěl ďábelské ódy
速い茶色の狐が怠惰な犬を飛び越える。
빠른 갈색 여우가 게으른 개를 뛰어넘는다。

Jen jsem vložil ukázkový text do GNOME Font Manageru a bez potíží se mi to zobrazilo.
10

Re:Plný unicode font se všemi znaky
« Odpověď #8 kdy: 12. 05. 2025, 11:03:39 »
xterm ve výchozím nastavení zobrazuje CJK (Chinese, Japanese, Korean) znaky správně, byť velmi malým písmem; využívá k tomu bitmapové fonty původního formátu X11 XWindows, rozšířené o unicode znaky

https://www.cl.cam.ac.uk/~mgk25/ucs-fonts.html

testováno textem z

Také font, který používá GRUB - /boot/grub/fonts/unicode.pf2 - správně zobrazuje testovací text "cat /home/username/cjk" z příkazové řádky grubu. Je opět bitmapový, mimo grub asi nepoužitelný.

Re:Plný unicode font se všemi znaky
« Odpověď #9 kdy: 12. 05. 2025, 11:28:13 »
TrueType/OpenType font má limit pro 64k glyfů - takže jeden font nemůže podporovat všechny jazyky, to je za hranice možnosti toho formátu. Potřebuješ víc fontů a případně to hodit do jedné kolekce (.ttc nebo jak to je).

Re:Plný unicode font se všemi znaky
« Odpověď #10 kdy: 12. 05. 2025, 11:46:04 »
Tak to jenom vypadaji, mozna jine varianty v linuxu.

Arial urcite ne (mozna si mel na mysli Arial Unicode MS, ktery nikdy nebyl ve Windows jenom v Office a uz je to dlouho co byl odstranen, zrejme licencni spory.
Consolas - jenom vietnam
Andale mono - vubec nic
Segoe - ani jedna z 11 variant
Liberation - nemam ve windows, dle explicitniho seznamu kodu ve wiki nepodporuje.
Dejavu jsem stahl z githubu, cestina jo, asijskyho nic


To je nejspíš nějaký nedoraz v té Java knihovně, co má Tiny Media Manager na UI, nebo jejím používání.
Pro zajímavost jsem to stáhnul a ozkoušel na Linuxu, třeba font Adwaita (ale stejně se chová třeba Arial, nebo Segoe, co mám zkopírované z Windows).
Všechny nativní QT a GTK aplikace ty ukázkové texty zobrazily bez problémů. TMM bohužel.
Viz. screenshot, tam je Nautilus, Font Manager a TMM se stejným fontem.. ale stejné je to třeba v terminálu, VLC, web prohlížeč (to bychom ty texty z předchozího postu jinak vůbec neviděli).



Re:Plný unicode font se všemi znaky
« Odpověď #11 kdy: 12. 05. 2025, 11:50:10 »
Takže možná se spíš zeptat na nějakém fóru pro TMM nebo nahlásit chybu (feature request) na jejich gitlabu.

Re:Plný unicode font se všemi znaky
« Odpověď #12 kdy: 12. 05. 2025, 11:57:59 »
no ten printscreen vypada prukazne.
diky.
 ps pokud pouziju to noto, tak prijdu jen o dve ceska pismena, tak to je estetika. (ja chytam kousky  japonsky, zena korejsky, tak trvani na rozsypanem caji neni plne jen poza)

 
Tak to jenom vypadaji, mozna jine varianty v linuxu.

Arial urcite ne (mozna si mel na mysli Arial Unicode MS, ktery nikdy nebyl ve Windows jenom v Office a uz je to dlouho co byl odstranen, zrejme licencni spory.
Consolas - jenom vietnam
Andale mono - vubec nic
Segoe - ani jedna z 11 variant
Liberation - nemam ve windows, dle explicitniho seznamu kodu ve wiki nepodporuje.
Dejavu jsem stahl z githubu, cestina jo, asijskyho nic


To je nejspíš nějaký nedoraz v té Java knihovně, co má Tiny Media Manager na UI, nebo jejím používání.
Pro zajímavost jsem to stáhnul a ozkoušel na Linuxu, třeba font Adwaita (ale stejně se chová třeba Arial, nebo Segoe, co mám zkopírované z Windows).
Všechny nativní QT a GTK aplikace ty ukázkové texty zobrazily bez problémů. TMM bohužel.
Viz. screenshot, tam je Nautilus, Font Manager a TMM se stejným fontem.. ale stejné je to třeba v terminálu, VLC, web prohlížeč (to bychom ty texty z předchozího postu jinak vůbec neviděli).
« Poslední změna: 12. 05. 2025, 12:02:58 od pruzkumbojem »

Re:Plný unicode font se všemi znaky
« Odpověď #13 kdy: 12. 05. 2025, 12:04:04 »
Takže ještě jeden pokus.. našel jsem ten kompozitní Arial Unicode (jeden řez v OpenType má 23 MB).

Ten pak knihovna pobere a zobrazí všechno správně.
Můj závěr tedy je, že to neumí korektně pracovat s TTF (OTF to evidentně pobralo).

https://online-fonts.com/fonts/arial-unicode-ms

(nahoře vpravo je odkaz na stažení, neptej se mě na licencování ;) ).

Re:Plný unicode font se všemi znaky
« Odpověď #14 kdy: 12. 05. 2025, 12:26:40 »
TrueType/OpenType font má limit pro 64k glyfů - takže jeden font nemůže podporovat všechny jazyky, to je za hranice možnosti toho formátu. Potřebuješ víc fontů a případně to hodit do jedné kolekce (.ttc nebo jak to je).

Tak to je. Universalitu při limitu 64k glyfů řeší např. font GoNotoKurrent:
Citace
covers pretty much all the scripts in current, widespread use all over the world. This is designed to be a "good enough" font for modern, living scripts without being exhaustive. (...)
It is a superset of all the "Regional Fonts" excluding historical or specialty fonts. It includes support for Chinese, Japanese and Korean (CJK) too, using the Unihan IICore subset.
, viz https://github.com/satbyy/go-noto-universal?tab=readme-ov-file#go-noto-cjk-core
 
« Poslední změna: 12. 05. 2025, 12:28:33 od Jin Rys »