Jenze tohle ti bude fungovat jen a pouze s nekolika malo jazyky.
To je jasné. Je to primárně o způsobu toho převodu na řetězec bez diakritiky, pro češtinu a příbuzné jazyky i západoevropské jazyky to může být prakticky buď v pohodě nebo tolerovatelné..
Samozřejmě pokud by se tam v těch collation mapách byly i složitější vazby, jako např. opisy v jiných abecedách 'ö' == 'oe', tak to takhle jednoduše řešit nepůjde. Můžeš si to dál zkomplikovat i asijskými jazyky, co mají víc abeced, případně nějakou ustálenou romanizaci (spasibo). Pokud se tohle chce pokrývat i v pokročilejších databázích, které mají sice různé rozsáhle collationy, ale jedna generická varianta to nedá rovnou, tak se to musí přepínat dopředu (třeba předpokladem očekávané collation podle jazykové verze UI).
Jinak hlavně nevíme vůbec nic dalšího k tomu projektu. Ty ukázkové query jsou divné (Chce opravdu používat like bez těch %_ wildcards nebo jen hledat přesnou shodu?). Jak to má být velké - jestli je to databáze místního klubu chovatelů a zahrádkářů, co bude mít napřesrok 232 řádek a je tam jen Čeština, nebo tam jde trochu o výkon a musí řešit ty cizí jazyky. V jakém to dělá prostředí, jestli může a dávalo by mu smysl zvolit jiný databázový engine.
Takhle tady klidně můžeme spekulovat a vymýšlet hypotetické cesty a jejich případné nevýhody do nekonečna