Fórum Root.cz

Hlavní témata => Vývoj => Téma založeno: bo 27. 02. 2017, 12:09:31

Název: Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: bo 27. 02. 2017, 12:09:31
Statistiky mé stránky mi sdělují:
Požadovaná, ale nenalezená URL (kód HTTP 404)    
/gp1/euklidova-veta.pdf   13   -
/gp14/4d-koule.html   11   -
/g5/4d-krychle-v.html   11

Nevyhledané stránky potřebují správně "Euklidova" a další zase "4D"
Příčinou, že zájemci nenacházejí zvolenou stránku, je záměna velkého a malého písmene v adrese.
Způsobuje to snad některý vyhledávač, jak tomu odpomoci?
(Jedině snad vložit do mých stránek u poskytovatele i verze html s malými písmeny?)
Název: Re:Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: Petr Krčmář 27. 02. 2017, 12:17:22
Ti příchozí musí odněkud vzít špatný odkaz s malými písmeny a vyhledávač jim takový odkaz sám od sebe neposkytne. Zkus si třeba vyhledat „praha“ s malým p a stejně to najde odkaz na Wikipedii, ve kterém je P velké. Vyhledávač sám od sebe odkazy nemění, protože by nefungovaly. Chce to z logů zjistit podle referreru, odkud ti uživatelé přišli a kde je ten odkaz napsaný špatně.
Název: Re:Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: bo 27. 02. 2017, 19:42:36
Díky za odpověď.
Název: Re:Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: abc123 27. 02. 2017, 22:35:11
hlavne si oprav aplikaciu :) URL by podla RFC mali byt case insensitive, ak sa pouzije lowercase schema, cize ak uzivatel klikne na http://, tak mas spracovat case insensitive url.

https://www.ietf.org/rfc/rfc1738.txt

; the scheme is in lower case; interpreters should use case-ignore
scheme         = 1*[ lowalpha | digit | "+" | "-" | "." ]
Název: Re:Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: abc123 27. 02. 2017, 22:47:39
aj ked toto je odkaz na konkretny naozv suboru :) tam sa bude asi hodit to osetrit cez mod_rewrite, alebo mod_speling
Název: Re:Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: bo 02. 03. 2017, 10:10:06
hlavne si oprav aplikaciu :) URL by podla RFC mali byt case insensitive, ak sa pouzije lowercase schema, cize ak uzivatel klikne na http://, tak mas spracovat case insensitive url.

https://www.ietf.org/rfc/rfc1738.txt

; the scheme is in lower case; interpreters should use case-ignore
scheme         = 1*[ lowalpha | digit | "+" | "-" | "." ]

Díky, jenže tyto možnosti přesahují mé nejjednodušší postupy a znalosti pro tvorbu stránek www.
Název: Re:Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: Ondřej Němeček 2 02. 03. 2017, 23:17:37
Všechny soubory bych přejmenoval na malá písmena bez diakritiky a mezer (třeba pomocí krename nebo podobného nástroje). Opravil bych odkazy v html stránkách (může být složitější, ale textový editor může dost pomoci). A pak pomocí htacces souboru a mod rewrite bych všechny požadavky přepsal na varianty s malými písmeny. Takhle by to mělo jít, i když přesné řešení z ruky nevysypu :-)
Název: Re:Vliv malých a velkých písmen na vyhledání stránky
Přispěvatel: ByCzech 03. 03. 2017, 02:36:43
hlavne si oprav aplikaciu :) URL by podla RFC mali byt case insensitive, ak sa pouzije lowercase schema, cize ak uzivatel klikne na http://, tak mas spracovat case insensitive url.

https://www.ietf.org/rfc/rfc1738.txt

; the scheme is in lower case; interpreters should use case-ignore
scheme         = 1*[ lowalpha | digit | "+" | "-" | "." ]

Ze stejného dokumentu:

In general, URLs are written as follows:

       <scheme>:<scheme-specific-part>

A URL contains the name of the scheme being used (<scheme>) followed
   by a colon and then a string (the <scheme-specific-part>) whose
   interpretation depends on the scheme.

   Scheme names consist of a sequence of characters. The lower case
   letters "a"--"z", digits, and the characters plus ("+"), period
   ("."), and hyphen ("-") are allowed. For resiliency, programs
   interpreting URLs should treat upper case letters as equivalent to
   lower case in scheme names (e.g., allow "HTTP" as well as "http").

Takže se jedná o scheme část URL neboli jestli je URL http nebo HTTP nebo to je třeba HtTp ap. je jedno, ale nic to nevypovídá o case sensitivitě dalších částí jako je scheme-specific-part a path za tím.