Vliv malých a velkých písmen na vyhledání stránky

bo

Statistiky mé stránky mi sdělují:
Požadovaná, ale nenalezená URL (kód HTTP 404)    
/gp1/euklidova-veta.pdf   13   -
/gp14/4d-koule.html   11   -
/g5/4d-krychle-v.html   11

Nevyhledané stránky potřebují správně "Euklidova" a další zase "4D"
Příčinou, že zájemci nenacházejí zvolenou stránku, je záměna velkého a malého písmene v adrese.
Způsobuje to snad některý vyhledávač, jak tomu odpomoci?
(Jedině snad vložit do mých stránek u poskytovatele i verze html s malými písmeny?)
« Poslední změna: 27. 02. 2017, 12:15:29 od Petr Krčmář »


Re:Vliv malých a velkých písmen na vyhledání stránky
« Odpověď #1 kdy: 27. 02. 2017, 12:17:22 »
Ti příchozí musí odněkud vzít špatný odkaz s malými písmeny a vyhledávač jim takový odkaz sám od sebe neposkytne. Zkus si třeba vyhledat „praha“ s malým p a stejně to najde odkaz na Wikipedii, ve kterém je P velké. Vyhledávač sám od sebe odkazy nemění, protože by nefungovaly. Chce to z logů zjistit podle referreru, odkud ti uživatelé přišli a kde je ten odkaz napsaný špatně.

bo

Re:Vliv malých a velkých písmen na vyhledání stránky
« Odpověď #2 kdy: 27. 02. 2017, 19:42:36 »
Díky za odpověď.

abc123

Re:Vliv malých a velkých písmen na vyhledání stránky
« Odpověď #3 kdy: 27. 02. 2017, 22:35:11 »
hlavne si oprav aplikaciu :) URL by podla RFC mali byt case insensitive, ak sa pouzije lowercase schema, cize ak uzivatel klikne na http://, tak mas spracovat case insensitive url.

https://www.ietf.org/rfc/rfc1738.txt

; the scheme is in lower case; interpreters should use case-ignore
scheme         = 1*[ lowalpha | digit | "+" | "-" | "." ]

abc123

Re:Vliv malých a velkých písmen na vyhledání stránky
« Odpověď #4 kdy: 27. 02. 2017, 22:47:39 »
aj ked toto je odkaz na konkretny naozv suboru :) tam sa bude asi hodit to osetrit cez mod_rewrite, alebo mod_speling


bo

Re:Vliv malých a velkých písmen na vyhledání stránky
« Odpověď #5 kdy: 02. 03. 2017, 10:10:06 »
hlavne si oprav aplikaciu :) URL by podla RFC mali byt case insensitive, ak sa pouzije lowercase schema, cize ak uzivatel klikne na http://, tak mas spracovat case insensitive url.

https://www.ietf.org/rfc/rfc1738.txt

; the scheme is in lower case; interpreters should use case-ignore
scheme         = 1*[ lowalpha | digit | "+" | "-" | "." ]

Díky, jenže tyto možnosti přesahují mé nejjednodušší postupy a znalosti pro tvorbu stránek www.

Ondřej Němeček 2

Re:Vliv malých a velkých písmen na vyhledání stránky
« Odpověď #6 kdy: 02. 03. 2017, 23:17:37 »
Všechny soubory bych přejmenoval na malá písmena bez diakritiky a mezer (třeba pomocí krename nebo podobného nástroje). Opravil bych odkazy v html stránkách (může být složitější, ale textový editor může dost pomoci). A pak pomocí htacces souboru a mod rewrite bych všechny požadavky přepsal na varianty s malými písmeny. Takhle by to mělo jít, i když přesné řešení z ruky nevysypu :-)

ByCzech

  • *****
  • 1 870
    • Zobrazit profil
    • E-mail
Re:Vliv malých a velkých písmen na vyhledání stránky
« Odpověď #7 kdy: 03. 03. 2017, 02:36:43 »
hlavne si oprav aplikaciu :) URL by podla RFC mali byt case insensitive, ak sa pouzije lowercase schema, cize ak uzivatel klikne na http://, tak mas spracovat case insensitive url.

https://www.ietf.org/rfc/rfc1738.txt

; the scheme is in lower case; interpreters should use case-ignore
scheme         = 1*[ lowalpha | digit | "+" | "-" | "." ]

Ze stejného dokumentu:

In general, URLs are written as follows:

       <scheme>:<scheme-specific-part>

A URL contains the name of the scheme being used (<scheme>) followed
   by a colon and then a string (the <scheme-specific-part>) whose
   interpretation depends on the scheme.

   Scheme names consist of a sequence of characters. The lower case
   letters "a"--"z", digits, and the characters plus ("+"), period
   ("."), and hyphen ("-") are allowed. For resiliency, programs
   interpreting URLs should treat upper case letters as equivalent to
   lower case in scheme names (e.g., allow "HTTP" as well as "http").

Takže se jedná o scheme část URL neboli jestli je URL http nebo HTTP nebo to je třeba HtTp ap. je jedno, ale nic to nevypovídá o case sensitivitě dalších částí jako je scheme-specific-part a path za tím.