Войти

Показать полную графическую версию : Русские буквы в URL


antOOn
23-01-2005, 02:50
Может я чего-то не понимаю, но я всегда считал, что не бывает в URL нелатинских букв. А тут вот такое: http://ru.wikipedia.org/wiki/Википедия:Как_править_статьи
Или это какие-то дополнительные навороты типа Java или какого-то расширенного HTML или черт знает чего ещё?

hasherfrog
23-01-2005, 03:15
Бывает, уже года два как, емнип. Технологию объяснять не буду, потому как я сам _точно_ не свогу объяснить, а на пальцах - не хочу позориться. Но это не джава и не хтмл, это совсем другое. адрес в виде unicode (введён из-за китайцев и руских) поддерживается не всеми браусверами, но всеми dns-серверами.

А вот кто мне ещё до кучи объяснит, почему большие буквы в УРЛ отличаются от маленьких? На уровне dns такого нет, насколько я знаю. А вот на уровне поддиректорий сервера - на прошлой неделе обнаружил, что есть, оказывается разница... Что за ерунда???

Yustus
23-01-2005, 18:13
почему большие буквы в УРЛ отличаются от маленьких
пому как в *nix'ах большие буквы и маленькие - это две разные вещи.

hasherfrog
23-01-2005, 19:10
Yustus
:) Ну и фигли? В интернете только юниксоиды сидят, что ли? Я так понимаю, что это веб-сервера (апачи или кто там) так "здорово" настроены на некоторых сайтах, что на запросы по урлу страниц - делают разницу между большими буквами и маленькими... Только я не пойму, насколько это: 1. целнсообразно и 2. вообще принято???

hasherfrog
23-01-2005, 19:18
Вот, например: http://www.forum.oszone.ru/Index.php? - фигу :)
А вот так - http://www.Forum.oszone.ru/index.php? - но проблем?

Я чувствую, что ноль-пять и ноль-пять - это литр, но математически объяснить не могу... (c) В.И.Чапаев

Вот кто бы помог?..

antOOn
24-01-2005, 00:18
И ещё. Если я в Яндексе делаю запрос, то в строке это выглядит так: http://www.yandex.ru/yandsearch?rpt=rad&text=%EF%F0%E8%EC%E5%F0+%E7%E0%EF%F0%EE%F1%E0
это тоже unicode? а что? и ещё - unicode и utf-8 это ожно и то же? почему есть ещё utf-7 и пр.?
вот столько у нас вопросов и ни одного ответа :-)

hasherfrog
как, емнип.
может я совсем тупой, но что есть емнип?

Yustus
24-01-2005, 00:25
http://fr.spb.ru/da/ruseuro.htm

hasherfrog
24-01-2005, 00:43
[е]сли [м]не [н]е [и]зменяет [п]амять
Для примера с яндексом - это, имхо, win-1251.
unicode и utf-8 0 не одно и то же, а utf-7 - ещё, третье.

hasherfrog
24-01-2005, 00:48
вот (http://www.google.ru/search?hl=ru&client=firefox-a&rls=org.mozilla%3Aen-US%3Aofficial&q=%D1%80%D0%B5%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%86%D0%B8%D1%8F+%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD% D0%BD%D1%8B%D1%85+%D0%B8%D0%BC%D0%B5%D0%BD+%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%BC%D0%B8+%D0%B1%D 1%83%D0%BA%D0%B2%D0%B0%D0%BC%D0%B8&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=) кое-что по русским буквам в url...
-> http://info.nic.ru/st/10/out_40.shtml

antOOn
24-01-2005, 01:27
hasherfrog
Говоря про Яндекс, я имел в виду вот эту часть адреса: %EF%F0%E8%EC%E5%F0+%E7%E0%EF%F0%EE%F1%E0
Когда я её вставляю в перекодировщик Tcode, он мне говорит: "преобразована 7 битная кодировка". А что это значит, я не знаю.

Насчёт Unicode. Я почему спрашиваю - вот у себя в Опере я захожу во View > Encoding > Unicode и вот там он уже делится на UTF-8, 16, 32 и отдельно UTF-7. Получается это разновидности unicode? или нет...

hasherfrog
24-01-2005, 09:06
Ммм. 1251 - тоже своего рода 7-битная кодировка... :)
Определение unicode (http://www.google.ru/search?hl=ru&client=firefox-a&rls=org.mozilla%3Aen-US%3Aofficial&q=define%3Aunicode&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=)

Так всё-таки, ну просветит меня кто-нибудь про правила написания url в интернете???
А то я никогда об этом не задумывался, всегда писал "как красивше", а теперь оказалось, что некоторые страницы моей "чудовищной домашней странички" (c) Экслер не так-то просто открыть :(

Greyman
24-01-2005, 13:24
Господа, вы немного перепутали. УРЛ состоит из двух частей: 1) имени сервера, 2) пути расположения файла на этом сервере.
antOOn спрашивал про 2-ой вариант. Для него никогда никаких ограничений не было, кроме соответствующей поддержки нужной кодовой страницы в используемом ПО на конкретной машине пользователя. И даже если соответствующей поддержки нет, то урл все равно будет функционировать, т.е. отображаться будет абракадабра, но при его запросе откроется нужная страница (при условии, что не используется слишком "умные браузеры", проверяющие кодировки вводимых урлов, а посто передающие их 1-в-1 как они введены). К разрешению имен и DNS это не имеет никакого одношения.

П.1 действительно требует задействования определенных технологий, к-ые уже работают, однако это совсем не случай antOOn. По п.1. я поднимал тему (http://forum.oszone.net/showthread.php?t=31440) еще давным-давно, кому интересно - может почитать стандарты, к-ые там приведены (на инглише конечно). В принципе, возможно есть уже их переводы на русский, но я их не искал, поэтому точно сказать не могу...

hasherfrog
24-01-2005, 13:50
Короче, пока сам не разберёшся...

Строение URL:
http://www.utoronto.ca/webdocs/HTMLdocs/NewHTML/url.html

URL - подтип URI.
http://www.w3.org/Addressing/

По поводу моего вопроса:
Вот посмотрите, как ведут себя маленькие/большие буквы в этом адресе:
http://www.w3.org/Addressing/URL/Overview.html
Попробуйте-ка поменять...




© OSzone.net 2001-2012