Uniform Resource Locator

Uniform Resource Locator

Единый указатель ресурсов (англ. URL — Uniform Resource Locator) — единообразный локатор (определитель местонахождения) ресурса. По‐английски «URL» целиком произносится как /ɜː(ɹ)l/, по‐русски чаще говорят [у-эр-э́л], [ю-эр-эл] или [урла́] (сленг). Ранее назывался Universal Resource Locator — универсальный локатор ресурса. URL — это стандартизированный способ записи адреса ресурса в сети Интернет.

Содержание

История

URL был изобретён Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, Женеве, Швейцария. URL стал фундаментальной инновацией в Интернете. Изначально URL предназначался для обозначения мест расположения ресурсов (чаще всего файлов) во Всемирной паутине. Сейчас URL применяется для обозначения адресов почти всех ресурсов Интернета. Стандарт URL закреплён в документе RFC 1738, прежняя версия была определена в RFC 1630. Сейчас URL позиционируется как часть более общей системы идентификации ресурсов URI. Стандарт URL регулируется организацией

Структура URL

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

<схема>://<логин>:<пароль>@<хост>:<порт>/<URL‐путь>

В этой записи:

схема 
схема обращения к ресурсу, в большинстве случаев имеется в виду сетевой протокол
логин 
имя пользователя, используемое для доступа к ресурсу
пароль 
пароль, ассоциированный с указанным именем пользователя
хост 
полностью прописанное доменное имя хоста в системе IP-адрес хоста в форме четырёх десятичных чисел, разделённых точками. Числа находятся в интервале от 0 до 255.
порт 
порт хоста для подключения
URL-путь 
уточняющая информация о месте нахождения ресурса (зависит от протокола)

Схемы (протоколы) URL

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов гипертекста HTTP, использующая шифрование (как правило, TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet через протокол IRC
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию WAIS
  • xmpp — Протокол XMPP (часть файла
  • data — Непосредственные данные (Data: URL)

Экзотические схемы URL:

Кодирование URL

Появление адресов URL стало существенным нововведением в Интернете. Однако с момента его изобретения и по сей день стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в кириллицы, или иероглифы, или, скажем, специфические символы французского языка, то нужные нам символы должны быть перекодированы особым образом.

В русскоязычной Википедии ежедневно приходится видеть пример кодирования URL, поскольку русский язык использует символы кириллицы. Например, строка вида:

http://ru.wikipedia.org/wiki/Микрокредит

кодируется в URL как:

http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82

Такое преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в Юникоде (шестнадцатеричном представлении:

М → D0 и 9C → %D0%9C
и → D0 и B8 → %D0%B8
к → D0 и BA → %D0%BA
р → D0 и 80 → %D0%80, и т. д.

Перед каждым таким шестнадцатеричным кодом байта, согласно спецификации URL[1], ставится знак процента (%) — отсюда даже возник английский термин «percent‐encoding», обозначающий способ кодирования символов в URL и URI.

Иные распространённые, но недопустимые в URL символы кодируются в таком соответствии:

 "  #[2] %  &[2]  '  *  ,[2] :[2] ;[2]  <   >  ?[2] [   ^   `   {   |   }  <пробел>
%22 %23 %25 %26 %27 %2a %2c %3a %3b %3c %3e %3f %5b %5e %60 %7b %7c %7d   +[3]

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами на подавляющем большинстве языков (кроме английского, итальянского, латинского) может утратить способность восприниматься людьми.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и англ. International Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы URI в целом).

Инициатива PURL

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

Примеры URL

http://ru.wikipedia.org/wiki/URL
http://en.wikipedia.org:80/wiki/Special:Search?search=train&go=Go 
ftp://myname:mypass@myhost.com:21/etc/motd
prospero://myhost.dom//pros/somename
file://vms.myhost.edu/disk$user/my/notes/note123.txt

См. также

  • PURL
  • IRI — интернационализированный идентификатор ресурса
  • Длинные доменные имена
  • Человеку Понятный URL

Сноски

  1. RFC 2396 часть 2.
  2. 1 2 3 4 5 6 Символ допустим, но при указании прямым текстом несёт специальное синтаксическое значение
  3. Следует отметить, что поисковики заменяют пробел на символ «+».

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Поможем сделать НИР

Полезное


Смотреть что такое "Uniform Resource Locator" в других словарях:

  • Uniform Resource Locator — n. The series of characters that will retrieve a particular web page when typed into the address bar in a Web browser; a domain name or IP address plus other information that specifies a particular page. abbrv. URL The Essential Law Dictionary.… …   Law dictionary

  • Uniform Resource Locator — is an URI which also specifies where the identified resource is available and the protocol for retrieving it. [ [http://www.faqs.org/rfcs/rfc1738.html RFC 1738 Uniform Resource Locators] ] In popular usage and many technical documents, it is… …   Wikipedia

  • Uniform Resource Locator — Uniform Resource Locator,   URL …   Universal-Lexikon

  • Uniform Resource Locator — Als Uniform Resource Locator (engl.; Abk. URL; dt. „einheitlicher Quellenanzeiger“) bezeichnet man eine Unterart von Uniform Resource Identifiern (URIs). URLs identifizieren und lokalisieren eine Ressource über die zu verwendende Zugriffsmethode… …   Deutsch Wikipedia

  • Uniform Resource Locator — Le sigle URL (de l anglais Uniform Resource Locator, littéralement « Localisateur Uniforme de Ressource »), auquel se substitue informellement le terme adresse web, désigne une chaîne de caractères utilisée pour adresser les ressources… …   Wikipédia en Français

  • uniform resource locator — universalusis adresas statusas T sritis informatika apibrėžtis Unifikuotas ↑ interneto ištekliaus adresas. Pavyzdys: http://aldona.mii.lt/pms/elpa/z.html. Universalųjį adresą sudaro šios dalys: 1) prefiksas (pvz., http://), nurodantis tinkle… …   Enciklopedinis kompiuterijos žodynas

  • Uniform\ Resource\ Locator — Die Adresse einer Webseite, so wie im Adreßfenster des Browsers angegeben. Der Uniform Resource Locator (URL) gliedert sich in Protokoll + Domain, z.B. http://www.reitbauer.at. Wird direkt auf einen Unterordner oder gezielt auf eine spezielle… …   Online-Wörterbuch Deutsch-Lexikon

  • uniform resource locator — universal resource locator; URL An address for a specific resource on the Internet. The URL always starts with the protocol for data transfer (http for web pages and ftp for file transfer protocol). A web page has a URL of the form web site: http …   Big dictionary of business and management

  • uniform resource locator — noun the address of a web page on the world wide web • Syn: ↑URL, ↑universal resource locator • Hypernyms: ↑address, ↑computer address, ↑reference …   Useful english dictionary

  • Uniform Resource Locator —    Abbreviated URL. An address for a resource on the Internet.    URLs are used as a linking mechanism between Web pages and as a method for Web browsers to access Web pages.    A URL specifies the protocol to be used to access the resource (such …   Dictionary of networking


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»