Uniform Resource LocatorURL Uniform Resource Locator L'adresse web de la présente page, affichée dans la barre d'adresse du navigateur web Mozilla Firefox.
Une[1],[2],[3] ou un[3] URL (sigle de l'anglais : Uniform Resource Locator, littéralement « localisateur uniforme de ressource »), informellement appelée adresse web, est une chaîne de caractères qui indique sous une forme standardisée comment accéder à une ressource du World Wide Web à travers Internet. Les URL commencent par un protocole Internet suivi du caractère deux-points ; la suite est souvent constituée d'un nom de domaine et d'un chemin d'accès. Conceptuellement, une URL donne la localisation d'une ressource, sans garantir que la ressource s'y trouve, d'où le risque de lien mort. Il existe un autre type de chaîne qui identifient des ressources indépendamment de leur localisation, Uniform Resource Name (URN). URL et URN sont chacune un sous-ensemble des identifiants uniformes de ressource (Uniform Resource Identifier, URI). Tous ces identifiants sont standardisés par Request for comments (RFC), dont le RFC 3986[4]. Définition et dénominationDans les cercles techniques, les adresses web ont été connues sous divers noms : adresse WWW, Universal Document Identifier, Universal Resource Identifiers (RFC 1630[5]), et finalement divisées en Uniform Resource Locators (URL, RFC 1738[6], RFC 1808[7]) et Uniform Resource Names (URN, RFC 1737[8]), le tout étant des Uniform Resource Identifiers (URI, RFC 2396[9], RFC 3986[4])[10]. L'abréviation URL est utilisée dans le standard HTML 3.2[11], et elle est devenue la plus connue et utilisée par les techniciens. La situation est devenue suffisamment confuse pour que le RFC 3305[12] soit écrit pour clarifier la terminologie. Le nom original que l'inventeur du web donne aux adresses web est Universal Document Identifier (UDI) [13]. L'été 1992, il propose à l'Internet Engineering Task Force (IETF) de standardiser ces UDI, mais la dénomination « universel » a été écartée car jugée trop « arrogante » pour un projet alors jeune comme le Web. La dénomination Uniform Resource Identifier (URI) est le compromis résultant. Lors de la standardisation des URI, il était clair qu'en pratique, les adresses web n'identifiaient pas des documents, mais des emplacements de documents. Autrement dit, si un document est déplacé, alors son adresse change. En pratique, lorsqu'une ressource est déplacée, tous les hyperliens qui y mènent sont brisés, ce qui donne l'erreur HTTP 404 sur un serveur HTTP. Devant cet état de fait, il a été décidé que les adresses web seraient appelées Uniform Resource Locator (URL). L'idée était de standardiser deux sortes d'URI : Les URL seraient les URI qui indiquent « comment » (par quel chemin sur le réseau) accéder à une ressource, sa localisation ; les Uniform Resource Names (URN) seraient les URI qui identifient les documents eux-mêmes, indépendamment de leur localisation. Tim Berners-Lee ne cessait cependant pas d'insister pour que, au moins en théorie, les adresses web soient conçues pour être universelles. Il trouvait aussi que l'IETF perdait son temps en discussions, aussi en il publie le RFC 1630[5], Universal Resource Identifiers in WWW. Ce premier request for comments sur les adresses web est de la catégorie informative. Il décrit simplement la pratique de l'époque, et contient quelques erreurs. FrancisationDiverses francisations ont été proposées par des organismes nationaux. Le Vocabulaire de l'informatique et de l'internet publié au Journal officiel du par la Commission générale de terminologie et de néologie de France[14] a proposé « adresse réticulaire » et « adresse universelle ». Ces deux dénominations ont été rejetées par l'Office québécois de la langue française à cause de leur manque de précision, et elles ne sont pas entrées dans l'usage courant. L'Office québécois de la langue française propose[15], « adresse URL », « URL », « adresse web » et « adresse W3 ». Il fait remarquer que « adresse web » ne s'utilise généralement que pour les ressources des sites web, alors que l'abréviation URL met l'accent sur l'universalité de ces adresses, qui peuvent identifier des forums Usenet, des sites FTP, etc. Le grand public confond aussi souvent adresse web, adresse électronique et adresse IP. Pour éviter toutes ces ambiguïtés, les professionnels du web utilisent souvent l'abréviation « URL », bien qu'ils fassent en fait référence aux URI[16]. UsagesDans les navigateurs webLorsqu'on navigue sur le Web, le navigateur web affiche l'URL de la ressource consultée dans la barre d'adresse. Si l'on veut consulter une ressource dont on connaît l'URL, on peut directement la taper dans cette barre. Dans les premières années du Web, les navigateurs web n'acceptaient que des adresses techniquement valides pour identifier les ressources. Mais à la suite du développement du Web, le protocole de communication HTTP s'est imposé pour transmettre l'immense majorité des ressources consultées. Ainsi jusque dans les années 2010 les URL de page web commençaient presque toujours par Plus récemment, certains navigateurs comme Google Chrome n'affichent plus l'URL complète dans la barre d'adresse. Le protocole ou le préfixe « www » peuvent être masqués[17],[18]. Historique de navigationLes navigateurs web conservent un historique des URL consultées. Cela leur permet de reconnaître et présenter de manière distinctive les hyperliens vers des ressources déjà consultées. Pages favoritesIl suffit à un navigateur web de conserver l'URL d'une ressource pour constituer une liste de favoris (ou marque-pages). Lorsqu'un titre de ressource existe, les navigateurs le conservent aussi, ce qui permet d'afficher le titre d'une page plutôt que son URL. Dans les pages webEn HTML, le langage conçu pour écrire les pages web, on trouve de nombreuses URL. Chaque hyperlien est techniquement constitué d'une URL, invisible mais utilisée par le navigateur, et du texte (parfois d'une image) constituant la partie visible de l'hyperlien. Les URL sont aussi utilisées pour indiquer au navigateur la localisation de chaque ressource annexe incluse dans la page : images, vidéos, programmes informatiques, etc. Dans la vie couranteDes adresses web sont souvent données dans la publicité, ou indiquées sur les produits. Les adresses faciles à retenir sont alors recherchées. Ces adresses sont destinées à être saisies dans la barre d'adresse d'un navigateur, donc le D'autre part, une activité économique spécialisée s'est constituée pour acheter les noms de domaine reposant sur des mots courants, susceptibles d'être fréquemment recherchés par des Internautes. En règle générale, les domaines terminant par Légalement plus trouble, le typosquatting consiste à acheter sans autorisation des domaines dont le nom s'apparente à des marques connues appartenant à des tiers, parfois en remplaçant un caractère par un caractère visuellement très similaire d'un autre alphabet. Le cybersquattage consiste à acheter un nom de domaine portant un nom appartenant à une tierce partie, pour le lui revendre chèrement. C'est illégal dans de nombreux pays. Escroquerie de type hameçonnageL'escroquerie appelée hameçonnage consiste à envoyer à une victime une URL qui ressemble à celle d'un site web légitime, comme celui de sa banque, alors qu'en fait il s'agit de l'URL d'un site conçu pour extorquer des informations confidentielles, comme les codes d'accès au compte bancaire. ConceptionLes trois inventions à la base du World Wide Web sont :
Bien qu'un protocole (HTTP) et un format de données (HTML) aient été développés spécifiquement pour le Web, le web est conçu pour imposer un minimum de contraintes techniques[19]. En particulier, d'autres formats et protocoles que HTML et HTTP peuvent être utilisés. Cependant, pour qu'une ressource puisse faire partie du Web, elle doit être exprimable sous la forme d'une adresse web. C'est en ce sens que les adresses sont l'invention la plus fondamentale. SyntaxeLa syntaxe générale des URL est la suivante :
Une URL est une chaîne de caractères combinant les informations nécessaires pour indiquer à un logiciel comment accéder à une ressource Internet. Ces informations peuvent notamment comprendre le protocole de communication, un nom d'utilisateur, un mot de passe, une adresse IP ou un nom de domaine, un numéro de port TCP/IP, un chemin d'accès, une requête. Les informations nécessaires varient selon la ressource et le contexte d'utilisation de l'URL. En outre un identificateur de fragment peut être ajouté à la fin d'une URL pour identifier un élément à l'intérieur de la ressource. Bien que l'identificateur de fragment ne fasse pas formellement partie de l'URL, il est également décrit dans cet article et dans les standards techniques. URL absolue de type hiérarchiqueDe nombreux protocoles (HTTP, FTP) ont une forme d'adresse dite hiérarchique.
Une URL absolue permet d'indiquer comment accéder à une ressource indépendamment de tout contexte où elle peut être précisée ou transmise. Elle commence par l'indication d'un schéma de représentation (spécifique au protocole de communication utilisé pour accéder à cette ressource), suivi de l'ensemble des paramètres permettant de localiser sur le réseau le service hébergeant la ressource, puis permet de préciser à ce service le nom d'une ressource à traiter, transmettre des données de traitement, acheminer et récupérer les résultats, puis de préciser éventuellement quelle partie de ce résultat sera utilisée. Exemple :
Quelques exemples :
URL relativeLes protocoles utilisant un chemin hiérarchique permettent l'utilisation d'URL relatives. Une URL relative ne contient pas de protocole, généralement pas de nom de domaine, et souvent un chemin incomplet. Ceux-ci sont déduits à partir de l'URL de la ressource contenant l'URL relative. Les URL relatives sont souvent utilisées pour les hyperliens à l'intérieur d'un même site web. Si le document d'URL L'URL :
Jeu de caractèresOriginellement, les adresses ne contenaient que des caractères ASCII. Pour pouvoir représenter des caractères non ASCII, il existe un système d'échappement codant en ASCII la valeur hexadécimale de chaque octet d'un caractère : Une extension des URI a été créée pour étendre les adresses web au-delà de l'ASCII : les Internationalized Resource Identifiers (IRI). Media Resource LocatorMedia Resource Locator (MRL) est une chaîne de caractères utilisée pour identifier des ressources multimédia sur le World Wide Web ou en local (c’est-à-dire sur l'ordinateur de l'utilisateur). Le terme MRL est une analogie avec le terme URL. Une MRL est utilisée pour la lecture de contenu multimédia en streaming sur Internet, de même que par certains lecteur multimédias comme VLC media player et Xine. Extension de raccourcis .URLLes raccourcis d’adresse internet disponibles sur le bureau W11 par exemple ont pour extension .url. Cette extension a une particularité qu''elle partage avec l'extension des raccourcis de nom de fichiers .lnk : décocher la case "Masquer les extensions des fichiers dont le type est connu" ne suffit pas à les afficher. La procédure pour y arriver est complexe et potentiellement dangereuse quand elle passe par la base de registre. Elle est documentée dans le cas de .lnk . Notes et référencesNotes
Références
Voir aussiArticles connexes
Standardisation (en anglais)Documents définissants les recommandations et normalisations liées aux URL :
|
Portal di Ensiklopedia Dunia