L 'INTERNET : COMMENT ÇA MARCHE ?


L'Internet

Ce document a pour objet de présenter rapidement l'Internet au travers de sa mise en œuvre et de ses fonctionnalités. L'utilisation des nombreux programmes informatiques qui permettent l'accès à l'Internet ne fait pas l'objet de ce document. De même la présentation technique d'Internet restera minime , seuls seront présentés les concepts importants qui permettront d'utiliser plus intelligemment l'Internet.

Origines

Depuis quelques mois on parle beaucoup de l'Internet aussi bien dans la presse non spécialisée en informatique qu'à la radio ou à la télévision. Pourtant l'Internet est né au milieu des années 70 de l'interconnexion de plusieurs réseaux américains . Ce réseau était alors appelé ARPAnet. Au début ARPAnet était un projet de recherche militaire dont l'objectif était de créer un réseau informatique expérimental qui pourrait résister à des dommages partiels (tel que la destruction de plusieurs nœuds). Le réseau devait donc pouvoir de façon automatique :

Pour ces raisons , l'Internet est fondé sur la commutation de paquets. L'information à transmettre est donc découpée en paquets de petites tailles qui transitent alors de nœuds en nœuds de l'émetteur vers le destinataire. Les chemins empruntés par chaque paquet d'un même message pouvant être différents , les paquets peuvent alors avoir un séquencement à l'arrivée différent de celui qu'ils avaient au départ. Le destinataire se charge alors de façon automatique et transparente pour l'utilisateur de rétablir l'ordre des paquets. On parle souvent un peu abusivement de l'Internet comme d'un réseau. En fait Internet est un réseau de réseaux. Internet signifie d'ailleurs Interconnexion of NETworks. Rapidement le besoin de relier les différents réseaux informatiques des centres de recherches publics américains se fit sentir. Le développement des réseaux locaux Ethernet , suivi de l'apparition de plus en plus nombreuses des stations de travail UNIX dans les universités imposa l'utilisation du protocole IP. A la fin des années 80 la National Science Foundation (NSF) décida de relier les réseaux de ses 5 principaux centres de recherches entre eux. Le réseau NSFNET résultant utilisa le même protocole IP qu'ARPAnet. De plus certaines universités ou certains centres de recherches US possédaient des connexions point à point. Ainsi depuis une université, pour se connecter à un laboratoire externe il fallait utiliser un ordinateur alors que pour se connecter à un autre centre de recherche il fallait utiliser un autre ordinateur.

Très vite le besoin de relier entre eux tous ces réseaux amena à la création de l'Internet. Par l'utilisation d'un protocole très répandu et non propriétaire , l'Internet permit d'interconnecter des ordinateurs très différents les uns des autres et pour la plupart incompatibles entre eux.

État actuel

La caractéristique principale d'Internet est de n'appartenir à personne. Chaque centre de recherche connecté à l'Internet participe à son financement. De la même façon les protocoles de communications retenus ne sont pas issus de travaux d'organismes de normalisation internationaux tels que l'ISO . Il n'y a donc pas non plus d'organisme central qui impose aux autres les protocoles. La définition technique des protocoles est décrite dans des documents de références appelés les RFC (Request For Comment). Ces documents sont librement disponibles pour la consultation sur l'Internet. Initialement exclusivement réservé aux centres de recherches ou aux établissements de formations publics, maintenant Internet est de plus en plus ouvert aux entreprises privées. Actuellement aux États-Unis on estime que la moitié du trafic sur l'Internet est effectué par des entreprises privées. Le réseau NSFNet qui constituait jusqu'alors le backbone d'Internet aux États-Unis a été fermé en avril 1995 et remplacé par des backbones de sociétés commerciales tels que MCIé ... Cette ouverture vers le secteur privé est devenue indispensable pour permettre le financement de l'extension planétaire d'Internet. La situation Française en est toujours au monopole de l ' État qui au travers de France Télécom a mis sur pied la branche Française d'Internet : RENATER (REseau NATional pour l'Enseignement et la Recherche).

Vous trouverez sur l'URL http://www.urec.fr/Renater les informations les plus récentes sur RENATER.

Perspectives

Depuis l'apparition de serveurs WWW l'Internet commence à intéresser de plus en plus le grand public. On constate actuellement une demande croissante de particuliers qui désirent accéder à l'Internet depuis leurs domiciles. De nombreux opérateurs français apparaissent pour répondre à cette nouvelle demande. De nombreuses entreprises commencent également à s'intéresser à l'Internet. Après quelques années de retard , l'Internet en France et en Europe deviendra un gros marché commercial. Cela ne va pas sans poser quelques problèmes en France car RENATER , la branche française de l'Internet a été exclusivement financée par l'État. Quelques années après les USA, certains hommes politiques français annoncent même que le développement des autoroutes de l'information doit être une priorité nationale. Nul doute que les années à venir vont bouleverser le développement de l'Internet. Victime de son succès quasi populaire l'Internet commence à être très encombré. Le nombre sans cesse croissant de connexion impose d'augmenter la bande passante des principales artères (les backbones). Certains scientifiques se demandent même s'il ne serait pas temps pour eux de créer un autre réseau de réseaux qui serait exclusivement destiné à la recherche et à l'enseignement supérieur. Cette idée présente comme une impression de déjà vu...

Décrypter une adresse Internet

Chaque nœud Internet du réseau est repéré de façon unique par une adresse. En réalité l'adresse peut être exprimée sous 2 formes différentes :

Ces deux adresses désignant le même nœud du réseau , il y a donc une bijection entre elles. L'adresse IP est la forme la plus pratique pour un ordinateur. L'adresse symbolique est la plus pratique pour un être humain. Un serveur particulier , le DNS (Domain Name Service) permet d'établir la correspondance entre un numéro IP et le nom symbolique correspondant. Par exemple le numéro IP 159.31.10.2 correspond à une station SUN qui a aussi pour adresse soleil.ensm-ales.fr. Les 2 formes sont rigoureusement équivalentes pourtant nous allons voir que la seconde apporte beaucoup plus d'informations à un être humain que la première.

Adresse d'un domaine

Le système d'administration des noms (DNS) répartit l'administration des noms en niveaux hiérarchiques. Chaque niveau est appelé domaine. Chaque domaine est responsable de l'administration des noms de ses sous-domaines. Ainsi tous les domaines Français ont comme suffixe fr. Un organisme Français s'occupe de l'attribution des noms du domaine fr ainsi que des intervalles de numéros IP attribués à chacun. A charge ensuite à chaque administrateur du domaine d'attribuer ses numéros IP comme bon lui semble. Il peut également décider de créer autant de sous domaine qu'il souhaite. Le nom d'un domaine est constitué d'au moins 2 parties séparées par un point :

Un identifiant sur 2 caractères du pays ou le type du domaine sur 3 lettres

Il y a environ 300 codes de pays dont seuls 150 sont actuellement connecté à l'Internet.

Le nom du domaine

Quand on parcourt le nom de gauche à droite , chaque nom est englobé dans le sous domaine suivant. .

Le cas particulier des USA

En tant que créateur du réseau Internet les USA ont établi des règles d'attributions de noms de leurs domaines quelques peu particulières. Ainsi à l'organisation géographique des attributions des noms de domaine (tel que ucla.ca.us) , les USA ont préféré une notion organisationnelle (ucla.edu). Ils ont ainsi fait la distinction entre les sites :

Certains pays comme l'Angleterre ont essayé de reproduire de façon simplifiée la distinction faite entre les domaines privés et les domaines publics. Ainsi le domaine co.uk accueille tous les sites commerciaux alors que ed.uk accueillera les domaines publics d'enseignement.

Sous domaine

On a vu que l'administrateur d'un domaine a le loisir de créer autant de sous-domaines que nécessaire. Bien que possible une telle décomposition n'est utile que quand le nombre d'ordinateurs connectés est important. A l'heure actuelle une telle décomposition est inutile. Certains domaines couvrent une étendue très vaste. Par exemple nasa.gov relie des sites de la NASA répartis sur tout le territoire des États-Unis.

Adresse d'un utilisateur

L'adresse d'un utilisateur est en fait son adresse e-mail. En effet un utilisateur n'est généralement pas attaché à une machine en particulier. Il est par contre rattaché à un domaine , c'est donc tout naturellement que l'adresse de l'utilisateur s'obtient en rajoutant le nom de l'utilisateur à celui du domaine.

L'adresse du domaine est en fait celle dans lequel le serveur de messagerie (e-mail) se trouve , il peut y avoir plusieurs serveurs de messagerie sur un même domaine , dans ce cas il faut rajouter à l'adresse le nom de la machine qui abrite le serveur de messagerie avec lequel on veut communiquer.

NB : On distingue facilement l'adresse d'un utilisateur de celle d'un ordinateur par la présence du symbole @ (qui se prononce at).

Les fonctionnalités de l'Internet

e-mail : le courrier électronique

Le courrier électronique est souvent le premier service d'Internet que l'on utilise. Il permet de s'affranchir des décalages entre les fuseaux horaires et permet de joindre une personne même si elle est absente.

NB : nous sommes sensés utiliser le terme Mèle en français pour remplacer Email !

Pour pouvoir envoyer ou recevoir du courrier électronique il faut disposer d'une adresse e-mail ainsi que d'un logiciel permettant de communiquer avec le serveur e-mail du domaine.

A la différence de QuickMail qui utilise le protocole réseau AppleTalk , Eudora utilise TCP/IP il nécessite donc un ordinateur sur lequel MacTCP soit correctement installé et configuré.

Un certain nombre de règles doivent être respectées lors de la rédaction de courrier e-mail :

Il n'est actuellement pas possible de savoir si le message est arrivé à destination ni de savoir si le message a été lu. Un message envoyé arrive toujours à destination sauf si l'adresse est fausse ou si une erreur survient sur le réseau. Dans ce cas le message est renvoyé à l'expéditeur en lui signalant dans le champ sujet la nature de l'erreur rencontrée :

Si vous ne parvenez pas à envoyer un message à un correspondant et si vous êtes certain de son adresse e-mail vous pouvez le signaler à un utilisateur particulier du domaine distant : postmaster. Le courrier adressé à postmaster sera lu par l'administrateur de la messagerie du domaine que vous essayez de joindre son adresse sera de la forme postmaster@nom_du_domaine. Par exemple postmaster@eerie.fr. Vous pouvez par exemple lui demander si la personne que vous cherchez à joindre est toujours déclarée sur son domaine. Attention il faut écrire au postmaster dans sa langue d'origine ou éventuellement en Anglais.

L'envoi de fichiers en pièce jointe pose actuellement de nombreux problèmes car e-mail n'autorise de façon systématique que l'envoi de fichier texte pur (i.e. ne contenant pas de lettres accentuées). Il existe plusieurs normes qui permettent d'envoyer des fichiers de type quelconque mais aucune n'offre la garantie d'être en service sur tous les domaines :

Ces 2 méthodes présentent l'inconvénient de n'être opérationnelles que si elles sont présentes de bout en bout de la chaîne d'information.

Il faut se garder d'envoyer tout type d'information confidentielle par e-mail. Il est déjà arrivé de rencontrer sur des serveurs de messageries des programmes qui tournaient en tâche de fond à la recherche de certains mots clés (tels que password) dans les fichiers contenant tous les messages reçus. De part la structure même d'Internet les messages transitent de nœud en nœud de l'émetteur jusqu'au destinataire. Aucun de ces nœuds ne peut garantir la confidentialité du message. D'autre part il n'existe pas de garantie que le contenu des champs From: et Reply-to: soient valides. En effet rien ne vous empêche d'envoyer un message en indiquant comme adresse d'expéditeur ministre@culture.fr. Il est cependant possible d'envoyer des messages confidentiels et même de garantir l'origine du message en utilisant un logiciel tel que PGP (Pretty Good Privacy).

Ce nom qui signifie assez bonne confidentialité est particulièrement humoristique quand on connaît l'efficacité militaire du cryptage utilisé. Philip Zimmermann l'auteur de ce logiciel fait l'objet de poursuites judiciaires de la part de l'administration américaine pour exportation illégale (en fait pour diffusion par Internet) de technologies militaires. Bien que PGP soit un logiciel d'utilisation totalement gratuite il est interdit d'utilisation en France car les services compétents de l'état ne pourront pas décrypter vos messages. PGP utilise une combinaison de clé privée et de clé publique qui permettent d'authentifier et de crypter un message. Pour cela vous devez garder secret la clé privée et distribuer à des personnes de confiance vos clés publiques. Une version Macintosh de ce logiciel existe et fonctionne parfaitement !


Listes de diffusions (mailing lists) : les utilisateurs se regroupent

Le serveur de mailing list permet de centraliser sur une seule machine toute la liste et offre de nombreux autres services.

Principe :

Un ordinateur héberge un logiciel serveur de mailing lists .On communique avec ce serveur par 2 adresses différentes :

une adresse administrative au travers de laquelle on envoie des commandes au serveur. Cette adresse est souvent du type listserv@domaine ou majordomo@domaine cela dépend du logiciel qui équipe le serveur.

Les commandes peuvent être de plusieurs types possibles :

Les listes de diffusions sont très souvent thématiques mais elles peuvent parfois être géographiques ou administratives.

Il existe plusieurs modèles de serveur de mailing lists, les plus répandus sont listserv et majordomo. Les commandes varient en fonction du serveur. Généralement pour s'abonner il suffit d'envoyer un message à l'adresse administrative dont le contenu est de la forme :

· signon nom_de_la_liste Prénom Nom ou · subscribe nom_de_la_liste Prénom Nom

Un serveur pouvant gérer plusieurs listes de diffusions simultanément , il faut préciser le nom de la liste au moment de l'abonnement. Dans ce cas l'adresse administrative est unique alors que l'adresse de diffusion est différente pour chaque liste. En réponse à une demande d'abonnement le serveur envoie dans les minutes qui suivent un message de bienvenue contenant de nombreuses informations intéressantes telles que la façon de se désabonner. Afin de rationaliser l'utilisation de la liste de diffusion ce message contient également le cadre strict d'utilisation de la liste. L'utilisateur doit se plier à ces règles pour le bien être des autres abonnés. Il est fortement conseillé de garder de côté ce message pour le jour où l'on voudra se désabonner.

Pour se désabonner d'une liste il suffit d'envoyer le message de la forme suivante à l'adresse administrative du serveur :

· signoff nom_de_la_liste Prénom Nom ou · unsubscribe nom_de_la_liste Prénom Nom

Il est fortement recommandé de conserver le message reçu lors de l'abonnement à la liste car il indique clairement la façon de se désabonner ainsi que l'adresse administrative. Sans cette information, se désabonner peut être un véritable parcours du combattant. Cela est d'autant plus gênant que pendant ce temps la boîte aux lettres continue à se remplir de messages.

Les discussions doivent se faire via l'adresse de diffusion: tout message envoyé à l'adresse de diffusion sera reçu par tous les abonnés de la liste.

WWW : la toile d'araignée planétaire : le " Oueb "

World Wide Web est le plus récent des services d'information disponibles sur Internet. C'est aussi celui qui a le plus contribué au développement exponentiel d'Internet auprès du grand public. Fondé sur le concept de document hypertexte WWW a été créé au CERN de Genève pour pouvoir facilement présenter des informations variées à des physiciens qui n'avaient pas de compétence informatique. De tous les protocoles utilisés sur Internet , celui lié au WEB est le protocole dont le volume d'échange croit le plus vite.

  • Présentation de l'hypertexte
  • URL : un accès unifié à l'information
  • Navigation dans les documents

  • Présentation de l'hypertexte

    L'hypertexte est un moyen d'enrichir un texte par des références contextuelles vers d'autres documents. Cela permet d'insérer dans un texte des liens vers des documents qui enrichissent ou complètent le texte. Les documents hypertextes sont très souvent utilisés dans les systèmes d'aide en ligne de la plupart des logiciels récents. WEB est une version réseau du concept d'hypertexte. De plus dans un document hypertexte traditionnel les liens vers d'autres documents sont accessibles en cliquant sur des groupes de mots particuliers. Dans le cas de WEB cette notion d'accès aux liens est étendue aux images. On peut ainsi avoir dans un document WEB une image qui comporte des zones sensibles. En cliquant sur certaines de ces zones on accède aux liens définis.

    Un lien peut pointer vers :

    La définition d'un lien est formalisée par la notion d'URL que nous allons voir en détail. Un document WEB est écrit dans le langage HTML (hypertexte Markup Language) il est transporté du serveur vers le client par le protocole HTTP (HyperText Transport Protocol).


    URL : un accès unifié à l'information

    URL signifie Uniform Ressource Locator . C'est une norme d'accès à une ressource. Une ressource peut être un des types de fichiers précités (images , sons...). Concrètement lorsque dans Netscape il y a un mot clé en surbrillance , le fait de cliquer sur cet élément vous affichera le document. Ce document peut être localisé sur n'importe quel serveur de part le monde ; les informations indiquant à Netscape le lieu où le document est déposé sont définies par une URL.

    Une URL est composée de 4 parties :

    La forme générale d'une URL est la suivante : Protocole://serveur:port/chemin/nom_du_document

    Voici deux exemples valides d’ URL :


    Navigation dans les documents

    Dans un document, le fait de cliquer sur un mot en surbrillance ou sur certaines images entraîne la consultation de l’ URL associée. A tout moment on peut interrompre le chargement d'un document en cliquant sur l'icône du panneau Stop. On peut revenir au document précédent en cliquant sur l'icône Back. Dans la zone éditable Location on peut directement saisir l’ URL du document que l'on veut visualiser.

    FTP : le transfert de fichiers

    Après le courrier électronique, un des services de base offert par Internet est le transfert de fichier. Pour cela on utilise habituellement le protocole FTP (File Transfert Protocol). Le transfert de fichier se fait en établissant une connexion entre un serveur FTP situé sur un site distant et un client FTP situé sur votre ordinateur.

    FTP permet de transférer des fichiers du client vers le serveur (c'est rarement utilisé) ou du serveur vers le client : en clair il vous permet d'envoyer des fichiers ou d'en ramener. Il vous permet également de supprimer des fichiers ou des répertoires à distance sous réserve que le serveur vous donne le droit de le faire. La condition de base pour transférer des fichiers est que le site distant soit équipé d'un serveur FTP actif.

    Transfert avec un utilisateur

    Pour transférer un fichier à un utilisateur il faut connaître son compte. Un compte est composé d'un nom d'utilisateur et d'un mot de passe. Là vous devrez indiquer votre compte pour que la connexion soit acceptée par notre serveur et que vous soyez autorisé à transférer des fichiers. Si vous voulez envoyer des fichiers à quelqu'un vous devrez soit connaître son compte (attention de ne jamais envoyer de compte avec mot de passe par e-mail) soit connaître un compte commun qui s'appelle parfois guest (invité) sur lequel vous aurez très peu de droits d'accès.

    FTP anonymes

    Le compte FTP anonyme vous permet de vous connecter à un serveur qui en est équipé pour pouvoir recevoir des fichiers. Certains serveurs FTP anonymes possèdent un répertoire /upload dans lequel vous pouvez envoyer des fichiers. Pour se connecter à un serveur anonyme vous devrez entrer les informations suivantes :

    Archie : recherche de fichiers dans les sites FTP anonymous

    La multiplicité des serveurs d'informations rend difficile la recherche d'une information précise. Un outil à été développé par l'université McGill du Canada : Archie. Archie permet de rechercher la liste des serveurs FTP anonymes qui possèdent un fichier dont on connaît une partie du nom. Il existe actuellement plus de 3000 serveurs FTP dans le monde.


    Usenet news : les forums de discussions thématiques

    Quand on veut établir une discussion avec des utilisateurs sur un thème précisé nous avons vu que l'on peut utiliser des listes de diffusions. Le problème de ces listes est que sur certains thèmes le volume d'information devient très vite énorme. Il est alors préférable d'utiliser le service des news. De plus les news permettent facilement de participer de temps en temps à une discussion sans être obligé de recevoir toute l'année des dizaines de messages par jour.

    Organisation des news

    Comme la plupart des services disponibles sur Internet les news utilisent un serveur et des clients. Le client se connecte au serveur de news pour consulter ou poster des articles à un groupe. La propagation des news se fait de proche en proche entre les différents serveurs. Un message posté sur un serveur peut mettre plusieurs jours à se propager à tous les serveurs de news de la planète.

    Organisation hiérarchique des news

    Afin de pouvoir trouver facilement un groupe qui parle d'un sujet précisé les news ont une organisation hiérarchique arborescente. Plus on descend dans l'arborescence plus le sujet devient précis. A la racine de l'arborescence il y a 7 branches principales :

    Plus on descend dans ces branches plus le sujet se spécialise , par exemple :

    Comme vous pouvez le voir : On ne discute pas que d'informatique dans les news On parle essentiellement en Anglais (Internet oblige). Cependant il existe une hiérarchie Française depuis 1993 dans laquelle on parle évidemment en Français. Les noms des groupes de cette hiérarchie commencent par fr (ex: fr.comp.mac). Beaucoup moins spectaculaire que WWW les news sont incontestablement plus utiles tant les sujets de discussions sont variés. Contrairement à WWW les news permettent à tout un chacun de participer aux discussions. Il convient cependant de respecter scrupuleusement un certain nombre de règles qui sont périodiquement postées dans les groupes news.announce.newusers et fr.announce.newusers.

    Propagation des New entre serveurs

    Il existe plus de 8000 groupes de news (on les appelle généralement les newsgroups). Cependant chaque serveur de news peut décider quels groupes ou quelles branches de groupes il désire recevoir. Par exemple on peut décider de recevoir :

    La propagation des news se fait de proche en proche. Comme c'est toujours le cas sur l'Internet il n'existe pas un serveur central auprès de qui les autres serveurs s'approvisionnent.

    Utilisation pratique des news

    La fenêtre est décomposée en 3 parties de haut en bas :


    Telnet : le travail à distance

    Expliquer le principe de Telnet est relativement simple : Vous prenez une station de travail en mode texte et vous remplacez les câbles qui relient l'écran et le clavier à l'unité centrale par une connexion réseau. Telnet permet donc de travailler à distance (en mode texte) sur une station de travail.


    Gopher : l'information hiérarchisée et distribuée

    Gopher est un système de distribution hiérarchisé de l'information. Conçu par l'université du Minnesota , Gopher était au départ destiné à rendre accessible des informations au niveau d'un campus. Porté par la diffusion d'Internet , Gopher s'est développé très vite à l'échelle planétaire.

    Gopher présente les fichiers répartis sur l'ensemble des serveurs Gopher comme étant une partie d'un document. Chaque fichier qui peut être du texte ou des images est accessible en parcourant une organisation arborescente. Chaque partie de l'arborescence possède un nom et une adresse réseau. Ainsi en parcourant la hiérarchie on saute de serveur en serveur de façon totalement transparente pour l'utilisateur. Tous ces documents constituent l'espace Gopher (Gopher space).


    Autres services

    Il existe encore d'autres services sur l'Internet qui sont généralement beaucoup moins utilisés. En voici quelques uns :