Propos et Commentaires du Climenole

Internet: niveau de confidentialité

1- Le niveau de confidentialité: un aperçu du problème.

Le problème de la confidentialité des communications et de leurs traces laissées sur Internet est en général peu compris. On ne compte plus les soi-disant méthodes de protection de la confidentialité proposant comme panacée l’utilisation de proxys (serveurs mandataires) associées ou non à la suppression de certaines traces en local.

Inutile de dire que ces méthodes sont insuffisantes, créent une impression trompeuse de sécurité et sont  à la limite de la fausse représentation. Camoufler son adresse IP derrière celle d’un serveur mandataire remet le contrôle ầ un tiers qui ne mérite pas nécessairement notre confiance, effacer la journalisation du navigateur ne concerne que les traces locales et selon une méthode insuffisante, la suppression des données étant “logiques” et non “physiques”.

Crédits common.wikimedia
Internet: confidentiel autant qu’une carte-postale…

En mettant de côté, pour le moment, les traces locales, il serait peut-être utile de dresser un aperçu général de cette question importante pour la préservation de la vie privée.

a) Les étapes normales d’une connexion Internet vers un site Web

La meilleure façon d’aborder le problème est de suivre les traces laissées à partir du moment où une adresse web, un URL, est saisie dans le champ d’adresse du navigateur…

  • Un URL (Uniform Ressource Locator) doit être associé à une adresse IP et la première étape  d’une connexion à un site est la requête DNS (encapsulée dans le protocole de transport UDP) et permettant de traduire l’URL dans son adresse adresse IP correspondante: cette traduction est assurée par un serveur DNS, en général celui du FAI, qui, on s’en doute un peu, peut conserver dans ses journaux la trace de cette requête.

Il est bien connu d’ailleurs que les principaux FAI conservent ces traces mais il est difficile de savoir pour combien de temps, quelle protection est assurée à ces informations et l’usage qu’ils en font ou pas…

Commissariat à la vie privée du Canada – Inspection approfondie des paquets

  • Une fois cette adresse IP associée à l’URL, la connexion peut alors s’enclencher via le protocole TCP pour accéder au site mais cette connexion n’est jamais directe contrairement à ce que les apparences pourraient le laisser croire. La connexion passe par une série d’intermédiaires incluant les serveurs et routeurs du FAI mais ne s’y limitant jamais. Il est possible d’avoir un aperçu (pas toujours exact) avec un utilitaire de “Trace Route ” qui montre à qui en doute que le chemin le plus direct vers un site n’est pas celui qu’on croît…  Par exemple un chemin de connexion entre mon ordinateur et le serveur de WordPress (variable pour chaque connexion):

Traceroute-01-2009-06-08_153351

  • Une fois que la connexion entre le PC et le site est établie tous les échanges entre ceux-ci via les routeurs intermédiaires sont EN CLAIR, c’est-à-dire, lisibles par n’importe lequel de ces intermédiaires sur la “route de connexion “…  Dans le cas par exemple du protocole Pop3 (Post Office Protocol v. 3), l’identifiant, le Mot de Passe (oui!) et le contenu du courriel sont transmis en clair. Le chiffrement d’une connexion ne se produit en général qu’avec le protocole Https [RFC  2817 - 2818] par exemple lors d’un paiement en ligne, connexion chiffrée sur 128 bits ou + et avec les implantations sécurisées de protocoles courants tels que par exemple:

……….Pop3S : port 995 en remplacement de Pop3  port 25
……….Smtp Tlsport 587 en remplacement de Smtp port 110
……….Nntp Ssl : port 563 en remplacement de Nntp port 119
……….Ldap Ssl : port 636 en remplacement de Ldap port 389
……….Ftp Sslports 989-990 en remplacement de Ftp ports 20-21
……….Imap Ssl : port 993 en remplacement de Imap port 143
……….Irc Ssl : port 6697 en remplacement des ports 6667 à 6669

………..etc.

  • Enfin, le site web sur lequel le PC est connecté peut lui aussi conserver des traces de cette connexion et peut récupérer des informations de configurations normales mais aussi d’autres informations telle que le referer et parfois beaucoup plus en utilisant des programmes exécutables du Web tels que les activeX (MSIE) , du Javascript, du Java, des Local Shared Objects, ou récupérant des informations de “cookies traceurs“…
  • Notez que les exécutables en question sont d’abord téléchargés par le navigateur et exécutés localement: sur votre ordinateur. Pour dire les choses le plus simplement possible, un navigateur fait trois chose: téléverser, télécharger et mettre en forme. Lors d’une connexion le navigateur transmet des informations sur sa configuration de même que certaines informations telles que le referer, id est, l’adresse IP du site d’où vous arrivez. Il télécharge une copie du contenu du site web: texte, html, images et aussi les exécutables tel que des commandes en Javascript. Enfin il donne un rendu graphique à l’ensemble. Les ActiveX de MS I.E. sous Windows et le javascript dans les autres cas, peuvent et servent effectivement, de vecteurs à des parasites divers tels que les virus et spywares. Vous pouvez facilement vérifier ce que votre navigateur “upload” en utilisant les tests Browser Spy d’Henrik Gemal

Capture-PacketSniff-01-2009-06-08_143643

C’est d’ailleurs au moyen de l’Inspection Approfondie des Paquets que les soi-disant Grand Pare-feu mis en place par le gouvernement chinois réussit à filtrer puis à bloquer le libre accès à Internet contrevenant au principe de la Neutralité des Réseaux (ceci sera l’objet d’un prochain article).

Des chercheurs de l’Université de Cambridge, U.K.: Richard Clayton, Steven J. Murdoch, et Robert N.M.Watson ont découvert comment passer outre à la censure d’internet par les autorités chinoises en étudiant le près les méthodes utilisée au niveau du protocole TCP-IP.

Ils expliquent que le soi-disant Grand Pare-feu de Chine fonctionne en grande partie en inspectant les paquets TCP pour repérer les mots-clés devant être bloqués. Si le mot-clé est présent alors un paquet TCP de réinitialisation (paquet TCP avec le flag RST) est retourné aux points d’origine et de destination de la connexion fermant ainsi la connexion. Toutefois le paquet original est passé sans modifications et si les points de connexion ignorent les paquets de réinitialisation provenant du filtre des censeurs, la connexion se poursuit sans problème. Une fois qu’une connexion a été bloquée le filtre des censeurs fait d’autres tentatives contournables pour bloquer la suite les tentatives de connexions des points d’origine et de destination. Cette dernière méthode peut alors causer une attaque en déni de service envers les points de connexion.

Les auteurs expliquent qu’ils ont d’abord accédés à une simple page web normalement comme ils s’y attendaient. Comme il peut être constaté avec la transcription du vidage de paquets montré ici, après la poignée de main en trois étapes normales (SYN, SYN/ACK, ACK) le client utilisant dans l’exemple le port 53382, envoie une commande HTTP GET au port HTTP 80 du serveur pour obtenir le dossier racine (/) qui est transféré normalement:

  1. cambridge (53382) -> chine (http) [SYN]
  2. chine (http) -> cambridge (53382) [SYN, ACK]
  3. cambridge (53382) -> chine (http) GET / HTTP/1.0<cr><lf> etc.
  4. chine (http) -> cambridge (53382) … Etc.
  5. cambridge (53382) -> chine (http) [ACK] et ainsi de suite…

Par contre quand ils ont envoyé une requête incluant un petit fragment de texte (falun) dont ils avaient prévus le blocage la confirmation de leur hypothèse s’est rapidement produite:

  1. cambridge (54190) -> chine (http) [SYN]
  2. chine (http) -> cambridge (54190) [SYN, ACK] TTL=39
  3. cambridge (54190) -> chine (http) [ACK]
  4. cambridge (54190) -> chine (http) GET /?falun HTTP 1.0<cr><lf>…
  5. chine (http) -> cambridge (54190) RST TTL=47, seq=1, ack=1
  6. chine (http) -> cambridge (54190) RST TTL=47, seq=1461, ack=1
  7. chine (http) -> cambridge (54190) RST TTL=47, seq=4381, ack=1
  8. Etc.

L’étude “Ignoring the Great Firewall of China” est disponible au complet en format PDF:

Adobe-icône-web

Prises indépendamment les unes des autres, ces informations laissées en traces ici ou là ne sont pas en elles-mêmes des atteintes à la vie privée mais permettent le “Data Mining” c’est-à-dire, le recoupage d’information qui permettent de monter un profil identifié et associé à telle ou telles adresse IP (la vôtre) et en dernière analyse à une personne bien précise: l’internaute “X”.

De plus il est bon de savoir qu’un site web même supprimé laisse encore des traces (dont les vôtres possiblement) car Internet ne perd pas la mémoire: le Wayback Machine est là pour en témoigner.

En somme, le niveau de confidentialité normal sur Internet est en quelque sorte l’équivalent de la transmission du courrier avec une carte-postale et ne devrait par conséquent être utilisé que pour des informations aussi peu confidentielles que celles que nous avons l’habitude d’envoyer avec celles-ci.

Il est facile de tomber à ce propos dans une sorte de paranoïa, celle des “paranautes© climenole et d’oublier que la possibilité de lire en clair ces communications ne signifie pas nécessairement qu’elles soient filtrées et lues ni que la vie privée des internautes est actuellement sous surveillance. Le sens commun nous préserve de ces exagérations sans toutefois nous empêcher d’utiliser d’autres méthodes lorsqu’il s’agit de données confidentielles, personnelles ou commerciales.

Dans le prochain article de cette série nous verrons les moyens à notre disposition pour préserver la privauté des données et des communications sur Internet: chiffrement des données locales, des courriels et des connexions Internet.

À bientôt.  :)

Rss-web-iconFeedBurner-icône-webFriendFeed-web-iconTwitter-web-iconProfil & Contact

Rédigé par Claude LaFrenière

2009/07/19 à 12:47