PROJET AUTOBLOG


Reflets

Site original : Reflets

⇐ retour index

WordPress 4.2 : Tor Browser’s and Canvas privacy warning prompt

dimanche 26 avril 2015 à 13:02

tor-browser-bundle_w_500The Tor Browser is known to be used by activists, journalists, and people who need a high level of privacy while they’re surfing.
Every possible way to track people on Internet are a serious concern for the Tor developers because anonymization doesn’t support approximation and leads to take decisions that could seem « over-paranoid » to others developpers communities.

Description

In previous WordPress versions (prior to 4.2) Gravatar was already known to be detected as tracker by some tools like Ghostery. But with gravatars disabled, only logged in users get the warning due to the admin bar.
4.2 update on wp-includes/formatting.php introduced a new way to check if emoji are enabled or not, injecting in wp-head an emoji detection script using canvas.


window._wpemojiSettings = {"baseUrl":"https:\/\/s.w.org\/images\/core\/emoji\/72x72\/","ext":".png","source":{"concatemoji":"https:\/\/mywebstite.com\/wp-includes\/js\/wp-emoji-release.min.js?ver=4.2"}};
!function(a,b,c){function d(a){var c=b.createElement("canvas"),d=c.getContext&&c.getContext("2d");return d&&d.fillText?(d.textBaseline="top",d.font="600 32px Arial","flag"===a?(d.fillText(String.fromCharCode(55356,56812,55356,56807),0,0),c.toDataURL().length>3e3):(d.fillText(String.fromCharCode(55357,56835),0,0),0!==d.getImageData(16,16,1,1).data[0])):!1}function e(a){var c=b.createElement("script");c.src=a,c.type="text/javascript",b.getElementsByTagName("head")[0].appendChild(c)}var f;c.supports={simple:d("simple"),flag:d("flag")},c.supports.simple&&c.supports.flag||(f=c.source||{},f.concatemoji?e(f.concatemoji):f.wpemoji&&f.twemoji&&(e(f.twemoji),e(f.wpemoji)))}(window,document,window._wpemojiSettings);

This new addition, even with emoji disabled, and logged off, leads the Tor Browser to print the following warning message

Tor-Warning

WordPress owners running a website with high privacy concerns cannot let the highly trustable Tor browser giving an alert prompt to each reader about a possible privacy issue on their website. The ability to let Tor Browser users allow or block canvas hash decoding fearing a malicious use has been discussed here and here and appears in Tor Reference documentation as a fingerprinting threat.

« We display the warning if websites attempt to render image data and then silently extract it, because this is a major, high-entropy, highly stable fingerprinting vector. »

« After plugins and plugin-provided information, we believe that the HTML5 Canvas is the single largest fingerprinting threat browsers face today. Initial studies show that the Canvas can provide an easy-access fingerprinting target: The adversary simply renders WebGL, font, and named color data to a Canvas element, extracts the image buffer, and computes a hash of that image data. Subtle differences in the video card, font packs, and even font and graphics library versions allow the adversary to produce a stable, simple, high-entropy fingerprint of a computer. In fact, the hash of the rendered image can be used almost identically to a tracking cookie by the web server. »

Even if this not a security issue with WordPress, i guess the WordPress community should reconsider the use and implementation of this feature which is not critically useful for most of us, considering trust and privacy are useful an critical for vulnerable people who use Tor to protect themselves.

How to disable ?

If you want to disable this feature to avoid this useless warning on a clean / no tracking website, you have 2 solutions :

remove_action( 'wp_head', 'print_emoji_detection_script', 7 );

We hope the WordPress team will consider this issue. Even if it’s not related to security, it’s related to trust, the trust between : over-paranoid people who sometimes have good reasons to be such paranoid and website owners who try to run a state of the art WordPress for privacy, just like it should be out of the box.

Thanks to @recifs, @ScreenFeedFr & Yoshi for alerting us and helping us to fix.

Avertissement de confidentialité sur WordPress 4.2

samedi 25 avril 2015 à 14:44

canvasNous avons été alertés ce matin d’une incongruité sur reflets.info. Celle ci concerne une extension du Tor Browser, signalant un problème de confidentialité que nous avons pris au sérieux. Nous avons donc temporairement fermé Reflets, le temps pour nous d’essayer de comprendre d’où ceci pouvait venir.

Après de multiples vérifications, nous en sommes venus à confirmer sur un sujet des forums de WordPress que ceci était fort probablement lié à la dernière mise à jour de wordpress 4.2. Nous avons un doute sur l’intégration de petits gadgets, inutiles à la publication (gravatars et Emoji), qui peut conduire votre navigateur à fournir à au serveur web le moyen d’identifier votre navigateur de manière unique à des fins de tracking.

Confiant en la politique globale de WordPress en matière de confidentialité, nous ne doutons pas que ceci sera prochainement réglé. En attendant, pour une confidentialité accrue, nous vous invitons à utiliser une version à jour de Tor Bundle pour bloquer la requête faite à votre navigateur.

En vous priant de bien vouloir nous excuser pour ce désagrément.

Merci à @recifs et Yoshi de nous avoir remonté ce problème.

/b

Cybereugénisme : détection comportementale sur les réseaux… ne voyez-vous rien venir à l’Horizon ?

vendredi 24 avril 2015 à 19:37
Un cluster de boites noires Made In France de nos amis du @LaboMedia

Un cluster de boites noires Made in France de nos amis du @LaboMedia

Le Monde publiait dernièrement un article sur Predpol, si l’information est intéressante à rappeler, elle n’est pas récente et Predpol lui même n’est pas le nec plus ultra en matière de surveillance prédictive. La prédiction de la criminalité sur les réseaux n’est pas nouvelle nous avions il y a quelques années déjà eu vent d’ Indect (projet de recherche porté par la communauté européenne visant à détecter et prévenir les comportements criminels et le terrorisme). Et un troisième, mais nous y reviendrons plus tard…

Il est donc temps pour nous d’aborder ce pan méconnu de la surveillance basée sur des statistiques, que nous abordions par ailleurs déjà en 2010 sans que cela n’émoustille grand monde et que nous définissions de cette manière :

Le calcul stochastique est une approche de calcul probabiliste datant des années 50. Ses applications aux réseaux sont elles, très contemporaines. On déduira des diverses choses trouvées sur le Net que la SPI est donc une approche probabiliste d’inspection de paquets visant à en déterminer sa nature et à appliquer des règles en fonction de l’observation de ce qui transite sur le réseau. 

 

Nous parlions donc de Stochastic Packet Inspection, une inspection des paquets IP basée sur une approche probabiliste. L’approche probabiliste appliquée aux réseaux présente l’avantage de recentrer la surveillance active sur les signaux faibles en partant d’une interception, elle, bien massive… sinon, comme le rappelait Andréa Fradin dans cet excellent article … ça ne fonctionne pas de manière optimale. Mais de quoi parle t-on quand on parle d’écoute massive ? C’est là qu’il y a souvent une confusion entre le mot lui même et ce que la pratique, en environnement de production, permet de faire. La NSA s’est dotée des systèmes de renseignement d’origine électromagnétique les plus gargantuesques, aspirant tout et n’importe quoi et nécessitant des traitements que la France n’aurait pas les moyens de s’offrir. Les révélations d’Edward Snowden ont permis une certaine prise de conscience générale sur les dommages collatéraux en terme de libertés publiques. Mais, Snowden ou pas, la réelle menace terroriste planant sur certaines nations, dont la France, conduit de nombreuses entreprises privées, la recherche publique, et les autorités, à repenser une surveillance plus efficace.

L’épisode (en plusieurs parties) qui va suivre nous rappelle vaguement une vieille connaissance de Reflets, c’est l’histoire de ce qui n’est pour l’instant qu’un projet de recherche universitaire, directement interconnecté à un besoin à des fins de renseignement et de surveillance, pour prévenir la criminalité. La surveillance algorithmique des populations, afin de détecter et de prévenir des comportements criminels a t-elle un avenir en France ? On peut le craindre. Car pour rendre un algorithme intelligent, il faut l’alimenter avec un maximum d’informations, pour lui permettre d’apprendre. Les statistiques ne sont fiables que si les échantillons sont ultras représentatifs, et plus on a de données, plus ils sont représentatifs… et plus la prédiction a des chances d’être efficace. Il y a bien au moins un projet en ce sens à l’étude en France, réunissant des acteurs assez sérieux pour qu’il prenne forme un jour.

De la même façon que le marketing prédictif ou les algorithmes de high frequency trading sont boulimiques d’informations, la surveillance des personnes à des fins de prévention des crimes et délits seront naturellement d’énormes consommateurs de métadonnées, métadonnées qui vous renseignent souvent bien plus que les contenus des correspondances sur les activités d’une personne.

Et heu .. au fait, ça fonctionne comment votre truc niveau libertés publiques tout ça ? Et bien les libertés publiques dans tout ça, c’est pas folichon. Bernard Cazeneuve a beau répéter que « non on ne viole pas les communications, on intercepte que des métadonnées  », si les « algorithmes » correspondent à une approche probabiliste « (open)data centric », les informations dont nous disposons aujourd’hui nous laissent distinctement entrevoir une utilisation de ces métadonnées qui fait froid dans le dos. Si Predpol ne nous transporte pas encore dans l’ère « Minority Report  », la loi sur le renseignement, les boites noires qui nous font tant fantasmer et les algorithmes probabilistes à des fins de détection comportementale sur les réseaux pourrait bien tout droit nous y conduire. Cette orientation ne peut pousser qu’à faire du massif, toujours plus massif, pour rendre un algorithme plus efficace, plus intelligent, plus intrusif. Nous ne serions même plus dans de la « surveillance de masse  », mais dans le cybereugénisme. Du délit de sale gueule au délit de sales métadonnées, il n’y a désormais qu’un pas, et il pointe à l’Horizon.

Plus que jamais, nous ne pouvons que réaffirmer le besoin d’ouvrir une vaste concertation sur ce qui n’est plus qu’un problème uniquement lié à la sécurité des personnes, mais un choix de société sur le long terme, que d’autres pays suivront une fois la boite de Pandore ouverte. Oui nous sommes menacés, mais ceci ne doit pas être le prétexte à faire peser sur nos démocraties des menaces encore plus lourdes. Le renseignement a probablement besoin de plus de retenue de la part des politiques, de plus de moyens humains, d’outils techniques et légaux adaptés à la problématique précise du terrorisme et qui ne risquent pas un jour de se retrouver à réguler l’ensemble de nos sociétés comme ils régulent déjà artificiellement les marchés financiers.

Agent de double-langage

mercredi 22 avril 2015 à 21:01

Dans le projet de loi sur le renseignement, deux points – au moins – posent question : pour chacun d’eux le gouvernement affirme l’inverse de ce que tous les experts dénoncent.

Pour le gouvernement – qui l’a répété à de nombreuses reprises – « il n’y aura pas ni DPI ni boîtes noires » (terme pourtant proposé par des conseillers de Matignon eux-mêmes lors de la présentation du texte à la presse, le 17 mars dernier).

Pour les spécialistes, cette affirmation sonne faux, puisque dans le même temps les services précisent ne vouloir accéder qu’aux métadonnées correspondant aux cibles que leur fameux « algorithme » aura définies.

Or de deux choses l’une: soit les services auront un accès direct aux données stockées par les fournisseurs de services (hébergeurs, serveurs de mail, moteurs de recherche…) français – exactement comme dans le programme PRISM de la NSA, qui fut à l’origine du scandale révélé par E. Snowden – soit il devra placer des sondes « boîtes noires » à des points stratégiques du réseau pour extraire du flux de toutes les données échangées celles qui l’intéresse. Ce qui ne peut se faire sans DPI.

 

We don’t need no DPI

On peut – sans prendre beaucoup de risque – supposer que le processus décrit par Octave Klaba (OVH) après la réunionprism-slide-6 entre hébergeurs et gouvernement correspond trait pour trait à la première option: contraints par le pouvoir en place, les hébergeurs devront fournir à la demande toutes les métadonnées en leur possession aux équivalents hexagonaux des DITUs du schéma ci-contre.

Pas besoin de faire du DPI quand on a un accès direct aux données émises ou reçues aux extrémités: le boulot a déjà été fait par la couche IP de l’hébergeur.

Du coup, « pas de DPI » ? Ce n’est pas si clair.

D’après les promesses du gouvernement (retranscrites dans le schéma ci-contre fait par Gandi), les données fournies par les hébergeurs se limiteront aux seuls infographie_loi_renseignement_gandi_v5services visés dans l’autorisation de l’exécutif: il n’y aura pas de surveillance générale de tous les sites hébergés. On en déduira que, forcément, l’information qui permet de sélectionner tel ou tel service, telle ou telle boîte email, viendra d’ailleurs: s’il y a « boîte noire » et « détection de signal faible », ça ne peut pas se faire en bout de chaîne, ni sur des services précisément définis. On n’est plus, là, dans la détection: on est dans la surveillance d’une cible déjà identifiée.

C’est déjà grave: c’est exactement ce que fait le programme PRISM, rappellons-le, le tout sans la moindre autorisation judiciaire.

Mais d’où viendront donc les renseignements permettant ce ciblage ?

 

Another brick in the net

Soyons clairs : meme si les hébergeurs partaient de France, comme ils ont menacé de le faire, le probleme resterait entier. Pourquoi ? Simplement parce que nous parlons d’écoute du réseau lui-même, et donc du rôle central des fournisseurs d’accès (FAI), qui sont eux aussi concernés par la loi.

Chez eux, point de métadonnées déjà décodées: ils ne sont pas en bout de chaîne, ce sont de simples tuyaux par lesquels passent tous nos petits paquets IP pas encore remis dans l’ordre. Les métadonnées sont quelque part dedans, mais éparpillées «façon puzzle», parfois chiffrées, souvent pas, en désordre complet. Impossible pour les fournisseurs d’accès de ne fournir « que les métadonnées » dont ils disposent: il n’en disposent pas.

Sauf si… Après tout, la promesse de ne pas « tout surveiller » et de ne recueillir « que les métadonnées », pour ce qu’elle vaut (rien n’a été inscrit dans la loi, tout se passera donc dans ses décrets d’application, modifiables à tout instant par d’autres décrets comme Gandi le remarque), cette promesse, donc, le gouvernement ne l’a faite qu’aux hébergeurs. Pas aux FAI.

Un FAI, par définition, ça ne peut pas s’expatrier, et ça dépend du pouvoir pour – notamment – l’attribution des fréquences de téléphonie portable: un FAI, ça ferme sa gueule ou ça démi ferme tout court.

Pour qu’un « algorithme de détection de signal faible » soit un tant soit peu efficace (mouahaha), il faut qu’il traite tout le tas de données disponibles en vrac pour essayer d’en extraire quelque chose d’intelligible. Et pour le faire, il faut du DPI.

Il est probable, si on veut croire (re-mouahaha) les promesses du gouvernement, que seul un équivalent de PRISM soit imposé aux hébergeurs.

Tout comme il est quasi-certain que, côté FAI, on conservera boîte-noire, algorithme, et surveillance de masse. Et, que vos serveurs soient ou non hébergés en France, vous passerez toujours par votre FAI pour y acceder.

Et donc, quoi qu’en dise Bernard Cazeneuve (qui a sans doute un peu trop écouté les vendeurs de solutions de surveillance prêts à tout pour emporter le marché), on fera bien du DPI.

Ce qui nous amène au second point posant question: l’affirmation selon laquelle il n’y aura « pas de surveillance de masse ».

 

We don’t need no thought control

On est là, typiquement, dans une pure sémantique politicienne.

Pour n’importe quelle personne normale, dès lors que tous les échanges passent au travers de filtres gouvernementaux, il ne peut s’agir d’autre chose que de surveillance de masse, et ce quel que soit l’usage qui sera fait de ces filtres.

Pour un politicien qui veut défendre son bout de gras, cependant, c’est cet usage qui va définir si oui ou non on pèche « au chalut » ou « au harpon »: selon lui, du moment qu’il ne fait que regarder tout ce que nous faisons sans rien en faire (pour le moment) sauf si ça touche au terrorisme, alors il ne s’agit que de pèche au harpon.

Pur artifice de langage, qu’on peut traduire en français courant par « je regarde tout ce que tu fais, mais promis je te surveille pas ». Ou, pour rester dans la métaphore chalutière, « pour savoir où planter le harpon, il faut d’abord utiliser le sonar ».

Accessoirement se pose une question rigolote : un fonctionnaire qui découvre un crime ou un délit – même s’il n’a rien à voir avec le terrorisme – est tenu d’en informer les autorités judiciaires. Est-ce que l’algorithme du gouvernement est considéré comme un fonctionnaire ? Si oui, évitez de sortir des clous de quelque manière que ce soit, puisque vous serez poursuivis selon le bon-vouloir d’une machine, réglée par le gouvernement alors en place.

On peut – naïvement – imaginer que le gouvernement n’a pas les compétences techniques pour comprendre que son projet implique l’usage de DPI: après tout sa seule faute aura été dans ce cas d’avoir pris conseil auprès de commerçants (souvenez-vous de la vraie-fausse intervention de Bluecoat à l’Assemblée) plutôt qu’auprès de scientifiques.

Mais on peut être certain qu’en matière de double-langage, Bernard Cazeneuve n’a de conseil à recevoir de personne.

Et si on posait des boites noires à la Poste et chez les cybercommerçants ?

mercredi 22 avril 2015 à 21:00

bigbroNous vous en parlions sur Reflets en octobre 2013, une proposition de loi portée par le sénateur Richard Yung visant au renforcement de la lutte contre la contrefaçon est actuellement en train de faire son nid, totalement dans l’ombre de la loi de renseignement. Etrangement… Comme tous les coups tordus, elle fit l’objet d’une procédure accélérée pour être finalement adoptée fin février 2014. Aujourd’hui, c’est le moment de la douloureuse de tout épisode législatif, celui des décrets d’application.

Et quel moment plus opportun que celui où parallèlement à ces décrets, le parlement examine sur une loi de surveillance à l’origine destinée à la lutte contre le terrorisme, mais que le gouvernement a déjà élargi à :

Aucun rapport ?

Effectivement, à priori, une loi anti-contrefaçon n’a rien à voir avec une loi visant à prévenir le cyberterrorisme. Sauf que dans cyberterrorisme, il y a « cyber », et que « cyber », c’est un peu le mot idéal pour y coller tout et n’importe quoi. Le volet cyber de la loi sur le renseignement (et c’est une loi principalement orientée là dessus), a déjà intégré « Les intérêts économiques majeurs de la France » partant de là, il y a déjà une frontière relativement poreuse entre le volet terroriste et le volet des intérêts économiques. En suivant ce raisonnement, il suffira d’arguer qu’Internet est un nid d’évadés fiscaux et de contrefacteurs pour justifier une nouvelle extension de la surveillance d’Internet, cette fois-ci applicable à la contrefaçon et à l’évasion fiscale… pourquoi se priver alors qu’on peut faire coup double ?

Et si on mettait les boites noires de Bercy chez les cybercommerçants ?

Car c’est bien ça qui est en train de se jouer actuellement : permettre à l’administration de tracer tous les échanges commerciaux sur le net, tout comme le fait de tracer toutes communications. Maintenant que la rhétorique gouvernementale en matière de surveillance est bien rodée, il faut s’attendre au même discours que pour la loi de renseignement, à savoir :

« on ne vous flique pas, ce ne sont que des métadonnées« 

… Et ça tombe bien, car à l’échelle du commerce en ligne, les métadonnées, ce n’est pas ce qu’il manque, paniers, factures, contrats, bons de livraisons, l’administration serait devenue boulimique de données de transactions commerciales…. Ainsi, nos sources font état de demandes surréalistes de la part des douanes qui sont actuellement faites, portant sur un historique à 5 ans de toutes les données relatives aux transactions. L’enjeu qui se joue en ce moment est celui d’un accès direct aux systèmes d’information des cybercommerçants et des transporteurs, alors qu’il fallait jusque là que ces derniers transmettent ces données sur une période précise et raisonnable, sur un public ciblé.

Bougeons avec la Poste !

Si vos correspondances électroniques sont scrutées par l’administration, pourquoi votre courrier physique ne le serait t-il pas ? Nous le répétons souvent ici sur Reflets : tout ce qui est sur Internet finit un jour par en sortir, et ceci inclut évidemment les atteintes aux libertés fondamentales. Que votre correspondance soit électronique ou non, l’administration veut en garder trace. Ainsi, les transporteurs risquent de se voir contraints d’ouvrir leur système de tracking à l’administration… et attention, il risque d’être ouvert à la hache avec les prochains décrets d’application puisqu’ils devraient intégrer au moins deux points contre lesquels les professionnels du fret express, dont l’UFEX (Union Française de l’Express) s’élèvent :

  1. La possibilité des douanes de s’affranchir de l’information préalable du procureur de la République pour contrôler de façon inopinée des envois dans nos centres de distribution régionaux, alors que des contrôles douaniers sont déjà opérés dans nos centres de tri nationaux (article 12), et 
  2. La mise à disposition systématique des données dont les entreprises disposent (article 13), y compris lorsque celles-ci concernent les envois intra-communautaires (Les « expressistes » fournissent déjà des informations sur les envois intercontinentaux et contrôler l’intra-communautaire serait contraire au principe de libre circulation des marchandises). 

Se passer d’un juge, tracer tous les échanges, stocker 5 ans de métadonnées… ça ne vous rappelle rien ?