Blockchain : la fin du Big data ?
Si la production des données numériques dans le monde a le vent en poupe, 90% de ces données ont été produites dans les deux dernières années, Facebook y est bien pour quelque chose. Le plus grand réseau social en ligne a récolté 300 petabytes de données personnelles depuis son commencement, cent fois la quantité que la Bibliothèque du Congrès a pu collecter en deux siècles !
Dans l’ère du big data, les données sont avidement rassemblées et analysées : les entreprises et les organisations les utilisent pour personnaliser des services, optimiser les processus de prise de décisions, prévoir des tendances futures et plus encore. Aujourd’hui, les données sont un actif de valeur de l’économie mondiale.
La préoccupation est croissante, concernant la vie privée des utilisateurs. Des grandes quantités d’informations personnelles parfois sensibles sont stockées sur les serveurs de grands groupes. Les individus ont peu ou pas de contrôle sur ces données et craignent de ne pas maîtriser jusqu’au bout la manière dont elles sont utilisées. Ces dernières années, les médias ont à plusieurs reprises couvert des incidents controversés liés à la vie privée. Parmi les exemples les mieux connus, il y a la surveillance gouvernementale et l’expérience scientifique à grande échelle de Facebook qui a été apparemment conduite sans explicitement informer les participants.
Les chercheurs ont développé des techniques diverses visant à sécuriser la vie privée et les données personnelles. L’arrivée du Bitcoin en 2009 et de la blockchain sous jacente a fourni aux chercheurs une plateforme naturellement orientée vers la protection des données. Par exemple, paradoxalement, alors que Facebook possède au nominatif la plus anodine des interventions sur sa plateforme, le Bitcoin se permet de bypasser même la règle NYC (Know Your Customer), un must en droit bancaire et financier.
On connaît l’adage : «Lorsqu’un service est gratuit sur le web, le client c’est vous.»
Prenons le cas d’une App Mobile quelconque. Elle souffre typiquement de trois failles dans la privacy :
- propriété des données. Très souvent en acceptant les termes de l’installation, les données deviennent par contrat une propriété de l’application.
- transparence des données et contrôle de l’utilisation qui en est faite. L’utilisateur perd la trace de ses données.
- contrôle d’accès détaillé. Au moment de l’installation, l’utilisateur doit accorder un ensemble de permissions à l’appli. On octroie ces permissions indéfiniment et la seule façon de les changer est de désinstaller en bloc l’application.
La même application mobile bâtie sur une blockchain aurait la même interface mais une politique d’accès/contrôle des données privées complètement différente.
- propriété des données. L’appli blockchain peut garantir que les utilisateurs possèdent et contrôlent à 100% leurs données personnelles. Le système peut reconnaître les utilisateurs comme les propriétaires des données et les services comme des invités avec des permissions déléguées.
- transparence des données et contrôle. Chaque utilisateur voit en toute transparence comment les données sont rassemblées et qui y a accès.
- contrôle d’accès détaillé. A tout moment l’utilisateur peut changer l’ensemble des permissions et révoquer l’accès aux données précédemment récoltées, même de manière rétroactive. Ceci en dynamique, sans désinstaller l’application.
Imaginons maintenant d’avoir une application Facebook-like sur blockchain. Elle nous permettrait :
- de posséder véritablement nos données
- de décider quel post, image, link nous voulons exposer dans le domaine public, visible à quiconque
- de limiter l’accès de nos contenus à certains amis exclusivement
- de savoir à vie qui a accès à nos données publiques et à quel moment.
Et pourtant, si on réfléchit un instant on comprend aisément qu’après tout, la philosophie de la blockchain est bien celle du traçage.
Les blockchains changent les règles du jeu : moins de centralisation, moins d’autorité, plus de partages. Il n’y a plus de données sensibles sur des serveurs centralisés mais on a forcément et toujours du traçage.
La question est donc : le traçage devient-il plus acceptable si le contrôle de la surveillance s’opère par les surveillés ? Alors que l’on sort à peine d’un débat passionné sur le droit à l’oubli, voici que la blockchain émerge appuyée sur un système qui ne peut fonctionner que dans la mesure où il n’oublie absolument rien.
Dans une blockchain, le recueil massif de données s’opère selon une suite logique strictement horodatée, un enchaînement des blocs qui reste indélébile à vie.
Pourquoi donc figer à vie des données dans une blockchain serait mieux pour la privacy que de les laisser sur un serveur propriétaire ?
Parce que dans une blockchain on peut protéger les données de l’utilisateur moyennant un développement software complexe mais faisable. Dans leur design actuel, les blockchains ne peuvent pas traiter du tout la privacy. A cause de leur nature publique, des données éventuellement privées passeraient en clair par chaque full node de le blockchain, entièrement exposées. En plus, les blockchains ne tolèrent pas de lourds calculs, ce qui réduit les nombre d’implémentations concevables.
Malgré ces obstacles, les chercheurs on déjà plusieurs idées sur la manière d’ajouter la privacy au sein d’une blockchain. Ces solutions visent à rendre n’importe quelle app aussi robuste que le Bitcoin. Le bitcoin existe depuis 2009 et en 6 ans, personne n’a jamais pu voler un millième d’euro alors que tout est public. Pour la même raison, il sera un jour impossible de lire un post/commentaire qui aurait été classé comme privé au moment du paramétrage.
Il faut mettre ici un bémol : on dit que le bitcoin n’est pas 100% anonyme. En effet, tant qu’on est connecté par exemple à Google avec un compte qui nous identifie, on laisse sans cesse des traces. Google peut lancer un algo de data mining sur notre profil et arriver à déduire notre identité Bitcoin en fonction des aller-retour qu’on fait vers des sites/portefeuilles Bitcoin.
Revenons donc à la question de l’article : est-ce que la blockchain a la possibilité de signer la fin du big data ? Rappelons d’abord que dans cet article nous parlons de données nominatives que le big data exploite pour classer les utilisateurs en catégories : clients potentiels, orientation politique, goûts, habitudes… et non pas de données anonymes comme ceux de certains capteurs IoT.
La réponse est oui, à condition dès que les chercheurs aient une solution assez stable et que les internautes adhèrent en masse aux prochaines applications blockchain-based.
Sachant que les identités sont de toute façon toujours protégées par clé privée, reste à savoir comment on stocke les données de l’utilisateur. Pour des raisons d’efficacité, certaines applications pourraient vouloir éviter la lourdeur du cryptage/décryptage.
Il faut distinguer deux cas de figure :
- les données sont en clair sur des serveurs centralisés et la blockchain garde juste des références. Dans ce cas, la blockchain garantit que les données ne seront jamais nominatives. Toutefois, les propriétaires des applis et des serveurs y auront toujours accès ainsi que, potentiellement, les pirates. Le big data sera donc toujours possible, de manière anonyme.
- les données sont cryptées, puis stockées, soit sur des serveurs centralisés, soit sur des systèmes comme IPFS, Swarm, Enigma… Dans ce cas, les données sont inatteignables et le big data inconcevable.
Dans le deuxième cas, il serait impossible d’accéder au contenu marqué partout comme privé. Tellement impossible que dans le cas de la blockchain c’est plutôt le problème inverse qui pourrait inquiéter : un groupe pédophile ou terroriste qui se cacherait derrière la blockchain serait inaccessible même par les plus hautes autorités de contrôle d’un Etat.
La privacy des données dans la blockchain est un point charnière de leur succès. Certes, aujourd’hui le développment pour privatiser les données d’une application style Ethereum est assez complexe (on en sais quelque chose…) mais des solutions clés-en-main vont sans doute arriver.
Vous pouvez par exemple jeter un coup d’oeil à ce projet du MIT.
Reste ensuite la question de la traçabilité : si dans 30 ans un ordinateur quantique permet de forcer les clés privées aujourd’hui inviolables, il sera possible d’accéder globalement au contenu pour lire rétroactivement l’historique de n’importe quel utilisateur.
David Teruzzi est consultant blockchain. Il est co-fondateur de Blockchain Conseil et blogeur sur Blockchain Café. Toujours dans la blockchain, il est developpeur affilié du projet Decred, une nouvelle monnaie s'inspirant du Bitcoin. En outre, il est également programmeur expert en mathématiques appliquées.
Article initialement publié sur Blockchain Café.
Crédit photo: Fotolia, banque d'images, vecteurs et videos libres de droits
- Ask A VC : comment modéliser un compte de résultat — Partie 6/6 : analyse de sensitivité - 21/05/2024
- Ask A VC : comment modéliser un compte de résultat — Partie 3/6 : les Coûts Fixes - 16/01/2024
- Question à un VC : Pourquoi les marges unitaires sont-elles si importantes pour votre modèle d’affaires? - 13/11/2023
L’adage tel que je le connaissais était plutôt « Lorsqu’un service est gratuit sur le web, le PRODUIT c’est vous. », ce qui fait plus sens je trouve :)