«Le mot Big data a été kidnappé par le marketing» Fabrice Epelboin
Frenchweb : Le terme « Big data » est utilisé partout. Que signifie-t-il? Et, au contraire, que ne signifie-t-il pas?
Fabrice Epelboin : L’ère du Big Data représente un changement d’ordre de grandeur dans la quantité et la variété des données qui font l’objet d’un traitement informatique. Cela représente également un changement des outils utilisés pour faire ce traitement. Le modèle des bases de données qui prévalait jusqu’ici n’est plus adapté, et laisse la place à d’autres approches comme le célèbre hadoop. Bien sûr, la Big Data va avec l’accroissement considérable des capacités de stockage qui font qu’on garde désormais tout ce qui pourrait faire l’objet d’un traitement par de la big data, notamment les données et les traces personnelles laissées un peu partout par les internautes, dont les publicitaires sont friands.
L’analyse de cette Big Data est censée apporter une aide à la décision, voir de l’automatiser. On retombe comme souvent dans la dichotomie d’une approche homme/machine versus une approche purement algorithmique, ce qui pour le coup n’est pas nouveau. Cette dualité est une grande constate dans l’informatique. Mais avec la big data, on va trouver de plus en plus de décideurs face à la machine; des décideurs qui n’auront pas la moindre idée de la façon dont fonctionne la machine, ce qui n’est pas sans poser un certain nombre de question, notamment sur le rôle politique insidieux du technicien.
Enfin, il faut souligner que le coût de traitement de ces données, autrefois prohibitif, est en chute libre. Analyser dans le but d’en tirer de la valeur, une quantité énorme de données n’est plus réservé à des sociétés capables de mettre en place des projets lourdement financés; c’est à la portée de la première start-up venue, pour peu qu’elle dispose de données ou qu’elle sache les collecter. Ce dernier point qui semble à première vue anodin ou attendu a des conséquences importantes : le capital ne constitue pas une barrière à l’entrée de la big data. Tout le monde ou presque peut en faire, même si, comme se plaisent à le répéter les spécialistes,
la Big Data s’apparente au sexe chez les adolescents : tout le monde en parle, tout le monde prétend en faire, mais en réalité…
Ce mot est-il un buzzword utilisé à tort et à travers ?
Comme de nombreux mots issus des technologies cette dernière décennie, il a été kidnappé par le marketing (mais pas que), et son sens s’en est trouvé grandement altéré. A ce jour, on peut d’ores et déjà considérer que ce mot est moribond. Ce terme est devenu un fourre-tout destiné à donner une connotation «jeune et dynamique» à tout et n’importe quoi pour peu qu’il y ait de la technologie dedans. C’est un grand classique, le “Cloud” a connu le même destin sémantique, tout comme le “web social” avant lui.
Mais accuser le marketing de cet homicide sémantique, c’est tout de même aller un peu vite en besogne. Ce genre de mise à mort sémantique se produit quand une multitude d’experts, de journalistes et de néophytes se ruent sur un nouveau mot comme la misère sur le pauvre monde, cela dépasse de loin le marketing. On pourrait tout aussi bien accuser «les réseaux sociaux», qui sont, bien plus que le marketing, un coupable tout désigné bien plus à la mode de nos jours. La vérité est que ce genre de tour de passe-passe sémantique à des fin plus ou moins marketing est un grand classique. Le mot “République”, dont peu de monde au final ne connait la réelle définition (la gestion du bien commun et des pouvoirs régaliens), fait aujourd’hui l’objet d’assauts sémantiques répétés de la part de la classe politique dans son ensemble, au point d’avoir carrément été séquestré par l’UMP qui en a fait une marque déposée.
La réalité c’est que toute disruption fait peur, que le Big Data représente une forme de disruption importante, bien au delà du champ technologique, et que s’accaparer ainsi un mot, et le “diluer” sémantiquement, en quelque sorte, est aussi une façon de se familiariser et d’en ôter l’aspect anxiogène.
Le Big Data n’en est pas moins la partie émergée d’une disruption profonde, avec des conséquences à venir aussi bien sur nos systèmes de gouvernances politiques, notre système de santé, ou le social en général : tout cela va être profondément modifié du simple fait de l’apparition de la big data.
Quels sont les secteurs ou les entreprises qui en font le meilleur usage, et ceux qui en font juste du marketing ?
Le marketing peut être une fin tout ce qu’il y a de plus efficace pour le Big Data, Google en sait quelque chose. Mais c’est en effet en dehors du marketing qu’on va trouver les usages les plus disruptifs – de là a dire que ces usages sont bons, il va falloir patienter quelque peu et prendre du recul. Ce qui est certain, c’est que ces usages ne sont pas encadrés, et qu’ils sont, pour beaucoup, dans les labos des services de renseignement ou ceux de leurs sous-traitants.
La surveillance de masse, tout comme Google, est un très grand collecteur d’informations, mais contrairement à Google, les informations collectés par les différents systèmes de surveillance sont très disparates. Sur un individu, un État peut aujourd’hui facilement collecter tant ses données bancaires, sa géolocalisation au fil du temps, le détail de ses courses pour peu qu’il paient avec un moyen de paiement électronique, l’ensemble de ses communications, et donc son social graph au sens large, ses données médicales, etc. Des tas de données disparates qui doivent, pour faire sens, passer par des algorithmes qu’on imagine bien plus perfectionnés encore que ceux de Google.
Les usages qu’on peut attendre de tout cela sont très variés. Lors du vote sur la Loi Renseignement, un amendement, proposé puis retiré par le gouvernement face au tollé des réseaux sociaux, envisageait de placer sous écoute l’ensemble des communications ainsi que la géolocalisation des chômeurs afin de lutter contre la fraude. C’est un usage, parmi d’autres, de la Big Data, pas forcément très enthousiasmant, mais très certainement efficace. Récemment, le Canard Enchainé faisait état d’une société française, très portée sur la big data, qui sur la base – entre autres – de fichiers ethniques extrapolés à partir des lieux de naissance trouvés sur les fichiers électoraux (qui sont accessibles à tous), propose aux politiques des outils cartographiques destinés à les assister dans la gestion du territoire dont ils ont la charge.
Comment de tels outils évolueront demain ? C’est très difficile à anticiper, et cela dépend bien sûr de la volonté politique qui est derrière, mais également du monde des technologies.
Enfin, il ne faut pas oublier l’un des saint Graal de la Big Data qui est le prédictif, c’est-à-dire la capacité à prévoir, à partir d’un relevé détaillé de l’état présent, ce que sera l’avenir. On peut ainsi imaginer prédire quel sera votre état de santé demain : une information qui peut s’avérer un fantastique progrès pour la société si elle est dans les main d’un organisme gérant la santé publique, ou qui peut être synonyme de grandes inégalités, si ce sont les compagnies d’assurance qui s’en emparent. Le prédictif changera complètement tant la façon de gérer la santé public que l’ordre public, mais également la gestion de la cité dans son ensemble et la démocratie en général.
Si l’on gouvernait, hier encore, sur la base d’incessants sondages d’opinion, la photographie que l’on pourrait faire de l’opinion avec de la Big Data et du prédictif devrait changer de façon radicale l’idée même de démocratie et l’exercice du pouvoir.
Crédit photo: Fotolia, banque d’images, vecteurs et videos libres de droits
- Ask A VC : comment modéliser un compte de résultat — Partie 6/6 : analyse de sensitivité - 21/05/2024
- Ask A VC : comment modéliser un compte de résultat — Partie 3/6 : les Coûts Fixes - 16/01/2024
- Question à un VC : Pourquoi les marges unitaires sont-elles si importantes pour votre modèle d’affaires? - 13/11/2023
Fort bien, mais au fait, on dit « le big data » ou « la big data »? L’article n’est pas clair sur ce sujet (« …du big data… », « …la big data… »)
En pratique, on devrait dire « mégadonnées », voire « grosses données », à en croire le JO (reco DGLFLFdu 22 août 2014). Big Data du coup, est un anglicisme, et on l’accorde comme on veut. Tant qu’à être dans le péché, autant en profiter.