Avec l’article 1 du projet de Loi numérique, la France pourrait instaurer «l’open data» par défaut, c’est-à-dire l’«obligation de diffuser en ligne les principaux documents et données des organismes publics». Une bonne nouvelle, selon Gilles Babinet, le Digital champion de la France auprès de la commission européenne. «Il est juste dommage que cela ne concerne pas les collectivités territoriales», estime-t-il.
Si le secteur public a déjà pris des initiatives en matière d’ouverture des données, certaines organisations et certains secteurs font encore de la résistance. Gilles Babinet regrette par exemple que Pôle emploi n’ait pas créé une API pour permettre aux start-up d’utiliser ses données, notamment pour développer des solutions susceptibles de faciliter la recherche d’emploi.
Où en est la France en matière d’open data, notamment par rapport à ses voisins européens ? Quelles résistances existent et pourquoi ? Quelles doit être la frontière entre données publiques et vie privée ? Plus de détails avec Gilles Babinet, entrepreneur et Digital champion de la France auprès de la Commission européenne.
L'avis de Laurence Augoyard, CEO d’Altares, acteur de la data.
A la requête « Open data » Google ne répondait pour ainsi dire rien, il y a encore quelques temps. Depuis, la notion d’open data est sur tous les claviers. Elle s’est infiltrée dans les business plans des start up dont nous découvrirons les noms demain, elle s’est invitée dans tous les secteurs d’activités où les données occupent une place grandissante et s’est même assise à la table des discussions et des négociations de Bercy.
Face au nouvel eldorado que constitue la mise à disposition potentielle d’un volume considérable de données, gratuitement, l’heure est venue de remettre les pendules à l’heure. La prolifération des gisements de données qui alimente ce qu’il convient désormais d’appeler le nouvel or noir, masque une réalité tout autre.
Si l’analogie entre le pétrole et la data est particulièrement bien choisie, elle donne l’occasion de revenir à la réalité.
Comme le rappelait très justement Antony Scriffignano (Dun &Bradstreet Chief Data Scientist) dans l’un des épisodes d’Antony’s Web Serie, sur Be Data Blog, le pétrole est gratuit. Trouvez-du pétrole dans votre jardin, il est à vous, vous voilà riche. A la nuance près qu’entre le stade brut et l’état qui le rend commercialisable et utilisable, le pétrole passe par un grand nombre d’étapes :
- Prospection
- Forage
- Extraction : évaluation, récupération primaire, traitement des fluides, récupération secondaire, récupération tertiaire, gestion des ressources et des réserves…
- Distribution : transport (par oléoduc, par voies maritimes), stockage…
- Raffinage
- Conversion en produits : gaz léger, propane, butane, naphta, kérosène, gazoline…
- Distribution finale : pompes à essence
- Gestion de l’impact environnemental.
A l’état brut le pétrole ne vaut presque rien, tout comme la data. Open data ou non, accroissement du volume de données disponibles ou pas, hausse de la variété des données produites ou non, accélération de la vitesse d’apparition des données ou pas… c’est bien au niveau de la capacité des entreprises à bien exploiter leurs datas, que la guerre de la donnée se gagnera.
Il en ressort à la fois une similitude avec le pétrole et à la fois une différence de taille :
- Qu’elles appartiennent à l’une ou l’autre des grandes catégories qui les distinguent (données structurées, données non structurées, données maîtres, données opérationnelles, black data, social data, open data, big data, smart data, meta data… les données ne constitueront un facteur différenciant pour les entreprises et sur lesquels les métiers pourront s’appuyer, qu’à condition d’être passées, tout comme le pétrole, par un certain nombre d’étapes.
- A l’instar de l’industrie pétrolière dont chacun connait les étapes, devine ses coulisses en lisant entre les lignes de l’actualité géopolitique et consomme ses produits au quotidien (l’essence), la très ancienne industrie de la data est quant à elle plus discrète, moins médiatisée, plus complexe, plus sophistiquée, maîtrisée par un plus petit nombre d’acteurs historiques et entre seulement aujourd’hui dans une phase d’évangélisation de tous.
Pour ne trahir aucun secret, voici donc un florilège, soigneusement mélangé, de process, d’enjeux, de savoir-faire, de techniques, de problématiques clients, proprement data et dont les secrets nous appartiennent : organisation de la donnée, qualité, gouvernance, DMP, périmètre, crunching, modèle, structuration, labelisation, normalisation, deep learning, partage, sécurisation, data visualization, volumes, temporalité, invalid data, prévention du churn, fiabilisation, data scientist, life time value, duplicate data, traçabilité, vérification, master data management, conflicting data, consommation, data exploration, vision 360°, prédiction, IOT, data economy, standardisation, algorithme, data mining, segmentation, velocity, unynchronized data, analyse, score, data clustering, cohérence, digitalisation, data management platform, data driven marketing, machine learning, CRM inductif, signaux faibles, data driven marketing…
Derrière chacun de ces mots qui formeraient un beau nuage sémantique, se cachent de nouvelles opportunités de monétisation de la donnée des entreprises, que nous invitons à réfléchir dans sept directions :
- Prise de conscience de leur capital data
- Mise en place d’une gouvernance de leurs données
- Identification de fondamentaux : cohérence, sécurité, intégrité, accessibilité…
- Lancement de véritables programmes data
- Création de valeur
- Etablissement de la confiance dans le cadre de nouveaux modes de collaborations
- Construction d’un nouvel avantage compétitif
Après la noirceur du pétrole, depuis le fond des puits de forages, les sombres conflits qu’il attise, jusqu’aux vêtements couverts de noir de James Dean dans Giant, place à la mise en lumière de la data à travers le mouvement Be Data qu’il vous appartient de rejoindre.
[Contenu créé par la rédaction de FrenchWeb.fr et sponsorisé par Altares]
- GOOGLE refuse d’intégrer les vérifications de faits malgré une nouvelle loi européenne / META et Community Notes : un défi pour la content creator economy ? / ETORO vise une valorisation de 5 milliards de dollars pour son IPO - 17/01/2025
- Le suédois EasyPark absorbe Flowbird (ex parkeon) pour trouver la bonne place sur l’échiquier des solutions de mobilité urbaine - 17/01/2025
- Hyperline lève 9,4 millions d’euros pour administrer la facturation client des startups SaaS - 16/01/2025