Recherche Big Data désespérément – saison 3

Publié par

Enfin ! Vous tenez entre les mains la saison 3 de votre série « Recherche Big Data désespérément ».

En 2016, le Big Data était une ligne de force technologique en délicatesse avec sa promesse en regard de la réalité. Mais dès la saison 2 en 2017, nous avions vu que le Big Data devenait moins conceptuel et plus concret dans son application. Nous avions relevé aussi les menaces de l’usage des données à tout-va.

L’originalité de cette saison 3 est d’avoir été réalisée par un collectif d’écriture dont les noms sont cités à la fin. J’en profite pour les remercier chaleureusement de leur engagement.

Retrouvons donc notre Big Data dans une saison où il sera question de données personnelles, de données anciennes, de données pour la connaissance, de données à penser, de données à visualiser, de données, de données… Bon là je m’emballe ! Le mieux est de laisser la place à cette nouvelle saison.

Bonne lecture à tous ! (Pour ceux qui veulent lire ou relire les saisons 1 et 2 c’est ici !!)

Episode 01 – La Data fait son cinéma

[Attention spoiler, il est conseillé d’être à jour de vos séries et films de science-fiction préférés avant de lire cet épisode !]

Amateurs de science-fiction, nous vous informons que vous n’avez plus besoin de regarder vos séries et films préférés sur Netflix, DVD ou VHS. Non, il vous suffit simplement d’allumer votre télévision, de lire vos journaux préférés ou de taper : « scandale Facebook/Cambridge Analytica » dans votre barre de recherche.

Au programme ce soir : un scandale sous fond de « faille de sécurité » ayant permis l’exploitation massive, sans consentement, de données de plusieurs millions d’utilisateurs dans le but d’influencer les votes et les comportements des citoyens.

Alors non, ce n’est pas un épisode de votre série préférée, un remake de Minority Report ou le prequel de Terminator. Tout cela est bel et bien réel. La Data, lorsqu’elle est bien exploitée, est indéniablement un véritable actif. Mais quand celle-ci tombe entre de mauvaises mains, elle peut devenir une arme d’influence massive à quiconque sait comment l’exploiter.

Mais pas de panique ! Face à ce fléau, la riposte s’organise petit à petit avec le RGPD en Europe ou le « California Consumer Privacy Act » en Californie. Un long chemin reste encore à parcourir afin que le Big Data ne serve pas de tremplin à l’émergence de potentiels Big Brothers…

Episode 02 – La Donnée personnelle star de 2018

En cette année 2018, MrConformité s’inquiète. Une star est née sous les projecteurs de la nouvelle règlementation RGPD : la Donnée personnelle. Et elle le menace avec son refrain qui inonde les ondes et résonne comme une scie dans sa tête RGPD = la date couperet du 25 mai 2018 = AÏE AÏE AÏE !

MrConformité décide de monter avec MmeMarketing une réunion sur la stratégie de communication à mettre en œuvre autour du RGPD.

MmeMarketing, plutôt bienveillante, passe en revue les obligations de la nouvelle réglementation : ce qui est déjà fait (beaucoup), ce qu’il reste à faire (peu), comment ne pas inquiéter les clients inutilement grâce à des messages pédagogiques et responsables… MrConformité reconnait qu’ils ont de la chance d’être dans une entreprise éthique dont le Métier est déjà très réglementé, « Quelle bonne nouvelle ! » s’exclame le nouveau DPO (Data Protection Officier) de l’entreprise qui conclut par un jeu de mot : « on pourrait traduire RGPD par Rassurer le Grand Prophète des Données ! ».

Le 25 mai 2018 a passé. La terre a continué de tourner. La Donnée personnelle va chercher à surfer le plus longtemps sur la vague de son succès mais elle sait que les projecteurs vont se tourner vers d’autres vedettes dans ce monde digital qui va si vite.

MrConformité de son côté s’investit sur son nouveau projet JAnticipeAFond qui conjugue Big Data et Intelligence Artificielle dans le seul but de satisfaire encore et toujours ses clients en anticipant leurs besoins… RGPD en tête, il sait dorénavant qu’il devra prendre un soin particulier avec les Données partagées par ses clients qui accepteront de dévoiler des facettes de leurs vies tant que l’objectif, dans leur intérêt, est de concevoir de meilleurs produits pour eux !

Episode 03 – Retour vers le futur ou la seconde vie de la donnée

La vieille Donnée gisait au fond d’un carton d’archives sur une feuille de papier ordinaire moisie par l’humidité. Avec ses copines, elle attendait dans l’obscurité d’une salle en sous-sol que la porte s’ouvre et qu’enfin on vienne la consulter.

Quelle fût sa surprise quand soudain un rai de lumière la fît sortir de sa torpeur. Des mains habiles plongèrent dans son cocon pour extraire délicatement les feuilles de papier et les placer dans …un scanner. En un flash, elle comprit qu’elle sera digitalisée. Finir dans des archives physiques ou électroniques, quelle différence ! Elle pourrait réapparaître au hasard d’une requête mal formulée, il faudra lire le document jusqu’à la page 9, ligne 84 sous le tableau de formules mathématiques pour enfin la retrouver. « Tu parles d’un monde meilleur ! » se dit-elle.

Mais c’était sans compter sur les traitements d’un nouveau type. Un jour qu’elle se faisait aspirée par un moteur puissant pressé de prendre la bonne décision, la vieille Donnée comprit qu’il existait encore une opportunité pour elle de sortir de l’oubli et de commencer une nouvelle vie. Sa connaissance du passé pouvait permettre de prédire le futur ! Mais attention à la moindre erreur elle savait qu’elle serait renvoyée aux oubliettes digitales.

Mais pour l’heure, la vieille Donnée a réussi à trouver un nouveau bain de jouvence qui s’appelle Data Lake. Le soleil brille. L’ambiance est festive. Des données de tous les âges et de tous les horizons, même les plus lointains, se mélangent pour former de beaux agrégats et créer de beaux modèles. Certaines données ont même l’originalité d’être non-structurées ! Sur les berges elle voit bien des baraques foraines aux couleurs chatoyantes et aux éclairages clinquants où clignotent en lettre d’OR « le Train fantôme de l’IA », « la montagne russe de l’usage des données personnelles » etc… mais ces tours de manèges elle se les réserve pour plus tard. Elle veut juste profiter de l’instant présent en buvant des mojitos avec ses vielles copines.

Episode 04 – Ne pas confondre Data Thinking avec Data Sinking

Beauté & Parfums souhaite valoriser ses données pour optimiser ses ventes. La société décide donc d’embaucher Alfred, système prédictif Big Data dernier cri.

Alfred jouit d’une aura fabuleuse. Il est très bien payé malgré son peu d’expérience. Son top management vante ses mérites sur les réseaux sociaux. Sa hiérarchie directe est fière de ses capacités « in-hu-maines ». Il devra plancher sur la résolution de problèmes complexes et ses collègues des autres départements le jalousent.

Oui mais voilà, rapidement, Alfred a le sentiment que ses brillantes capacités sont sous-exploitées. En effet, on lui confie tantôt des opérations mathématiques triviales dignes d’un calculateur commun, tantôt un amas de données accompagnées d’instructions douteuses. Le résultat qu’il produit est rarement pertinent aux yeux de sa cliente Déborah, responsable Marketing. Cette dernière n’hésite pas à le signaler à son Manager Florian, Data Scientist.

Alfred tente bien de prendre des initiatives… en vain : il n’a pas été conçu pour penser son cas d’usage. Il s’en confie à Florian mais ce dernier, sans connaitre le métier de parfumeur, ne sait pas le faire non plus à priori. Alfred et Florian se noient dans une marée de données sans vocations…

Florian décide alors de lancer des sessions de Data Thinking avec ses clients afin de plonger dans leurs problématiques réelles et d’identifier des leviers d’optimisation. Et miracle ! Les cas d’usage tant recherchés pleuvent ! Florian fait le tri et tout s’éclaire pour Alfred qui peut enfin produire de la connaissance et utiliser son imposant cerveau virtuel à des fins utiles.

Déborah est ravie car grâce au Data Thinking Beauté & Parfum a pu éviter le Data Sinking !!

Episode 05 – Du Big Data au Big Knowledge

La surabondance vertigineuse d’information digitale ouvre d’immenses perspectives.

A l’information digitale structurée, s’ajoute la part prépondérante de production de contenus digitaux en langage naturel, rejoignant la famille des données non structurées. L’information non structurée est de plus en plus exploitable par tous, parce qu’accessible techniquement.

La rupture technologique que nous vivons actuellement, tout en bouleversant des pans entiers de nos industries et bien au-delà, génère de tels volumes de données que se répand une interrogation : que faire de toutes ces informations ?

L’humanité a vécu des ruptures du même ordre. La diffusion des savoirs s’est accélérée grâce à l’imprimerie, faisant naître une et même plusieurs industries, précédant l’usage, comme de très nombreuses technologies d’aujourd’hui.

Le seul prisme des cas d’usage nous écarte des opportunités de transformation. Ne sachant que faire des informations en raison de leur somme considérable et voulant les rapprocher d’univers connus, ne sommes-nous pas en train de nous éloigner du savoir qu’elles contiennent, le connaissable ?

L’humanité repousse les limites du Big Data en s’inspirant de la technologie. Comment exploiter l’abondance d’information pour transformer profondément notre savoir ?

N’est-ce pas une aventure humaine, au cœur de laquelle, la multiplication des expériences conduira du Big Data au Big Knowledge ? Les versions des manuels scolaires n’ont pas fini d’être révisées !!

Episode 06 – Le concours de beauté de la Data

Les chiffres envahissent notre quotidien. Utopique de lire un journal ou de regarder un écran sans avoir le nombre de ceci, la quantité de cela, la progression de la courbe depuis la nuit des temps… Les Datawalls couvrent les murs des entreprises. Quasi impossible d’arriver dans un hall d’accueil sans voir ces écrans géants saturés de données pour promouvoir l’activité et surtout les performances de l’entreprise.

Nous cherchions un usage du Big Data. La nouvelle mode de la DataViz (pour Data Vizualisation) répond au besoin de présenter et visualiser la Donnée, équipée de ses plus beaux atours et fardée juste ce qu’il faut pour la rendre belle et agréable au plus grand nombre. Cette transformation, pour être réussie, impose de s’adresser aux populations non averties et de comprendre leurs visions, leurs préoccupations afin d’identifier la ou les bonnes informations à communiquer.

A l’heure du digital, la stratégie d’analyse de leurs données est un enjeu fondamental des organisations. Disposer d’un capital de données, internes et/ou exogènes, est certes un élément central mais dans quel objectif si ce n’est la restitution, le partage et l’exploitation des données afin que l’information soit claire et efficace vis-à-vis de chacun pour déterminer des leviers d’action.

La DataViz, cette nouvelle discipline qui apporte un éclairage neuf sur les données brutes, va donner un coup de vieux à nos tableaux croisés dynamiques, nos camemberts qui coulent et nos histogrammes tristes comme un jour de pluie. Elle démocratise l’accès à l’information. La DataViz fera demain bon ménage avec une autre discipline en devenir : la Data Storytelling. Mise en scène, la Data révèle alors tout son éclat.

Parce que vous le valez bien, laissez briller la Data qui est en vous!

Episode 07 – Les statistiques au secours de nos superstitions

Pendant la coupe du monde 2018 de football, la capture de données s’active sur tous les fronts pour nous donner les kilométrages parcourus par les joueurs, la vitesse de course de M’Bappé flashé à 37 Km/h, la courbe du ballon, etc… La technologie VAR pour l’arbitrage vidéo est aussi la mise en œuvre de technique de traitement de données. Le football serait-il enfin entré dans le club des grands sports modernes, comme le basket par exemple, gérés à coup de statistiques et de modèles ?

Pourtant à écouter en direct, pendant France-Argentine, un commentateur dire « Bixente, savez-vous qu’il y a trois raisons pour que la France gagne ce match 1.La France n’a jamais perdu avec Benjamin Pavard 2.La France n’a jamais perdu en phase finale quand elle a ouvert le score 3.La France n’a jamais perdu quand Antoine Griezmann marque ». Evidemment ces trois signes étaient réunis mais dire cela après 25 minutes de jeu peut quand même être vu comme une prière incantatoire où tous les gris-gris sont alignés sur l’autel pour que les dieux soient cléments.

Finalement, la France a effectivement gagné ce match, et plus tard la coupe du monde (yeah J) mais voilà bien un usage qui interpelle de la science de la Statistique dans le but de nous réconforter dans nos superstitions. Un jour viendra où la France perdra malgré ces trois conditions réunies. Ce sera l’occasion de remiser le maillot ridicule avec lequel vous regardiez les matchs parce que la France n’avait jamais perdu quand vous le portiez !

Episode 08 – La revanche de l’Informaticien sur le Data Scientist

Des années que les Experts recherchaient la règle métier idéale, ultime, parfaite, capable de bonifier le jugement humain et par là même d’automatiser toute une chaine de valeur. La quête du Graal !

Armés de leur expérience et de leur intuition, ils proposaient chaque jour une nouvelle heuristique à l’Informaticien qui la programmait dans le système. On y croyait.

Un beau jour on vit arriver le Data Scientist. Jeune, bardé de diplômes en mathématiques, à la logique implacable et arrogante. Il proposa de repartir de zéro. « Ne cherchez pas à inventer les règles », dit-il, « laissez-moi les découvrir dans la Data ». Il fût écouté et cette méthode fonctionna si bien que les Experts furent écartés.

Quelques années plus tard, alors qu’il mettait en production les modèles miraculeux du Data Scientist, l’Informaticien eût une idée. Il cherchait depuis longtemps à réhabiliter les Experts. Son plan était simple : substituer le Data Scientist par un logiciel !

Il inventa l’automl ! L’auto machine learning ! Une grosse « boucle for », plus rapide, plus simple, plus auditable, plus transparente qui démoda, à son tour, le Data scientist.

Après quelques mois, le Data Scientist désœuvré proposa amicalement un café à l’Informaticien. Il lui dit : « Je regrette mon comportement condescendant et j’ai compris la leçon. Tu as réussi à remplacer mon travail dans son expression la plus simple. Cela dit, j’ai progressé depuis. J’aimerais collaborer avec toi ». Sans rancune, l’Informaticien fût d’abord surpris : « et qu’est-ce que j’y gagne ? », dit-il. Le Data Scientists répondit : « Plus tu as de données, plus tes modèles sont bons. Je peux t’aider à avoir plus de données en exploitant de nouveaux gisements : l’image, la voix, les séquences. Cela rendra tes modèles plus performants ».

Puis il conclut : « Tu sais, Informaticien, nous sommes du même côté. On cherche tous les deux à automatiser des tâches simples pour faciliter la vie de nos clients et de nos collègues. La Data science, c’est comme l’informatique, c’est de l’automatisation ».

Désormais amis, nos deux compères œuvrent de concert dans l’intérêt de tous.

Episode 09 – Qu’ont-ils de plus que nous ces GAFA(M) ?

« Je ne comprends pas », dit le PDG de la Banque Historique Convertie en Nouvelle Banque (BaHiCoNoBa), qui a rassemblé ses forces vives pour remonter la situation de crise.
« Nous avons à notre disposition, les précieuses données de nos clients bien protégées, au fin fond de nos legacy systems robustes et infatigables depuis des décennies. Nous avons le volume : tout le détail du patrimoine de chacun de nos clients et de leurs rejetons, l’historique de leur portefeuille et même la liste de tous les achats qu’ils ont fait avec leur carte bleue en ligne ou en magasin : du cadeau pour la grand –mère à la dernière escapade aux Bermudes, dans les Fjords de Norvège ou l’ascension du Machu Picchu. »
« D’autres parts nous avons investi et installé des dispositifs technologiques big data et data mining à la pointe et pour l’instant ils ne nous ont pas permis de conquérir de nouveaux marchés, tout au plus à stabiliser notre portefeuille de clients. Que pouvons-nous faire pour conserver notre part de marché, qu’allons-nous devenir si les GAFA(M) se mettent à nous concurrencer sur notre propre activité ? Peut-être devrions-nous chercher à nous diversifier ? Il faut absolument que nous trouvions de nouveaux axes de développement.

DigitalStore a une idée, il se lance : « Nous sommes les champions des applications bancaires de paiement en ligne, de transferts de comptes, de capitalisation ou encore en trésorerie, nous pourrions déployer ces services bancaires, sous forme d’API, et les proposer à nos clients Personnes Morales ou partenaires sur un Applications Store à notre effigie. En plus, la plateforme existe déjà dans le groupe et sert déjà nos différentes entités ou filiales. Nous n’aurions plus qu’à les customiser un peu, à les publier et à les proposer, d’abord en évaluation, puis comme nouveaux services payants. Qu’en pensez-vous ?»

« Excellente idée M. DigitalStore », s’exalte le PDG de la BaHiCoNoBa, qui y voit là, enfin, un moyen de concurrencer les GAFA(M) sur leur propre modèle. « M. PMO et M. DigitalStore, proposez-moi une roadmap et un business plan pour lancer le premier service pilote, trouvez-moi des PME ou partenaires qui seraient prêts à nous suivre. J’attends votre proposition lundi matin dans la salle du conseil pour que notre plan d’attaque soit proposé lors de notre comité d’investissement ».

Lundi matin, le dossier est parfaitement bouclé et approuvé par le comité d’investissement.
Mais cela permettra-t-il à la BaHiCoNoBa de relancer son activité ?

Episode 10 – Le Big Data au pays du Père Noël

C’est dans ce pays aux contrastes passionnants, proche de Sodankylä, où se déroule le festival du Film du Soleil de Minuit, que MrXmas fût dérangé alors qu’il observait les plus belles aurores boréales. Un appel de ses lutins lui signala que la terre grondait dans la forêt de Rovaniemi et que les rênes étaient dans tous leurs états. Voulant en avoir le cœur net, MrXmas se porta jusqu’à la lisière de la forêt et découvrit des chantiers énormes de construction de Data Center.

De nouveaux paquets débarquent chez MrXMas mais ce sont des paquets de données !! Les liaisons ne se font pas en traineau mais via des communications tout à fait virtuelles. Tellement virtuelles que le DSI MrGeen affirme que ce sont les centres de données les plus écologiques au monde. MrFreeCooling, le responsable de la logistique, est fier de son système de refroidissement dans le fjord. MrXmas est rassuré de voir des salles blanches qui s’intègrent parfaitement au paysage sans trace humaine visible. Tout se passe bien au pays elfique, tout le monde apprécie cette tournure technologique vers un développement durable.

MrXMas fort de cette expérience et en pleine mutation de transformation numérique, regarde à ne plus vendre ces jouets mais à les louer à leur usage. MrIOT est en train de connecter un maximum de jouets pour qu’ils se protègent entre eux et qu’ils s’auto-dépannent. La sécurité est revisitée. L’originalité et la prouesse de cette équipe ne nous laisse plus de doute sur la croyance ou pas de la présence de Santa Cloud dans notre réalité virtuelle. Les elfes vont pouvoir rêver de construire un monde meilleur.

Post-face

Les contributeurs de la saison 3 qui ont partagé leur passion :

Hind BEJI

Christopher BELLIARD – Coddity

Sébastien BLERVACQUE – Semdee

David BOCQUENET

Jean-Marie CLISSON – SmartAttitude

Baptiste JAUNEAU

Jean MEANCE – Hilldale Conseil

Martine MEANCE – Hilldale Conseil

Sandrine MOREL — Cardif IARD

Jérémy PAYAN – Coddity

Batiste ROGER

Sofia ROLLAND

Marie-Line WILSON

© le collectif d’écriture de la saison 3 de RBDD – août 2018

3 commentaires

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.