Le Big Data |
« Si un homme raisonne mal, c'est qu'il n'a pas les données pour raisonner mieux » (Denis Diderot 1771). Mais quand trop de données nuisent au raisonnement il faut savoir faire des choix. « Google , le nouvel Einstein » titrait récemment Science et Vie « en quelques centièmes de secondes le moteur de recherche le plus puissant de la planète extrait chaque jour des informations pertinentes de 20 pétaoctets de données. Soit environ 20 fois le volume stocké par la Bibliothèque Nationale de France. » A défaut de définition académique des « Big Data », cet ordre de grandeur devrait suffire. C'est un phénomène général qui touche tant la science que la culture ou le commerce. Plusieurs facteurs ont contribués à ce phénomène. Le coût dérisoire du stockage des données en est un. En 1986 un PC avec un disque dur de 10 Mo coutait environ 30 000 F soit 450 € le Mo. Aujourd'hui une clé usb de 64 Go coute moins de 30 €, soit 0.47 € le giga . Le rapport est de 96 million pour 100 ! Et puis il y a la facilité de récolte de ces données, via Internet. Tout le monde récolte des données à tout va, y compris les opérateurs de la VAD. Mais la facilité avec laquelle ces données nous sont désormais accessibles, doit nous inciter à un peu de prudence et de réflexion, pour ne pas se laisser rapidement submerger par le tsunami des Big Data. N'est pas Google qui veut ! L'expression « big data » dans le contexte de la vente à distance, porte en elle toute la lourdeur et la complexité que pose désormais la gestion de la relation client multi canal et donc multi sources de données. D'une situation de « carence de la donnée » qui existait il y a encore dix ans, au début de l'ère du web et des prémices des réseaux sociaux, nous sommes passés à un environnement de données pléthoriques, voire en surnombre. Une surcharge pondérale de données issues d'origines diverses et variées, sans homogénéité. Hétéroclites à souhait ! Et surtout faciles et peu couteuses à récolter. Donc, si ça ne coute rien (ou presque !) pourquoi s'en priver ? Récoltons de la donnée en masse, puisqu'elle est là, on fera le tri ensuite. Vite dit... Quand la donnée était rare, et que les moyens de l'exploiter coutaient cher, les statisticiens (qu'on n'appelait pas encore dataminer) au services des stratèges et hommes de marketing, ont su construire des modèles très pertinents axés sur une recherche constante de la rentabilité, et de l'efficacité. Il n'y avait pas le choix. Envoyer, plusieurs fois par an, 50 000 catalogues à 2 € ou 1 million de mailings à 0.80 € à des personnes qui de toute évidence n'allaient pas commander pouvait mettre la société en péril et l'erreur était rarement répétée deux fois. La performance était liée à la qualité de la segmentation des données internes et aux choix des cibles externes. La donnée était chère. Couteuse à récolter et à exploiter. On en prenait soin. Et c'est toujours le cas de nos jours dans les entreprises qui ont de tous temps baigné dans cette culture. Puis, les multiples canaux qui s'ouvrirent tour à tour vinrent nous inonder de données qu'il nous faut désormais apprendre à canaliser avant qu'ils ne se déversent dans la mare du CRM et viennent noyer la donnée pertinente dans la masse des données sans valeur, mais que l'on stocke..au cas où ! Dans l'impossibilité de passer tous ces canaux en revue, intéressons-nous à internet et tout particulièrement à l'e-commerce. Ici la donnée la plus simple, la plus facile, la moins couteuse à récolter - de prime abord, entendons nous bien- est l'adresse email. C'est la plus évidente aussi. Mais voilà, combien d'entrepreneurs du net se rendent compte, après quelques années d'existence, qu'ils ont négligé tout un pan de l'architecture de leur bases de données clients, et qu'ils se retrouvent aujourd'hui avec des fichiers bien bancals ? Faute de s'être focalisé sur les taux de hard et de soft bounds, d'avoir emmagasiné des leads à tout va, ils en sont venus à oublier l'essentiel.
|