Les 5 défis du Big Data

&Developer&Examples&CoreAudio&HAL&HALLab&Resources&AppIcon« Big data » est partout. Est-ce du lard ou du cochon ? Quels sont les dangers ? Qu’est-ce qu’on ne me dit pas ? Vais-je y perdre de l’argent, du temps et de précieuses ressources internes ? Comment puis-je réduire les risques, réduire les délais, maximiser mes chances de succès et le pérenniser ?

Nous avons voulu faire la lumière et faire ressortir en quoi il est opportun de les faire travailler au service de l’entreprise. Pour cela, nous mettrons en exergue les fondamentaux suivis d’exemples. Cela étant, pour être brefs nous pouvons aller droit au but. Malgré les artifices de style, il convient de conserver son esprit critique.

Quels sont les 5 principaux défis du Big Data ?

C’est nouveau. Il n’y a pas de vérité établie, pas de méthode standard.  Les acteurs sont très nombreux et éparpillés. Le vocabulaire est instable et souvent polysémique. C’est effervescent. Le buzz big data rappelle la bulle internet : ceux qui savent sont surtout de petites structures, souvent des entrepreneurs et des auto entrepreneurs. Beaucoup d’entre eux disparaitront.

Les données, les informations sont polymorphes.  Elles font appel à de nombreuses disciplines : linguistique, sémantique, psychologie, sociologie, mathématique, systémique, informatique, arts graphiques pour la visualisation, philosophie. Mais elles nous sont familières et nous aurons bien du mal à faire l’effort d’étendre nos connaissances pour mieux les gérer.

L’expertise est rare. Pour exploiter les données, les experts mathématiques, informatiques et scientifiques sont rarement doués pour les aspects relatifs aux sciences humaines et réciproquement. Le niveau mathématique requis peut être très élevé en statistiques et en topologie textuelle. Les cursus sont nouveaux et beaucoup sont en cours de construction.

Nous restons tournés vers l’action. Priorité aux processus, aux applications, à l’événementiel ! Mais données et informations les sous-tendent tous. Les directions informatiques actuelles gèrent des projets, des moyens informatiques, des équipes, des réseaux mais elles ne gèrent pas les données en tant que contenu et encore moins les informations. Les directions opérationnelles et support ne les gèrent pas non plus de manière explicite et reconnue.

Les technologies et les techniques nous viennent  surtout des EU. Or données et informations sont très attachées à la culture. Il y a un risque sociétal à appliquer tel quel les recommandations américaines.

Comment commencer ?

Heureusement des techniques éprouvées existent pour faciliter l’adoption d’innovations : Dans une première phase commencer pas à pas, avec des pilotes utiles et pouvant être opérationnels, se former, faire appel à des experts, s’en tenir à des cas concrets.  Ensuite consolider les acquis techniques et métiers puis développer les projets et la culture en s’attaquant à de problèmes plus importants.  Les pilotes puis les projets seront en phase avec les axes stratégiques afin de bénéficier d’un soutien qui devra accompagner l’enfance du big data. Pour commencer plus vite, il peut être utile d’utiliser des solutions Cloud ou Software as a Service, mais l’entreprise devra être très claire si elle veut maintenir cette approche pour les « vrais » projets car confier ses informations à l’extérieur peut être un risque.

Pour simplifier le défi posé par la nature des données et des informations, on pourrait d’abord se focaliser sur les données les plus simples : les données structurées et pour celle s qui ne le sont pas, celles issues de capteurs, de machines car elles sont très généralement fiables et représentatives et il est rare qu’elles mentent. Une fois l’expertise acquise on peut progressivement accroitre la difficulté en traitant des informations plus complexes. On pourra aussi dans un premier temps éviter les initiatives d’exploitation de données en temps réel.

L’expertise est construite progressivement lors des pilotes et projets. Faire appel à de l’expertise externe réduira la courbe d’apprentissage. Les techniques sont surtout pratiquées par de jeunes scientifiques. Il peut être judicieux de les intégrer progressivement dans les équipes existantes, soit avant qu’ils soient entrepreneurs, soit après. L’expertise n’est pas seulement informatique, elle concerne aussi ceux qui devront transformer les analyses et les applications en plan d’actions, à savoir surtout les managers et les directions opérationnelles.

Les risques de perte et de fuite sont réels, surtout si les techniques sont maitrisées par des experts qui sont relativement peu sensibles aux exigences de fiabilité non seulement technique mais juridique aussi. Dès le départ, il est judicieux d’associer régulièrement les services d’audit, de sécurité et juridiques.

Pour éviter que la démarche ne prenne de mauvaises habitudes, les instances de gouvernance de l’information seront impliquées. Les équipes d’administration de données et les data scientists devraient se parler. Les data scientists sont par nature un peu francs-tireurs et il importe de trouver un terrain d’entente avec les administrateurs de données pour le bien commun de la gouvernance. Si la gouvernance de l’information n’est pas encore en place, il faudra mettre les bouchées doubles. Si elle existe, un peu de doigté sera nécessaire pour la faire évoluer afin d’inclure les types de données manipulées par le big data, surtout si des contraintes de type temps réel s’y greffent.

Comment durer ?

La Gouvernance de l’information est une condition nécessaire car elle conditionne les moyens et  la visibilité des projets. Elle doit être épaulée par un sponsor de haut niveau, de préférence au Comité Exécutif. La création d’un « Programme big data » peut être le socle sur lequel se repose la Gouvernance de l’Information.

La démarche pas à pas aide aussi à condition que chaque pilote, chaque projet fasse d’une part l’objet d’un retour d’expérience démontrant sa valeur ajoutée et d’autre part que ces bénéfices soient communiqués.

Le dernier pilier repose sur les hommes de conviction qui n’hésitent pas à propager les succès et à escalader les échelons pour avancer.

Le sujet vous intéresse, vous souhaitez le travailler avec une approche globale et transverse, venez nous retrouver dans le groupe Associer le Big Data et la Gouvernance de l’information de la communauté GouvInfo.  Grégory Maubon et moi même vous attendons !

Xavier Henderson

Expertise en DW, BI, MDM, GI, QI, KM, IA, informatique, information et theo de la connaissance

Laisser un commentaire