Qu’est ce que le Big data ?

09 oct.
2016
Qu’est ce que le Big data ?

Dans le cadre de l'ouverture d'un Diplôme Universitaire Big Data et Analyse de données pour l'ingénieur au sein de l'ENSC, nous vous proposons de définir ce domaine emergent, en axant notre propos sur les enjeux de demain dans le monde du travail.

Le Big data, c’est quoi ?

Quand on cherche une définition claire de Big Data sur internet, on tombe généralement sur ça :

Le big data, littéralement « grosses données », ou mégadonnées (recommandé), parfois appelées données massives, désignent des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information.

Source : https://fr.wikipedia.org/wiki/Big_data

En clair, qu’est ce qu’on y apprend ? Qu’il s’agit d’un ensemble de données donc, que les données peuvent être très hétéroclites d’où la variété des sources. Qu’il s’agit de données massives donc des gros volumes de données. Et enfin qu’il est difficile de travailler avec de manière classique, d’où le besoin de performance, de vitesse. On retrouve ici la définition la plus courante de la règle des 3V selon le Gartner : Volume, Vélocité et Variété.

3V du Big Data

Source : http://www.clubic.com/pro/it-business/article-508407-1-big-data-analyse-donnees-interesse-entreprises.html

En fin de compte cette définition est assez subjective à l’utilisateur puisqu’aucune règle ne fixe un seuil sur ces 3V à partir desquels on travaille dans le domaine du big data. On pourra dire dans ce sens que le big data commence quand l’utilisateur n’est plus en mesure d’effectuer son travail de manière classique. Pour un comptable il s'agit peut-être de milliers de lignes dans un fichier excel, et pour le statisticiens on tablera plutôt sur des millions de lignes dans une base de données.

Récemment certaines définitions héritées du marketing ajoutent 2V à cette définition : la véracité, c’est à dire la crédibilité des données en fonction de leur source, et la valeur, c’est à dire l’intérêt de la donnée en vue de l’information attendue.

Le Big data, pour quoi faire ?

Les applications sont multiples et dépendent souvent des moyens mis en oeuvre pour extraire de la valeur de l’information. Longtemps on a associé le big data à des domaines commerciaux comme le marketing ou l’analyse prédictive des marchés. Aujourd’hui, on le retrouve dans des domaines comme la médecine, la domotique, la sécurité informatique ou encore la recherche scientifique.

Le principe de base est simple, on utilise toujours la même recette, et on change uniquement les ingrédients et la présentation. Tout d’abord, il faut collecter des données depuis leur source. Cela peut être des fichiers Excel, des bases de données ou même encore des capteurs physiques. Une fois ces données recueillies, il va falloir les travailler. C’est dans cette phase qu’intervient les phases de calcul, d’agrégation, d’enrichissement et de stockage de l’information en vue de la restitution. La restitution intervient dans la phase finale, celle qui va permettre d’utiliser l’information extraite de la donnée pour enrichir ses connaissances, prendre une décision ou créer de la valeur. C’est dans cette étape que l’on pourra afficher des tableaux de bord qui résument l’essentiel de l’information, mais également récupérer des valeurs pour paramétrer d’autres systèmes comme des outils d’aide à la décision.

Source : http://www.xebia.fr/data.html

Le Big data, quel métiers ?

Le Big data a fait naître récemment un panel de métiers qui ne sont pas toujours simples à comprendre, d’autant plus qu’ils n’ont pas de frontières clairement définies entre eux.

Premièrement, le poste de data engineer, ou ingénieur big data, est la personne qui travaille essentiellement sur le flux de données. Son but est d'optimiser au mieux le traitement des données de la collecte jusqu’à la restitution, pour qu’il soit robuste et rapide quelque soit la source de donnée. La plupart du temps ce poste est occupé par une personne issue d’une formation classique d’ingénieur en informatique qui s’est spécialisée dans le domaine des solutions Big data, ce travail nécessitant majoritairement des compétences en développement et en intégration.

Deuxièmement, le poste sans doute le plus connu est celui de data scientist. Le but du data scientist est d’extraire du sens de la donnée, de manipuler de gros volumes d’information pour répondre à une problématique. Cela consiste essentiellement en la recherche de méthodes statistiques, de modèles théoriques et d’algorithmes mathématiques pour arriver à ses fins. Le data scientist est habituellement une personne qui s’intéresse beaucoup aux mondes des mathématiques et statistiques, mais qui a également des connaissances en informatique et en science (physique, biologie, etc) selon le contexte.

Le prochain métier est souvent très rapproché du data scientist car il intervient sur un terrain proche. Le data analyst fait le lien entre le traitement des données et l’affichage de l’information sous toutes ses formes : tableaux de bords, indicateurs, graphiques, etc. Il est par ailleurs souvent comparé à l’UX designer pour la partie restitution car il est en charge de traduire l’information en un résultat compréhensible par tous. Il maîtrise la programmation des interfaces homme-machine mais se doit également de comprendre les traitements statistiques effectués. Côté formation, le data analyst est apprécié pour sa transdisciplinarité, aussi bien en interface utilisateur, qu’en développement et statistiques.

Enfin, même si ces 3 métiers restent les plus incontournables dans le domaine, il ne faut pas oublier tous ceux qui tournent autour de cet univers. On pourrait parler en ce sens du BI manager, un consultant qui a pour but d’analyser, de choisir et construire des tableaux de bords avec les indicateurs les plus pertinents ; le data manager, dont le but est de gérer le stockage de données dans des bases afin que celles-ci soient rapidement accessibles, répliquées et sûres ; ou encore le data architect, qui conçoit des solutions Big data suivant les besoins.

Matt Turck Big Data Landscape

Source : http://frenchdata.fr/blog/

Avec tous ces métiers nécessitant des compétences aussi variées allant de l’exploitation de bases de données jusqu’à l’ergonomie des interfaces en passant par la statistique décisionnelle, c’est tout un panel d’emploi qui s’ouvre depuis quelques années et qui va continuer à progresser. Selon une étude menée par SSII Atos, le marché du Big Data en France vaudra 445 millions d’euros fin 2016, soit 25 % de plus par rapport à l’année précédente. Une raison de plus pour s’intéresser au domaine et plonger au coeur de la data.

Réseaux sociaux

  • Connectez-vous pour ajouter un commentaire.

  • Aucun commentaire trouvé.