Définition : Big Data
Selon l’Association for Computing Machinery, l’expression Big Data est apparue vers la fin des années 90, plus précisément en 1997. Mais qu’est-ce que le Big Data ?
Big Data : définition
Le terme Big Data est utilisé pour désigner l’ensemble des données générées grâce à l’utilisation des nouvelles technologies. Il concerne aussi bien les données produites à des fins professionnelles qu’à des fins personnelles :
- Courriels
- Base de données
- Données produites par les internautes sur les réseaux sociaux
- Images, sons, contenus textuels et vidéos publiés sur le web
- Données issues de capteurs
- Données produites par les objets connectés
- Données de géolocalisation, etc.
L’évolution des Big Data nécessite de nouvelles solutions de stockage et de traitement des données, parmi lesquelles nous pouvons citer le Cloud Computing et les supercalculateurs. En effet, en raison de leur volume et de la rapidité de production des données, les systèmes de stockage traditionnels sont devenus rapidement obsolètes.
Pour information, grâce à divers outils permettant d’analyser les Big Data, les chercheurs, les administrations et les entreprises peuvent réaliser :
- Des analyses prédictives et tendancielles
- Déterminer plus précisément des profils
- Anticiper d’éventuels risques
- Analyser divers phénomènes, etc.
Les 3 V du Big Data
En 2001, le principe des trois V a été mis en place par Doug Laney de Meta Group pour décrire le Big Data.
Le premier V correspond à l’important volume de données non structurées et à faible densité.
Le second V, quant à lui, correspond à la vitesse à laquelle les données sont produites et traitées.
Concernant le troisième V, il correspond à la variété de données.