Big Data, Big Moula, Big Cata
Histoire

Le big data ou « grosses données » en français, les méga données , ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés.
L'expression « big data » serait apparue en octobre 1997 selon les archives de la bibliothèque numérique de l'Association for Computing Machinery (ACM), dans un article scientifique sur les défis technologiques à relever pour visualiser les « grands ensembles de données.
La naissance du Big Data est liée aux progrès des capacités des systèmes de stockage, de fouille et d'analyse de l'information numérique, qui ont vécu une sorte de big bang des données. Mais ses prémices sont à trouver dans le croisement de la cybernétique et de courants de pensée nés durant la Seconde Guerre Mondiale, selon lesquels l’homme et le monde peuvent être représentés comme « des ensembles informationnels, dont la seule différence avec la machine est leur niveau de complexité. La vie deviendrait alors une suite de 0 et de 1, programmable et prédictible ».
Les évolutions qui caractérisent le big data et ses algorithmes, ainsi que celles de la science des données sont en partie cachées (au sein des services de renseignement des grands États) et si rapides et potentiellement profondes que peu de prospectivistes se risquent à pronostiquer son devenir à moyen ou long terme, mais la plupart des observateurs y voient des enjeux majeurs pour l'avenir, tant en termes d'opportunités commerciales que de bouleversements sociopolitiques et militaires, avec en particulier le risque de voir émerger des systèmes ubiquistes, orwelliens et totalitaires capables de fortement contrôler, surveiller et/ou influencer les individus et groupes .Les risques de dérives de la part de gouvernements ou d'entreprises24 ont surtout d'abord été décrits par Orwell à la fin de la dernière guerre mondiale, puis souvent par la science-fiction. Avec l'apparition de grandes banques de données dans les années 1970 (et durant toute la période de la guerre froide) de nombreux auteurs s'inquiètent des risques pris concernant la protection de la vie privée, en particulier Arthur R. Miller (en) qui cite l'exemple de la croissance des données stockées relatives à la santé physique et psychique des individus.
En 2000, Froomkin dans un article paru dans la revue Stanford Law Review, se demande si la vie privée n'est pas déjà morte, mais ce sont surtout les révélations d'Edward Snowden (2013) qui ont suscité une nouvelle prise de conscience et d'importants mouvements de protestation citoyenne.

Les quatre droits et « états de base de la vie privée » tels qu'énoncés par Westin en 1962 (droit à la solitude, à l'intimité, à l'anonymat dans la foule et à la réserve) sont menacés dans un nombre croissant de situations, de même que la protection du contenu des courriers électroniques32 qui fait partie du droit à la vie privée.
Le Big Data offre de nouvelles perspectives, qui ouvrent de nouvelles opportunités et favorisent de nouveaux modèle de business. Son adoption implique trois actions principales :
1. Intégrer
Le Big Data rassemble des données provenant de sources et d’applications disparates. Les mécanismes d’intégration des données classiques, comme ETL (extraire, transformer et charger) ne sont généralement pas à la hauteur. Pour analyser des jeux de Big Data à l’échelle de téraoctets, voire de pétaoctets, il est nécessaire d’adopter de nouvelles stratégies et technologies. Lors de l’intégration, vous devez importer les données, les traiter et vous assurer qu’elles sont formatées et disponibles sous une forme accessible à vos analystes.
2. Gérer
Le Big Data nécessite du stockage. Votre solution de stockage peut se trouver dans le cloud, sur site, ou les deux à la fois. Vous pouvez stocker vos données sous la forme de votre choix et imposer à ces jeux de données vos exigences de traitement, ainsi que les moteurs de traitement nécessaires, à la demande. Nombreux sont ceux qui choisissent leur solution de stockage en fonction de l’endroit où sont hébergées leurs données. Le cloud est de plus en plus adopté, car il prend en charge vos besoins informatiques actuels et laisse la possibilité d’augmenter les ressources en fonction des besoins.
3. Analyser
Votre investissement dans le Big Data est rentable lorsque vous analysez et agissez sur vos données. Forgez-vous un nouveau point de vue grâce à une analyse visuelle de vos divers jeux de données. Explorez davantage les données afin de faire de nouvelles découvertes. Partagez vos conclusions avec d’autres utilisateurs. Créez des modèles de données avec le machine learning et l’intelligence artificielle. Exploitez vos données. Déduire le sens et prendre en charge les métadonnées.
