Un “data lake” est un vaste dépôt centralisé, facilement accessible, de grands volumes de données structurées et non structurées.
En savoir plus
L’architecture du data lake est une approche de type « store-everything » pour les grandes données. Les données ne sont pas classées lorsqu’elles sont stockées dans le référentiel, car leur valeur n’est pas définie au départ. Par conséquent, la préparation des données est éliminée. Un data lake est donc moins structuré qu’un entrepôt de données classiques. Ce n’est que lorsque les données sont accessibles qu’elles sont classifiées, organisées ou analysées.