避免“数据湖”成为“数据沼泽”,流动的“数据河”是关键
来源:引流技巧
编辑:引流技巧
时间:2025-10-04

数据只有流动起来才可以产生价值。基于IOTA架构的数据河与数据湖组建企业内部的可流动的大数据水系,用数据驱动整个企业精益成长。
数据湖(Data Lake)在Wiki中定义如下:
简而言之,数据湖是按存储原始数据格式的数据存储,旨在任何数据可以以最原始的形态储存,可是结构化或者非结构化数据,以确保数据在使用时可以不丢失任何细节,一般以Hadoop系统存储为比较典型的解决方案,所有的实时数据和批量数据,都汇总到数据湖当中,然后从湖中取相关数据用于机器学习或者数据分析。一个典型数据湖的结构如下图所示:
图1:数据湖存储着企业各种各样的数据
(


相关文章:
相关推荐:
栏目分类

最新文章

热门文章
