设为首页 - 加入收藏
广告 1000x90
您的当前位置:主页 > 网站运营 > 正文

避免“数据湖”成为“数据沼泽”,流动的“数据河”是关键

来源:引流技巧 编辑:引流技巧 时间:2025-10-04
数据只有流动起来才可以产生价值。基于IOTA架构的数据河与数据湖组建企业内部的可流动的大数据水系,用数据驱动整个企业精益成长。

数据湖(Data Lake)在Wiki中定义如下:

避免“数据湖”成为“数据沼泽”,流动的“数据河”是关键0避免“数据湖”成为“数据沼泽”,流动的“数据河”是关键0

简而言之,数据湖是按存储原始数据格式的数据存储,旨在任何数据可以以最原始的形态储存,可是结构化或者非结构化数据,以确保数据在使用时可以不丢失任何细节,一般以Hadoop系统存储为比较典型的解决方案,所有的实时数据和批量数据,都汇总到数据湖当中,然后从湖中取相关数据用于机器学习或者数据分析。一个典型数据湖的结构如下图所示:

11

图1:数据湖存储着企业各种各样的数据

相关文章:

相关推荐:

栏目分类

微商引流技巧网 www.yinliujiqiao.com 联系QQ:1716014443 邮箱:1716014443@qq.com

Copyright © 2019-2024 强大传媒 吉ICP备19000289号-9 网站地图 rss地图

Top