首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Andata
V2EX  ›  问与答

公司打算把数据仓库迁移到 hadoop 上,各位有什么好的思路能借鉴吗

  •  
  •   Andata · 324 天前 · 439 次点击
    这是一个创建于 324 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前情况是这样的,其实数据仓库差不多 2 个 T,涉及到订单跟用户操作日志的表会比较大,一个表有 70G,但是因为某些原因不能拆成两个表(或者说是不想去排查拆完之后那些存储过程会被影响到),在加上现在数据量大生产也比较慢的原因,所以 boss 打算升级一下用 hadoop。但目前公司没有 hadoop 的相关人员。

    然后就打算用 hbase 来存储数据,但是我查了,hbase 适合存储那些非结构化,稀疏的内容。但我们的表都是完完整整的二维表。我觉得用 greenplum 这样的分布式数据库就可以解决目前的问题(指的是仓库)。 boss 现在叫我先把数据迁到 hadoop 看看,应该是有点先来试一下的意思。

    现在我想问,有没有其他人也是差不多这种情况,你们的 hadoop 仓库是怎么搭建的?我们 boss 的考虑是什么?

    目前尚无回复
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1932 人在线   最高记录 5168   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 24ms · UTC 15:26 · PVG 23:26 · LAX 07:26 · JFK 10:26
    ♥ Do have faith in what you're doing.