延云大数据PPD
延云 千亿大数据实时解决方案 超千亿规模的数据,数据库根本就运行不了,怎么办? 数据从产生到能够查询,要延迟一天才能看到,如何能做到分钟级延迟? 50台规模的hadoop集群,几亿条数据,一个MR任务要运行几小时,每天也就能进行几百次查询。 如何能让任务的执行时间缩短到秒级响应,每天能执行千万次查询。 Hbase只接受KV形式的存储,数万个维度的大宽表,如何进行多维索引? Storm流计算能预计算固定的维度、粒度,但业务千变万化,突发事件很多,如何对任意维度的组合进行筛选、钻取、统计? 硬盘坏了,机器宕机,怎样做到数据可靠不丢失? 小型机太贵,我们买不起,怎么办?
用户评论