本来基于 HDFS 的 spark/impala 的 sql-like 的语法是挺好用的,性能也很不错,无奈 hdfs 上的存储系统一般不支持 update/delete ,只支持 insert ,刚接触 Bigdata 、 DW 这一块,不是很了解这方面的技术 /产品,有什么推荐的吗?
目前有要求如下
- 分布式,方便扩展
- sql-like 是最好的
- 需要支持 update/delete 等修改
- 尽量是开源免费,而且不那么小众的
目前我知道 GreenPlum , Any other ideas?
PS:没找到合适的节点。