V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
red13
V2EX  ›  ClickHouse

有没有熟悉 clickhouse 的? clickhouse 对于分布式支持的如何?

  •  
  •   red13 · 14 天前 · 1542 次点击

    要对一个大数据量的 table 进行查询,不会有复杂的查询逻辑,都是简单的 where 、order by 、group by 、sum 、avg 、count 查询,当前数据量接近 500 亿了,在半年内会增加到一万亿。

    目前方案是使用 spark ,我知道 clickhouse 很适合 olap 查询场景并且速度很快,但 clickhouse 对于 10000 亿数据量能扛得住吗?或者 clickhouse 也能很好的支持分布式?

    对 clickhouse 了解不是很深入,希望大佬指点

    amoia50
        1
    amoia50  
       14 天前 via iPhone
    分布式运维比较难直接上 Doris 或者 starrocks
    zqr10159
        2
    zqr10159  
       14 天前
    直接用 doris 就行了
    sealinfree
        3
    sealinfree  
       13 天前 via iPhone
    我存日志,有 573 亿,做了 7 个 clickhouse ,都是虚拟机,同一台全闪 7525 ,查询毫秒级,数据库后端这部分自己写的,没用其他中间件,体验很好,升级也没有太多坑,已经线上用了三年多了
    chenxytw
        4
    chenxytw  
       13 天前
    Check the `Distributed table engine` of clickhouse.
    1 trilliion rows is not big for clickhouse, the key is how your data partition.
    what's the columns split your data, what's the minimum & maximum rows of one part, and how many parts of your general query will read.
    For `order by` and `group by`, you will also focus on the columns you used,
    clickhouse is not good at non primary key, you can check what called `mark` in clickhouse.
    If your query sample from or sort in many marks, it will cause very low performance.
    red13
        5
    red13  
    OP
       13 天前
    @sealinfree 可以告知服务器的配置吗?
    sealinfree
        6
    sealinfree  
       12 天前
    @red13 单台虚拟机 8 核心 24G 内存,服务器是 PowerEdge R7525 ,处理器:AMD EPYC 7H12 ,服务器负载常年 10%左右,服务器上还有其他业务一共 20 个左右虚拟机,clickhouse 只有 7 个
    ryh
        7
    ryh  
       12 天前
    菜鸟的我第一次听说 clickhouse 还是从 PostHog 里, 一个开源的提供 SaaS 的分析工具平台,用的 clickhouse, 他们的体量应该不小(客户 top 3 是 ycombinator, mistral, supabase),有源码可以参考( https://github.com/PostHog/posthog/blob/master/posthog/clickhouse/cluster.py
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3199 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 12:17 · PVG 20:17 · LAX 05:17 · JFK 08:17
    ♥ Do have faith in what you're doing.