1
chenk008 2023-09-12 09:51:47 +08:00
想了解一下,第二点是什么 bug 呢?
|
2
Judoon 2023-09-12 09:53:39 +08:00
oss 的话,为什么不直接用 oss 的 sdk 去调用,而要挂载成 pv 呢?
如果是为了用存储,为什么不考虑用云盘或者云文件系统? |
3
zsj1029 2023-09-12 09:53:47 +08:00 via iPhone
能用 AWS 的,最后都会用 aws ,同理 js 能写的最终都会拿 js 写
|
4
jiangzm 2023-09-12 09:55:07 +08:00
ack 不维护了?不会吧
|
5
xiaoshouchen OP @jiangzm 我没说清楚,不好意思,不是 ACK 不维护,这个是他们的重点业务,当然是维护的。就是通过 storageClass 获取临时 PV 节点有问题,有时候创建新的 pod 的时候,PV 节点会挂载失败。
|
6
xiaoshouchen OP @Judoon 直接用 SDK 也会用到,各有各的需求吧。阿里云首先是提供 OSS 作为 PV 的,那么就应该提供稳定可靠的服务吧。
|
7
defunct9 2023-09-12 10:00:15 +08:00
还有个坑,就是自己托管的 ACK ,主节点三个,二个 Ingress 节点,想把 Ingress 放到资源富裕的 master node 上是不可以的,因为前置的负载均衡 clb 不支持,那就必须拿出 5 个节点来,浪费。
|
8
dropdatabase 2023-09-12 10:02:59 +08:00
@defunct9 细说前置的负载均衡 clb 不支持?
|
9
Reficul 2023-09-12 10:05:25 +08:00
第二点不是原生 GenericEphemeralVolume 的行为么,社区已经 GA 了还能有啥问题。
|
10
defunct9 2023-09-12 10:11:08 +08:00
@dropdatabase 这个就说来话长了。我们 ingress 的节点资源比较少,然后之前其他 pod 的调度没弄好,直接把 pod 调度到 ingress 节点了,然后就目睹了一个 ingress 节点的崩溃,然后山河一片红。之后我把 ingress 都调度到 master 上了,然后去 LB 那里修改死活不生效,改了 2 回不生效,然后不报错,然后就开工单去阿里了,得到的回复是 clb 不能在 master 上,那就是说你必须付出 3 个 master+2 个 ingress 的节点=5 个节点的代价,早知道走全托了。
|
11
xabcstack 2023-09-12 10:19:22 +08:00
阿里云已经完蛋,全面转头华为云
|
12
dropdatabase 2023-09-12 10:20:42 +08:00
@defunct9 你说的这个问题是不是:
A 机器(有多个服务)发起 http 请求,流量走到 CLB (端口是 4 层监听,不是 7 层)又回到 A 机器上,这时请求会卡住不响应。 |
13
57L49t45Jo9IJvge 2023-09-12 10:22:47 +08:00
我们遇到一个问题 业务走 ingress 上传 贼慢 而且 max_body_size 不生效 ,自建 ecs nginx 反代 无此问题,询问工单说是我们业务问题 ,无解。。。。
|
14
perfectlife 2023-09-12 10:32:40 +08:00
@defunct9 我感觉这个锅不是阿里云的,是服务的亲和性调度没做好吧,clb 默认肯定不管这些的,clb->node:port ,取决的还是你 pod 调度的问题,可以 ingress 节点设置污点和标签,默认不允许所有 pod 调度,然后单独给 ingress 的 deployment 文件增加污点容忍配置,并用标签选择器选择 ingress 节点调度。
|
15
defunct9 2023-09-12 10:46:27 +08:00
@perfetlife 这锅必定是阿里云的,为啥 ingress 不可以放到 master 上面。
|
16
defunct9 2023-09-12 10:47:29 +08:00
@dropdatabase 不是,就是节省节点的意思。
|
17
winglight2016 2023-09-12 11:02:50 +08:00
@defunct9 你们用的是阿里云的 k8s 吗?我们的 ingress 是相当于集群组件,并不能自己管理底层资源
|
18
defunct9 2023-09-12 11:07:07 +08:00 via iPhone
@winglight2016 why not ?都说了是 ack 了,集群组件?!,我另一个 ingress 还是 traefic 呢。奇怪的思想
|
19
o562dsRcFqYl375i 2023-09-12 11:52:21 +08:00
阿里云:也没多少嘛,就两三个
|
20
anubu 2023-09-12 12:27:25 +08:00
印象中,ACK 可免费使用,CCE 和 TKE 没有免费使用。
|
21
GopherDaily 2023-09-12 13:14:59 +08:00
国内暂时没有比 ACK 更好的 k8s 托管服务。
OSS 之类的挂载不是 ACK ,使用前自己注意影响面。 你用 S3 也是要看他具体挂载和驱动的 |
22
OceanBreeze 2023-09-12 13:39:27 +08:00
@GopherDaily 为啥我觉得腾讯云 tke 更好用呢
|
23
luomao 2023-09-12 13:40:00 +08:00
@xiaoshouchen 我记得阿里云文档中强调过如果涉及到写入场景不建议使用 oss 作为 PV
|
24
perfectlife 2023-09-12 13:45:24 +08:00
@defunct9 #15 这和 ack 没关系,kubernetes 就是这么设计的,master 节点默认有 node-role.kubernetes.io/master:NoSchedule 的污点,为了 master 组件的稳定,不允许运行业务容器,非要调度到 master 上一般就两种办法,要么删除 master 上的污点,要么就是 yaml 文件里加污点容忍。
|
25
luomao 2023-09-12 13:46:02 +08:00
|
27
GopherDaily 2023-09-12 15:14:28 +08:00
@OceanBreeze
就我个人经历来说: - 我没有用过 TKE ,所以没办法直接评判,不过托管 k8s 本身不是一个非常有难度的事情 - 腾讯云的问题是在 ECS/RDS/OSS/LB 等方面的全面落后 - 会出一些非常离谱的低级操作,比如突然告诉某个功能在某个区域要下线了,比如 RDS 在非使用方原因的情况下挂了 以上体验来此某 B 轮公司迁移到腾讯云的经历 |
28
xiaoshouchen OP @luomao 肯定不可能只读不写,我用的场景确实是极少写,大部分读。只是极少写都出错,一周写个几百 M 也不过分吧。
|
29
zhoulouzi 2023-09-12 15:49:22 +08:00
VKE 功能单一你也可以认为只提供标准一套
|
30
anubu 2023-09-12 16:16:49 +08:00
@chf007 可以参考 ACK 文档,基础版是免费的。https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/product-overview/billing-overview
注意:这里说的免费是指容器托管服务本身,不是指负载均衡或服务器节点等云产品免费。即使用 ACK 基础版你可以得到一个几乎免费的控制平面,TKE 和 CCE 都是收费的。说几乎免费是控制平面的 API 需要一个内部 LB ,之前是免费的,后来好像要收费了。 |
31
defunct9 2023-09-12 16:55:58 +08:00 via iPhone
@perfectlife 我都把 ingress 调度到 master 上面去了,看清楚别人发言再回答。
|
32
aapeli 2023-09-12 18:14:00 +08:00 1
@defunct9 master 不能作为 lb 的 backend ,可能是为了稳定性吧,防止 ingress 打爆带宽导致 master 异常.
|
33
HowToMakeLove 2023-09-12 18:32:24 +08:00
感觉阿里云虚标啊,说的秒级启动容器,根本不是
|
34
OceanBreeze 2023-09-13 09:41:35 +08:00
|
35
GopherDaily 2023-09-13 10:11:33 +08:00
@OceanBreeze 嗯,看上去经历差蛮多的,我们很少用控制台
|