集群日志说它不会扩展,因为“pod已经解除了即时PersistentVolumeClaims”。他们甚至还给予一个豆荚。当我看,该吊舱有它的聚氯乙烯绑定,看起来很好。我甚至检查了所有聚氯乙烯的集群。他们都被绑起来了。
在集群事件中,它似乎在寻找要抢占的东西,但什么也没找到。然后奇迹般地让一切运转起来。
48m Warning FailedScheduling pod/postgres-8670-0 0/7 nodes are available: pod has unbound immediate PersistentVolumeClaims. preemption: 0/7 nodes are available: 7 No preemption victims found for incoming pod..
48m Normal NotTriggerScaleUp pod/postgres-8670-0 pod didn't trigger scale-up: 9 pod has unbound immediate PersistentVolumeClaims
48m Normal Scheduled pod/postgres-8670-0 Successfully assigned gw/postgres-8670-0 to gke-my-cluster-node-pool-7462b5a2-wkrz
48m Normal SuccessfulAttachVolume pod/postgres-8670-0 AttachVolume.Attach succeeded for volume "pvc-ea8ab3e0-2ed5-40bd-8456-a0707a5f4b18"
48m Normal Pulled pod/postgres-8670-0 ...
49m Normal Provisioning persistentvolumeclaim/postgres-8670 External provisioner is provisioning volume for claim "gateway/postgres-8670-0"
49m Normal ExternalProvisioning persistentvolumeclaim/postgres-8670 waiting for a volume to be created, either by external provisioner "pd.csi.storage.gke.io" or manually created by system administrator
49m Normal Injected statefulset/postgres-8670 Linkerd sidecar proxy injected
49m Normal SuccessfulCreate statefulset/postgres-8670 create Pod postgres-8670-0 in StatefulSet postgres-8670 successful
48m Normal ProvisioningSucceeded persistentvolumeclaim/postgres-8670 Successfully provisioned volume pvc-ea8ab3e0-2ed5-40bd-8456-a0707a5f4b18
存储类也是标准的...
(⎈|rosalyn:gateway)➜ ~ kc get sc standard
NAME PROVISIONER RECLAIMPOLICY VOLUMEBINDINGMODE ALLOWVOLUMEEXPANSION AGE
standard (default) kubernetes.io/gce-pd Delete Immediate true 370d
我找不到一个问题来解决,除了它不会像它应该的那样扩展节点。有人知道去哪找吗?
编辑:我和GCP支持部门谈过了,我们在这方面进行了深入研究。事实证明,每次我们创建PV时都会得到这个错误。创造和结合都很好。所以还在跟进这部分。
但是,虽然它导致集群在UI上显示错误,说它不能扩展,但它扩展得很好。我认为这不是因为我创建了一个新的节点组,具有最小数量的节点,并且它位于0。原来min是指它将缩小到的min,而不是它将扩大到的min。
我们将看看他们是否可以解释为什么在PV创建工作时会发生错误。
1条答案
按热度按时间gev0vcfq1#
根据您提供的日志和信息,不进行扩展的主要原因是“pod已解除绑定即时PersistentVolumeClaims”。如果pod具有未绑定的立即PVC,则autoscaler认为该pod不可重定向。然而,您已经提到PVC实际上是有界的,这意味着可能存在不匹配或配置问题。
有很多点需要检查,比如GKE的版本,因为在1.22之前的版本中存在自动缩放的已知问题。[1]还需要考虑如果您使用动态卷配置,PVC创建和卷配置绑定到PVC之间可能会有延迟。引用PVC的pod被认为是不可扩展的,可能是导致自动缩放的原因之一。最后,仔细检查群集自动缩放器配置和日志。这可能是值得第二次寻找更多的症状。附件中有一些好的阅读材料,可能对你的用例有所帮助。
[1]https://cloud.google.com/kubernetes-engine/docs/concepts/cluster-autoscaler#known_issues
[2][https://kubernetes.io/docs/concepts/storage/dynamic-provisioning/](https://kubernetes.io/docs/concepts/storage/dynamic-provisioning/)
[3][https://kubernetes.io/docs/concepts/storage/storage-classes/](https://kubernetes.io/docs/concepts/storage/storage-classes/)