上行超时(110:连接超时)在Kubernetes Ingress上

nimxete2  于 2023-06-21  发布在  Kubernetes
关注(0)|答案(1)|浏览(234)

我已经设置了我的Kubernetes集群,作为设置的一部分,我已经设置了一个入口规则来将流量转发到Web服务器。

---
apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: alpha-ingress
  annotations:
    kubernetes.io/ingress.class: nginx
    certmanager.k8s.io/cluster-issuer: letsencrypt-prod
spec:
  tls:
    - hosts:
        - alpha.example.com
      secretName: letsencrypt-prod
  rules:
    - host: alpha.example.com
      http:
        paths:
          - backend:
              serviceName: web
              servicePort: 80

最后浏览器超时,出现504错误,在Ingress日志中我看到
2019/01/27 23:45:38 [错误] 41#41:* 4943上行超时(110:连接超时),同时从上游读取响应标头,客户端:www.example.com,server:www.example.com,request:"GET/HTTP/2.0",upstream:10.131.24.163"alpha.example.com"alpha.example.com, request: "GET / HTTP/2.0", upstream: " http://10.244.93.12:80/ ", host: "alpha.example.com"
我在那个IP地址上没有任何服务…

╰─$ kgs --all-namespaces                                                                                                                                                                                                                                                  130 ↵
NAMESPACE       NAME                            TYPE           CLUSTER-IP       EXTERNAL-IP      PORT(S)                      AGE
default         database                        ClusterIP      10.245.181.187   <none>           5432/TCP                     4d8h
default         kubernetes                      ClusterIP      10.245.0.1       <none>           443/TCP                      9d
default         user-api                        ClusterIP      10.245.41.8      <none>           9000/TCP                     4d8h
default         web                             ClusterIP      10.245.145.213   <none>           80/TCP,443/TCP               34h
ingress-nginx   ingress-nginx                   LoadBalancer   10.245.25.107    <external-ip>   80:31680/TCP,443:32324/TCP   50m
kube-system     grafana                         ClusterIP      10.245.81.91     <none>           80/TCP                       6d1h
kube-system     kube-dns                        ClusterIP      10.245.0.10      <none>           53/UDP,53/TCP,9153/TCP       9d
kube-system     prometheus-alertmanager         ClusterIP      10.245.228.165   <none>           80/TCP                       6d2h
kube-system     prometheus-kube-state-metrics   ClusterIP      None             <none>           80/TCP                       6d2h
kube-system     prometheus-node-exporter        ClusterIP      None             <none>           9100/TCP                     6d2h
kube-system     prometheus-pushgateway          ClusterIP      10.245.147.195   <none>           9091/TCP                     6d2h
kube-system     prometheus-server               ClusterIP      10.245.202.186   <none>           80/TCP                       6d2h
kube-system     tiller-deploy                   ClusterIP      10.245.11.85     <none>           44134/TCP                    9d

如果我在ingress pod上查看resolv.conf文件,它会返回它应该返回的内容……

╰─$ keti -n ingress-nginx nginx-ingress-controller-c595c6896-klw25 -- cat /etc/resolv.conf                                                                                                                                                                                130 ↵
nameserver 10.245.0.10
search ingress-nginx.svc.cluster.local svc.cluster.local cluster.local
options ndots:5

dig/nslookup/host在该容器上不可用,但是如果我创建一个简单的busybox示例,它会获得相同配置的正确IP:

╰─$ keti busybox -- nslookup web
Server:    10.245.0.10
Address 1: 10.245.0.10 kube-dns.kube-system.svc.cluster.local

Name:      web
Address 1: 10.245.145.213 web.default.svc.cluster.local

有人能告诉我下一步该做什么吗?

    • 更新#1**

下面是web的配置,如注解中所要求的。我还在研究为什么不能在集群内使用busybox直接从web获取wget中的任何内容。

apiVersion: v1
kind: Service
metadata:
  labels:
    io.kompose.service: web
    app: web
  name: web
spec:
  ports:
  - name: "80"
    port: 80
    targetPort: 80
  - name: "443"
    port: 443
    targetPort: 443
  selector:
    io.kompose.service: web
status:
  loadBalancer: {}
---
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  labels:
    app: web
  name: web
spec:
  replicas: 1
  strategy:
    type: RollingUpdate
  selector:
    matchLabels:
      app: web
  template:
    metadata:
      labels:
        io.kompose.service: web
        app: web
    spec:
      containers:
      - image: <private docker repo>
        imagePullPolicy: IfNotPresent
        name: web
        resources: {}
      imagePullSecrets:
      - name: gcr
status: {}
    • 更新2**

根据Michael在下面的评论,它为web解析的IP地址是它的端点之一:

╰─$ k get endpoints web                                                                                                                                                                                                                                                   130 ↵
NAME      ENDPOINTS                          AGE
web       10.244.93.12:443,10.244.93.12:80   2d
ybzsozfc

ybzsozfc1#

所以,这一切都归结为php-fpm服务没有任何端点,因为我错误地配置了服务选择器!
一些眼尖的读者可能已经发现,我的配置最初是从docker-compose配置文件(我的开发环境)的转换,我从那里开始构建。
问题出现了,因为我更改了部署的标签和选择器,但没有更改服务本身。

apiVersion: v1
kind: Service
metadata:
  name: user-api
  labels:
    io.kompose.service: user-api
    app: user-api
spec:
  ports:
    - name: "9000"
      port: 9000
      targetPort: 9000
  selector:
    io.kompose.service: user-api
status:
  loadBalancer: {}
---
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  labels:
    app: user-api
  name: user-api
spec:
  replicas: 1
  selector:
    matchLabels:
      app: user-api
  template:
    metadata:
      labels:
        app: user-api
    spec:
... etc

您可以看到,我仍然使用kompose为我创建的旧选择器io.kompose.service: user-api,而不是更新的app: user-api
我听从了@coderanger的建议,nginx服务有响应,php-fpm服务没有响应。
快速查看Connecting Applications With Services的文档说:
如前所述,服务由一组Pod支持。这些Pod通过端点暴露。服务的选择器将被持续评估,结果将被POST到一个也名为my-nginx的Endpoints对象。
当我检查服务和部署模板的选择器时,我发现它们是不同的,现在它们匹配了,一切都如预期的那样工作。

相关问题