Kubernetes集群node无法访问service:kube-proxy没有正确设置cluster-cidr

异常机器上的kube-proxy缺失参数--cluster-cidr,pod的网段和service的cluster ip不是一个网段... more

Linux关闭swap失败,swapoff failed: cannot allocate memory

执行swapoff -a关闭swap的时候,报不能分配内存的错误:swapoff failed: Cannot allocate memory... more

Kubernetes集群node上的容器无法ping通外网:iptables snat规则缺失导致

kubernets集群问题node上缺失了一条iptables snat规则,导致node上所有容器不能访问外网iptables -t nat -A POSTROUTING -s 10.12.9.138/26 ! -o docker0 -j MASQUERADE... more

Kubernetes问题调查:failed to get cgroup stats for /systemd/system.slice

summary.go:92] Failed to get system container stats for "/systemd/system.slice" cgroup stats... more

Kubelet1.7.16使用kubeconfig时,没有设置--require-kubeconfig,导致node不能注册

“因为没有指定apiservers,所以node状态不会上报”,用kubeconfig文件就不能上报node状态了??... more

Kubelet从1.7.16升级到1.9.11,Sandbox以外的容器都被重建的问题调查

kubelet从1.7.16升级到1.9.11,重启时,sandbox以外的容器会被重建,Container定义变化导致的... more

Mac系统升级后,Vim的UltiSnip插件出错:Error No module named UltiSnips

mac升级后,vim中ultisnips的插件的不能用了,键入字符时弹出下面的错误`No module named UltiSnips`... more

docker的storage-driver是overlay2时,限制单个容器可占用的磁盘空间

使用overlay2时要限制单个容器的可占用空间,需要使用xfs文件系统... more

火焰图生成工具nginx-systemtap-toolkit使用时遇到的问题

stapxx是一套封装了stap命令的perl脚本,可以抓取nginx,以及系统上其它进程的调用栈... more

curl能访问的url,通过blackbox-expoeter进行探测时,返回404

有一个url,直接用curl进行访问,返回200 OK,但是通过blackbox访问时,返回404... more

Kubernetes: 内核参数rp_filter设置为Strict RPF,导致Service不通

网络方案是flannel,从node上直接用telnet访问Service的服务地址(IP 端口),不通... more

keepalived的vrrp多播报文被禁,导致VIP同时位于多个机器上

原本好好的vip,突然同时存在于两个机器上了,发现是默认用的多播被禁了,需要换成单播... more

Kubernetes使用过程中遇到的一些问题与解决方法

这里记录Kubernetes使用过程中遇到的一些比较的问题与解决方法... more

Kubernetes1.12从零开始(零):遇到的问题与解决方法

这里记录Kubernetes1.12从零开始的过程中遇到的一些问题与解决方法。... more

API网关Kong学习笔记(零):使用过程中遇到的问题以及解决方法

这里记录使用Kong时遇到的问题,以及找到的解决方法... more

CentOS Local设置,消除告警:warning: Setting locale failed

经常遇到Setting locale failed.问题,虽然不影响命令运行,但是总是出现warning,比较烦:... more

Prometheus(普罗米修斯)使用过程中遇到的问题

prometheus是最近几年开始流行的一个新兴监控告警工具,特别是kubernetes的流行带动了prometheus的应用。... more

超级账本HyperLedger:Fabric 1.2.0使用时遇到的问题

HyperLedger Fabric 1.2.0使用过程中遇到的一些问题。... more

Kubernetes集群节点被入侵挖矿,CPU被占满

kubelet漏洞导致不需要任何认证就可以到容器中执行命令,通过这种方式可以在任意一个容器中安装恶意程序。... more

超级账本HyperLedger:Fabric的Chaincode开发过程中遇到的问题

这里记录在开发ChainCode的过程中遇到的一些问题,以及解决方法。... more

超级账本HyperLedger:Fabric Node.js SDK使用时遇到的问题

这里记录使用HyperLedger Fabric的nodejs sdk时遇到的一些问题... more

超级账本HyperLedger:Fabric Golang SDK使用时遇到的问题

这里记录使用HyperLedger Fabric的golang sdk时遇到的一些问题... more

kubernetes的node上的重启linux网络服务后,pod无法联通

在node上重启网络(执行`systemctl restart network`)后,pod无法联通... more

超级账本HyperLedger:Fabric部署过程时遇到的问题汇总

这里记录部署hyperledger fabric时遇到的一些问题... more

Calico的hostendpoint的IP地址为空,导致felix退出

calico... more

容器中运行的haproxy的端口复用问题再解决

使用haproxy代理的部分http服务突然不能访问,一直没有数据返回。... more

haproxy的配置文件存在重复项目,导致reload失败,新规则未生效

... more

calico-cni使pod的删除反复重试,statefulset创建的pod被调度到以往的node上后,静态arp丢失,无法联通

终于找到pod的网关静态arp丢失,calico中的workloadendpoint丢失的原因了... more

calico的ipam的数据混乱,重建ipam记录

自从上次系统升级之后,kubernetes故障频出,大部分都是网络问题。... more

calico node重启时路由同步信息延迟高达4分钟

kubernetes有100个node,1416个pod,重启node上的calico时,路由同步时间高达4分钟... more

kubernetes的pod因为同名Sandbox的存在,一直无法删除

kubernetes版本为1.7.6,用kubectl删除pod后,pod一直处于Terminating的状态... more

grpc服务调用,首次建立连接后首次请求超时

用户反映在kubernetes平台上使用自主开发的微服务系统(使用grpc调用),经常出现timeout的情况。... more

kubelet升级,导致calico中存在多余的workloadendpoint,node上存在多余的veth设备

有一个pod容器,无法对外访问,发现容器内的arp记录缺失... more

使用petset创建的etcd集群在kubernetes中运行失败

使用petset在kubernetes中创建的etcd集群,运行一段时间后一个成员异常... more

unable to create nf_conn slab cache导致容器启动失败

kubernetes集群的一台node上容器启动失败,日志显示... more

容器内部的go程序没有使用/etc/hosts中记录的地址

运行在容器内的go程序发起http请求的时候,没有使用/etc/host中配置的地址... more

ceph:1 full osd(s),整个集群不可用的问题

一个osd使用超过95%,导致整个ceph集群不可用。... more

未在calico中创建hostendpoint,导致开启隔离后,在kubernetes的node上无法访问pod

在calico上开启policy后,node无法访问pod... more

使用端口复用(SO_REUSEPORT)、反复对haproxy进行reload操作,导致访问haproxy间歇性返回"503"

运行一端时间后会出现client连接haproxy间歇性失败的情况,重启haproxy后恢复... more

服务器存在较多的FIN_WAIT1和TIME_WAIT状态的连接

发现linux服务器上的FIN_WAIT1状态的连接持续很长时间... more

ios以及safari中的pre标签设置overflow后,不显示水平滚动条

ios和safari中,为`pre标签`设置了overflow:auto,没有产生水平滚动条... more

连接haproxy间歇性失败的问题调查

运行一端时间后会出现client连接haproxy间歇性失败的情况,重启haproxy后恢复... more

haproxy返回的http头中没有keep-alive

用户反应得到的http响应头中没有keep-alive,调查发现... more

calico路由丢失问题的调查

kubernetes中的一个pod访问一个service的时候,时不时的出现timeout,经查发现是BGP连接故障,路由缺失。... more

calico分配的ip冲突,pod内部arp记录丢失,pod无法访问外部服务

使用calico的kubernetes集群中,pod断网的问题调查... more

kubernetes的dnsmasq缓存查询结果,导致pod偶尔无法访问域名

在kubernete的pod中,访问域名`repo1.maven.org`的时候,发现无法访问。... more

目录被其它的容器挂载使用,导致已经退出的容器无法被删除

docker: unable to remove filesystem for 593d8...... more

k8s: rbd image is locked by other nodes

k8s中rbd image is locked by other nodes的问题排查... more

kuberntes的node无法通过物理机网卡访问Service

在kubernetes的一台物理机上访问service的clusterIP,没有响应,经过调查发现通过物理机的网卡无法访问服务。... more

vagrant: /sbin/mount.vboxsf mounting failed with the error: No such device

vagrant /sbin/mount.vboxsf: mounting failed with the error: No such device... more

docker搜索其它registry中的镜像

docker搜索其它registry中的镜像... more

cannot change locale (UTF-8): No such file or directory

cannot change locale (UTF-8): No such file or directory... more

QQ交流群

区块链实践互助QQ群:576555864

Kubernetes实践互助QQ群:947371129

Prometheus实践互助QQ群:952461804

Kong/Envoy实践互助QQ群:952503851

Ansible实践互助QQ群:955105412

Copyright @2011-2019 All rights reserved. 转载请添加原文连接,合作请加微信lijiaocn或者发送邮件: [email protected],备注网站合作 友情链接: lijiaocn github.com