文档中心 > 容器服务

集群相关常见问题

更新时间:2020/03/12 访问次数:1886

集群创建

1.当前配置确认,RAM授权失败

可能是系统脏数据导致,请在答疑群反馈

 

2.the current zone cn-zhangjiakou-c does not support creating SLB

一直“上一步”,回到集群基本信息设置,别勾选可用区c的交换机,之后再继续往后走

 

3.the vpc already hava public network access

请直接在答疑群反馈,找hangyu

 

4.创建集群报错,再次提交提示cluster name已存在

请直接在答疑群反馈,找hangyu

 

5.提示类似CIDR 网段冲突

首先找到集群使用的VPC的网段,保证Pod以及Service的网段不和VPC网段冲突。

比如VPC网段为192.****,那完全可以设置Pod的Service的网段以172开头的,网页上有提示设置的网段规则,比如分别设置为172.20.0.0/16,172.21.0.0/20。

如果之前创建过集群,那么查看这个集群已经设置好的Pod的Service的网段,然后相应的增加就好,比如分别设置

172.22.0.0/16,172.23.0.0/20

 

6.集群创建成功后,状态为running,为什么看不到之前选择的主机节点?

可能是集群初始化后,异步添加节点失败了,需要手动再添加一下,集群管理-节点列表-添加已有节点

 

7.创建集群第二步,添加已有节点,看不到想选择的机器?

首先,确认下ECS是否和集群的VPC属于同一个

其次,确认下ECS是否已经关联到聚石塔的应用,关联了应用的机器原则上不能添加进集群(机器会被重置)

最后,确实ECS实例的状态,是否过期,是否为running状态

 

8.the snat rule not found in your natgateway configs

首先,VPC必须有出公网能力才能创建集群,请参考 NAT网关解惑

原因:找不到交换机粒度的SNAT条目,说明创建集群第一步中选择的交换机中有没有配置SNAT的

 

9.the vpc do not have public network access, Please try again after configuration

首先,VPC必须有出公网能力才能创建集群,请参考 NAT网关解惑

原因:vpc无法出公网,没有配置SNAT。解决方法:

1)手动配置SNAT,参考 创建集群前的网络建设,然后再提交创建集群;

2)自动配置,创建集群页面勾选“配置SNAT”,勾选提交后会创建一个后付费NAT网关,一个按流量后付费EIP

集群运维

10.添加ECS节点时报错“InstanceSecurityGroupLimitExceeded”

所选ECS已经加入了5个安全组,阿里云限制每台ECS最多加入5个安全组,加入集群需要加入另一个安全组

解决办法,将ECS退出其他安全组,保证加入的安全组数量<=4

 

特别地,如果是下列两种名字开头的安全组,可以直接退出该安全组

11.添加ECS时提示 VPC RouteEntry over quota

VPC路由表超限,找到创建集群使用的VPC,提交阿里云工单,申请一下该VPC下的路由表quota

 

12.添加ECS时提示 Eip over quota 

找到创建集群使用的VPC,提交阿里云工单,申请一下该VPC下的EIP quota

 

13.添加ECS时,无法选择到自己想选的机器

首先,确认下ECS是否和集群的VPC属于同一个

其次,确认下ECS是否已经关联到聚石塔的应用,关联了应用的机器原则上不能添加进集群(机器会被重置)

最后,确实ECS实例的状态,是否过期,是否为running状态

 

14.两台4C8G的机器,能部署几个2C4G的实例?

首先,每台ECS交付到手后,内存会有500-1000M左右折损,8G的机器实际最大容量只有7.5G(7500M)左右;

其次,每台接入到集群后的ECS,会预留额外的800M内存,给集群内部组件以及除开集群外的其他进程使用(这个是为了保证集群中每个节点的稳定性);

再次,每台接入到集群后的ECS,会启用集群节点相关组件,占用 0.35C+100M内存

最后,集群各个核心组件,一共还需要占用1C + 1000M资源,这些资源量会随机地占用集群内机器的资源

 

总之,对于N台ECS的集群来说,

不可调度CPU = N*0.35C + 1C

不可调度内存 = N*500M(折损)+ N* 800M(系统预留)+  N*100M(系统proxy组件占用) + 1000M(集群其他组件)

 

当N=2时,不可调度cpu=1.7c,不可调度内存=4G

资源限制主要在于内存,平均每台机器上可调度的内存大约为6G,极端情况下如果集群各个核心组件都部署在一台ECS上,此时两台机器上可调度内存可能分别为 4.2G,5.8G。

所以两台机器的集群可以部署两个2C4G的容器实例;2C5G的实例至少能部署起来一个;2C6G的实例无法部署

 

15.每台4c8G的机器,只能部署一个2C4G的容器。为什么会有这么多浪费?

如上面一个问题中所述,集群管理ECS,实际可以调度的资源可以认为要比购买规格少2G左右,比如购买4C8G的机器,可以用来部署容器的大约3C 6G(如果你只有一两台机器,可能连一个3C 6G的机器也部署不起来,集群规模太小,可能这台机器被占用了很多资源来运行集群核心组件)。另外,为了稳定性,集群要保证资源水位健康,集群中的机器也不建议跑满。

1)建议买更大规格的机器;10台4C8G的机器,不如买5台 8C16G

2)建议增加节点数量,节点越多,集群自身占用的资源就可以忽略不计,其他的资源都可以被集群调度了

3)建议增加集群中的实例规格类型,大小搭配,可以将集群可调度的资源发挥到最大


很多伙伴会有疑惑,为什么我一台或者两台 2核的机器,集群水位却很高?连1核的容器都部署不起来?

简而言之,机器太少了,资源太少了。由于集群自身需要占用资源,总的大概1.5vCPU 1.5G左右,如果你只有一台机器,那么资源都被集群占用了。后面新加机器就不会了,因为集群的占用基本是固定的。

 

16.关于NAT网关 SLB EIP等云资源问题

1)会创建内网SLB一个,免费。集群api server使用,请不要删除,也不要更改监听配置!!

 

2.1)创建集群时如果勾选“配置SNAT”,且VPC网络内不存在NAT网关,则会创建如下资源

一个后付费的NAT网;一个后付费的弹性公网IP;

 

2.2)创建集群时不勾选“配置SNAT”

如果VPC本身没有手动配置过SNAT,则创建集群会提示失败;

如果VPC本身已经有了SNAT,则可以复用原来的,集群可以成功创建

 

3)对于之前(2020.1.16之前)创建的集群,还会有第二个EIP

这个是用于集群api server的公网ip,理论上无流量费用,可以删除。请答疑群联系杭羽or明涵

注,2020.1.16之前创建的集群才有,之后创建的集群不会有。

FAQ

关于此文档暂时还没有FAQ
返回
顶部