mesos是不是有参数禁止slave重启的时候不重启该节点上比如marathon跑的服务


发现slave有时运行不稳定,可能是slave和master间通信问题,导致slave重启。但重启后Marathon会把该节点上的服务迁移到其它机器,影响正常使用。而其实此时应用并非无法访问,所以是不是应该有这样的一个错误容忍度的控制。
已邀请:

徐磊 - BlackOps@Qunar

赞同来自:


暂时没有看到这种配置,想了想Mesos和Framework之间的沟通方式,感觉即使提供了这样的功能,调度也比较难。

毕竟Marathon重新调度task到其他机器上,是因为statusUpdate接口被调用(意味着task的状态从RUNNING变更成了其他的,也许是FINISHED,也许就是FAILED或LOST了),比较难快速的定位到是什么原因导致了这次状态变更。

如果非要做这种限制的话,用Marathon的Constraints也能规避重新调度的问题,但是万一赶上机器挂了咋办。

建议将重新调度的能力交给Marathon。

jxcdwangtao

赞同来自:


你确定 “slave重启后Marathon会把该节点上的服务迁移到其它slave” 吗?

要回复问题请先登录注册