Skip to content

关于容器异常终止的重新调度 #9

@sunyi00

Description

@sunyi00

现在咱们的策略是否是尝试 3 次,之后放弃?

如果是这样的话,能否给一个 callback 配置,在放弃时可以 post 一下信息?

关于容器状态报警,这个事情的本质应该是这样的:

deployd 的责任是判断当前状态是否和预期的状态(spec)一致(例如 instance 数),如果不一致,则尽可能调整当前状态,使之于 spec 一致。

所以,对于报警,策略应该是:对于和 spec 不一致的状态,均认为是异常,进行报警。通过 retry 和 check_interval 来给 deployd 足够的时间尝试修复。在指定时间内 deployd 未能成功修复的,则应响亮的报警出来。

--by hongqn

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions