## 现象 1. 在用户完整部署 ModelEngine 的场景下,单独重启数据库实例,重启完成之后,在 Python Runtime 上运行的 Code 节点会无法调用。 2. 重启 Code 节点所在的 Python Runtime 之后,一切恢复正常。 ## 分析 1. 无法调用 Code 节点,推测在注册中心中,该服务已经下线 2. 因为注册中心的持久化数据目前强依赖数据库服务,当数据库重启时,存在短时间心跳断链的情况,正常情况下,各个 Runtime 可以在心跳恢复后重新注册上,也就是说,正常情况下,调用失败应该也是偶发,是可以自恢复的 3. 但是当前情况下,Python Runtime 没有自恢复,推测 Python Runtime 在心跳逻辑中可能存在 bug