CI 中更新镜像插件错误
此文档说明在 CI 中配置了“更新镜像”插件(Coding CD Deploy)后,发布遇到报错的常见处理方式。主要有两种情况:
- 业务配置错误导致。
- 流程异常卡住的恢复方式。
业务配置错误导致发布失败
插件工作原理:插件会调用 Coding 持续部署功能,启动一个部署流程,更新目标集群中工作负载的镜像(类似 kubectl set image)。之后轮询查看对应工作负载是否有正常启动。
其中部署流程的链接,在日志中 “查看发布详情” 能看到。见图1
如果 CI 中流程报错,或者执行很长时间,超过服务正常启动时间,可以点击日志中 “查看发布详情” 链接,进入部署流程中,查看具体报错原因。并参照部署流程的
常见错误码 进行排查。
当业务配置错误时,部署流程需要报错,属于正常功能逻辑。常见场景举例:
- 目标集群连不上。如安全组配置错误或集群本身就故障连接不上。
- 业务镜像拉取不到。可以进入集群中查看对应 deployment 镜像是否有更新,事件是什么。如没开通公网拉取镜像、镜像密码错误、镜像不存在等
- 新的业务镜像启动失败,镜像本身就启动不起来,需要对应业务的开发,结合 pod 日志排查代码配置等。默认 deployment 超过10分钟没有正常滚动,就会失败。
流程异常卡住的恢复方式
属于已知问题,偶尔会有部署流程卡住不结束的情况。表现为集群中工作负载已经更新完成,但是CI流程和对应部署流程发布单超过30分钟仍未终止。
这种是偶现情况,取消掉部署流程的发布单(如果后续有同名的发布单也一并取消),然后重新触发 CI,重跑即可恢复。
操作步骤如下:
问题反馈 >
2025-01-22最近更新
感谢反馈有用
感谢反馈没用
在阅读中是否遇到以下问题?*
您希望我们如何改进?*
如果您希望得到回复,请留下您的邮箱地址。