运维日志
这里用于记录我平时运维遇到的问题与处理过程,目标是「可复用、可检索、可复盘」。
📚 建议写法(模板)
你可以按下面结构写每一篇日志(新建文件放在 docs/ops/ 下):
- 背景:发生在什么环境(本机/服务器/容器/CI)、影响范围
- 现象:报错信息/日志片段/关键指标
- 排查:尝试了哪些步骤,为什么这么做
- 根因:最终定位到哪里(配置/权限/版本/网络/资源/代码)
- 修复:具体操作与命令(可复制粘贴)
- 验证:如何确认已恢复(监控/测试/回归)
- 复盘:如何避免再次发生(文档化、监控、自动化、预案)
✅ 推荐分类(后续可按需扩展)
- 网络 / DNS / 证书
- Linux 权限 / systemd / 日志
- Docker / 容器 / 镜像
- CI/CD(GitHub Actions 等)
- 性能与资源(CPU / 内存 / 磁盘 / I/O)
- 可观测性(监控、日志、告警)
➕ 下一步
当你写第一篇日志时,我可以顺手把侧边栏做成「按分类分组」或「按时间归档」两种风格之一。