【事故案例】企业机房断电后无法连接ESXI内部虚拟机
一次企业机房断电导致ESXI内部虚拟机无法连接的故障排查经历。问题原因是短了一次电,企业网络人员缺乏服务器连接信息。排查过程中发现虚拟机Ping通不同,经过层层分析定位到核心交换机策略阻拦的问题。最终,调整ACL策略解决了通讯问题。总结中强调先审视问题、逐层排查并提供技巧:内网Ping网关、解决终端到网关通路、查看服务器接口地址表。这次故障排查提供了宝贵经验。
运维
未读
记一次实验环境事故-磁盘被占满
在实验环境中,使用 dify 进行测试时发现 RagFlow 容器出现了问题,导致无法链接后端知识库。经排查发现容器状态异常,日志显示 Redis 容器存在问题,同时根目录空间不足20K。经检查,发现是 Docker 容器占用过大,关闭 RagFlow 容器后空间恢复正常。建议考虑为 RagFlow 单独分配 500G 磁盘空间进行存储,或修改 Docker 存储路径以避免根目录扩容。