企业级IT运维多Agent自动化平台

通过可视化工作流编排,将多个AI Agent组合成智能运维自动化流水线,实现服务器管理、告警处理、故障诊断、日志分析、脚本管理、定时运维任务的自动化执行,支持豆包/OpenAI双LLM模型。

核心功能特性

强大的功能体系,助力企业IT运维自动化升级

🤖

多Agent管理

支持创建、管理自定义运维Agent,提供9个预设运维Agent模板,覆盖告警处理、故障诊断、日志分析等核心场景

🔄

可视化工作流

拖拽式工作流编排,支持并行、串行、条件分支,轻松构建复杂运维流程自动化

📊

实时监控

WebSocket实时推送任务执行进度,高亮当前执行节点,支持暂停、继续、取消任务

🖥️

服务器管理

添加、管理Linux服务器,支持SSH密码/密钥认证,标签筛选,13项系统合规检查

⌨️

远程命令执行

真实SSH命令执行,命令历史记录,常用命令快捷方式,AES-256加密存储凭证

🚨

告警管理

支持Prometheus/Zabbix/通用Webhook告警接收,实时告警面板,自动匹配触发工作流

📝

脚本中心

脚本上传/下载/编辑/删除,分类和版本控制,参数化执行,安全审核机制,8个预设脚本

💬

Copilot自然语言交互

用自然语言描述运维需求,自动执行,ReAct思维链+工具调用,上下文记忆和多轮对话

定时任务

支持Cron表达式配置定时任务,定时巡检、合规检查,任务历史记录和状态追踪

📚

知识库

22条预设知识条目,增强RAG检索(关键词+语义相关度排序),自动注入LLM对话上下文,支持批量导入/导出

📄

报告生成

工作流执行自动生成Markdown结构化运维报告,支持查看和下载,满足合规审计需求

🔐

通知系统

支持Webhook、邮件、企业微信、钉钉多渠道通知,系统告警和任务完成自动推送

🔐

审计日志

完整记录所有操作日志,包括操作人、IP地址、时间、操作内容,满足企业安全合规要求

界面预览

现代化的深色主题界面设计,专业的IT运维风格

Agent管理界面

Agent管理

管理和监控9个预置运维Agent的状态

Agent管理 状态监控
工作流管理界面

工作流管理

可视化编排运维自动化工作流

工作流 可视化 一键执行
任务执行界面

任务执行

实时监控工作流执行进度和日志

实时监控 日志查看 WebSocket
仪表盘界面

仪表盘

系统概览和关键指标实时展示

数据概览 实时监控 可视化
占位 - 待更新

服务器列表

服务器合规检查

服务器
占位 - 待更新

合规检查

AI自动生成报告

体检

系统架构

从整体架构到技术细节,一览项目全貌

系统架构总览
graph TB subgraph User["👤 用户"] Browser["浏览器"] end subgraph Nginx["🔀 Nginx"] NG["反向代理 + 静态文件"] end subgraph Frontend["🖥️ React 前端"] Pages["18个页面"] Components["通用组件"] Flow["@xyflow/react 工作流编辑器"] WS_Client["WebSocket 客户端"] end subgraph Backend["⚙️ Express 后端"] API["21个路由模块"] Services["15个业务服务"] Middleware["JWT | RateLimiter | ErrorHandler"] WS_Server["Socket.io 实时推送"] end subgraph Store["💾 存储"] SQLite[("SQLite · 25张表
AES-256-GCM加密")] end subgraph Ext["🌐 外部"] LLM["🤖 豆包 / OpenAI"] SSH["🖥️ SSH 服务器"] Alert["🚨 Prometheus / Zabbix"] Notify["📬 邮件 / 微信 / 钉钉"] end Browser --> NG --> Frontend NG --> Backend Frontend --> API WS_Client <--> WS_Server Services --> SQLite Services --> LLM Services --> SSH Services --> Notify API --> Alert
功能模块架构
graph LR subgraph Core["🏗️ 核心引擎"] WF["工作流编排引擎
拓扑排序 · 并行/串行/分支"] Agent["Agent 执行引擎
LLM调用 · SSH执行"] RAG["增强RAG检索
关键词+语义排序"] end subgraph Features["📦 功能模块"] Dashboard["📊 仪表盘"] Servers["🖥️ 服务器管理"] Alerts["🚨 告警中心"] Knowledge["📚 知识库"] Copilot["💬 AI Copilot"] Reports["📄 报告系统"] Scheduled["⏰ 定时任务"] Notifications["📬 通知系统"] Audit["🔐 审计日志"] end Core --> Dashboard Core --> Servers Core --> Alerts Core --> Knowledge Core --> Copilot Core --> Reports Core --> Scheduled Core --> Notifications Core --> Audit
工作流执行数据流
sequenceDiagram participant U as 👤 用户 participant F as 🖥️ React participant W as 📡 WebSocket participant A as ⚙️ Express participant S as 🔧 工作流引擎 participant D as 💾 SQLite participant L as 🤖 LLM API participant SSH as 🖥️ SSH服务器 U->>F: 点击执行工作流 F->>W: 订阅 task:subscribe F->>A: POST /api/tasks/:id/execute A->>S: 启动工作流执行器 S->>D: 创建任务记录 loop 拓扑排序执行每个节点 S->>W: task:node:started S->>L: 发送Agent提示词 L-->>S: AI思考与响应 S->>W: task:node:thinking S->>SSH: 执行SSH命令 SSH-->>S: 命令输出结果 S->>W: task:node:output S->>W: task:node:completed end S->>D: 保存执行结果 S->>S: 生成Markdown报告 S->>W: task:completed W-->>F: 实时推送进度 F-->>U: 显示结果与报告
技术栈分层
graph TB subgraph Deploy["🐳 部署层"] Docker["Docker Compose"] NginxLayer["Nginx Alpine"] end subgraph Present["🎨 表现层"] ReactLayer["React 18 + TypeScript"] Tailwind["Tailwind CSS"] FlowLayer["@xyflow/react"] ZustandLayer["Zustand · React Query"] end subgraph Business["⚡ 业务层"] ExpressLayer["Express 4 + TypeScript"] JWTLayer["JWT · bcrypt"] ScheduleLayer["node-schedule"] end subgraph Comm["📡 通信层"] REST["REST API"] SocketIO["Socket.io"] SSH2Layer["SSH2"] end subgraph Data["💾 数据层"] SQLiteLayer["better-sqlite3"] AESLayer["AES-256-GCM"] end Deploy --> Present Deploy --> Business Present --> Comm Business --> Comm Business --> Data

9个预置运维Agent

开箱即用的Agent模板,覆盖IT运维核心场景

🚨

告警处理Agent

解析告警内容,判断严重程度,提取关键信息

🔍

故障诊断Agent

分析故障原因,给出排查步骤,提供解决建议

📊

日志分析Agent

分析系统日志,识别异常模式,提取关键事件

⌨️

服务器命令执行Agent

真实SSH执行服务器命令,智能识别命令类型

🖥️

自动巡检Agent

自动对多台服务器执行合规检查

🔧

变更执行Agent

安全执行系统命令和变更操作

📝

文档生成Agent

生成故障报告、巡检报告等

🛡️

系统巡检Agent

全面检查服务器系统状态

合规检查Agent

检查系统配置是否符合安全规范

6个预置工作流模板

覆盖常见运维场景,一键执行自动化流程

服务器合规检查

对单台服务器执行13项系统合规检查

系统巡检 合规检查 文档生成
🖥️

多服务器自动化巡检

批量对多台服务器执行巡检任务

自动巡检 合规检查 文档生成
🔍

服务器故障排查与修复

智能排查服务器故障并尝试修复

故障诊断 日志分析 变更执行 文档生成
🔥

服务器告警自动排查

CPU/内存/磁盘告警自动排查处理流程

告警处理 故障诊断 日志分析 系统巡检
🔧

应用服务异常恢复

应用服务异常自动诊断和恢复流程

告警处理 故障诊断 变更执行 文档生成
📋

日常系统巡检

日常系统健康检查并生成巡检报告

系统巡检 日志分析 合规检查 文档生成

技术栈

现代化技术栈,稳定可靠的基础设施

⚛️

React 18

📘

TypeScript

🎨

Tailwind CSS

🔄

React Flow

🟢

Node.js

🚂

Express

💾

SQLite

🔌

Socket.io

🔐

SSH2

🔒

AES-256

🐳

Docker

🚀

Vite

准备好开始了吗?

ITOps Agent Platform 提供开箱即用的IT运维自动化解决方案,支持Docker一键部署,5分钟即可上线

联系我们

欢迎通过以下方式联系我

微信公众号 IT Online
📞
联系电话

16638661634

📧