湖南中科长乐科技商务服务有限公司湖南中科长乐科技商务服务有限公司

实战 | 数智赋能,运维转型——农业银行智能运维建设和应用实践

农业银行以数智赋能推动运维转型,通过构建“数据驱动、引擎赋能、场景导向”的AIOps智能运维体系,实现运维领域的智能化、数字化转型,提升故障预测、异常发现和节点感知能力,降低人工操作风险。 以下从总体思路、体系架构、实践案例及未来展望四方面展开分析:

一、总体思路:问题导向,构建“数据-引擎-场景”闭环

农业银行在智能运维建设中聚焦三大核心问题:

  1. 数据资产化:运维数据分散且标准不一,需通过集中管理实现高效共享。
  2. 分析高效化:依赖手工采集与分析,需通过工具赋能提升数据价值挖掘效率。
  3. 场景落地化:共性痛点缺乏统筹、个性化需求响应慢,需通过场景驱动推动应用。

解决方案

  • 数据先行:建设运维集市,构建“运行-运维-运营”三运指标体系,实现数据沉淀与共享。
  • 引擎赋能:搭建AI+BI双核引擎,提供在线算法设计、模型训练及可视化分析工具。
  • 场景驱动:统筹共性场景(如智能预警、根因分析)与个性化场景(如定制化分析),推动场景落地。

图1 农业银行运维数据分析体系二、体系架构:三层架构支撑智能化运维1. 数据集市:集中管理与统一建模
  • 数据集中:整合变更、事件、配置、监控等6大类运维数据,覆盖全生命周期。
  • 技术支撑:采用Spark、Hadoop、GBase等技术实现低代码、可视化数据处理,支持灵活迭代。
  • 指标体系:构建三运指标体系,规范数据使用流程,通过线上申请、审批机制推动数据治理。
2. 分析引擎:AI+BI双核驱动
  • AI算法引擎:支持组件化算法共享、在线拖拽式设计及模型训练,满足高阶分析需求(如预测性维护)。
  • BI可视化引擎:提供自助建模、多维度钻取及自定义组件,覆盖大部分可视化场景。
  • 全流程管理:通过线上化闭环管理(申请、审批、成果展示)提升分析效率,鼓励科技人员自主分析。
3. 智能场景:经典与个性化结合
  • 经典场景:围绕“事前-事中-事后”思路打造核心场景:

    事前:批量智能预警、潜在风险挖掘。

    事中:智能根因分析、全景洞察视图。

    事后:应用系统画像、健康分析报告。

  • 个性化场景:通过AI/BI引擎提供自助式分析服务,快速响应定制需求(如变更风险评估)。
三、实践案例:场景化应用解决实际痛点1. 业务风险分析:提升故障发现率50%
  • 功能

    业务波动智能检测:基于滑动平均、LightGBM等算法动态生成基线,无需人工配置阈值。

    触发式多维下钻:快速定位异常维度(如省市、渠道)。

    业务视角影响分析:自动评级业务健康度,识别受影响系统范围。

  • 效果:在分布式核心系统全面推广,故障发现率提升50%,粒度更精细、规则更智能。

图2 业务风险分析案例2. 全景洞察视图:压缩异常定位时间至5分钟内
  • 功能

    一站式信息汇聚:通过拓扑图、时间线等创新形式展示全量运维数据。

    海量指标异常检测:相关性分析算法降低检测指标数量,自适应选择检测模型。

    智能根因分析:结合AI算法与专家经验,推荐异常指标或行为。

  • 效果:AI根因定位覆盖全部应用系统,专家经验积累200余条,定位时间压缩至5分钟内。
3. 变更风险评估:遏止生产风险
  • 功能

    变更前:智能生成标签(如影响范围、复杂度),推荐评审重点。

    变更后:分析指标变化,探测变更导致的运行风险。

  • 效果:在试点系统(如手机银行)中多次捕获异常变更,有效遏止生产风险。
四、未来展望:深化体系化服务与大模型应用
  1. 体系化服务能力建设:通过数据服务、算法分析及场景建设能力,全面赋能用户、运维平台及管理过程。
  2. 大模型技术探索:利用大模型的理解、生成能力,加速智能问答、自动控制、辅助分析等场景落地。
  3. 拓宽应用范围:从质量、效率类场景延伸至运维管理、安全管控等领域,构建全域智能运维体系。

农业银行通过“数据-引擎-场景”三位一体架构,实现了运维模式的转型升级,为金融行业智能运维提供了可复制的实践范本。未来,随着大模型技术的深度融合,智能运维将进一步向自动化、智能化方向演进。

赞(75229)
未经允许不得转载:>湖南中科长乐科技商务服务有限公司 » 实战 | 数智赋能,运维转型——农业银行智能运维建设和应用实践