Page 97 - 腐蚀与防护2024年第十一期
P. 97

王明达, 等: 城镇燃气管道腐蚀失效逻辑回归预测模型的构建与应用


   造的一款人工智能云计算平台, 提供包含数据标注、                                p
                                                      ln       = β 0+ β 1 X 1+ β 2 X 2+ …  + β k X k  ( 10 )
   模型构建、 模型训练、 模型部署、 推理优化在内的 AI                          1-p
   开发全链路服务, PAI平台集成了大量稳定的机器                          式中: 为常量, , ,…, 为回归系数。
                                                                             β k
                                                                    β 1 β 2
                                                          β 0
   学习算法组件。其可视化的建模方式, 为开发者提                                根据公式( 2 ) 可得
                                                               (
   供了低门槛、 高性能的云原生 AI 工程化能力。                                ex p β 0+ β 1 X 1+ β 2 X 2+ …  + β k X k )
                                                     p=                                        ( 11 )
                                                                (
   2.3 逻辑回归算法                                            1+ex p β 0+ β 1 X 1+ β 2 X 2+ …  + β k X k )
     在城镇燃气管道失效预测中, 管道失效发生                               利用公式( 3 ) 可以定量预测燃气管道失效的概
   与否可以被看作一个二值变量, 而逻辑回归算法                            率, 从而达到预防燃气管道失效的目的。
   的因变量实质上是一个二值分类因变量, 所以作                            2.4 管道失效预测模型的构建流程
   者通过建立逻辑回归模型对城镇燃气管道的失效                               管道失效预测模型的构建流程如图5所示。利
   风险进行预测。逻辑回归算法是机器学习中比较                             用 PAI 平台进行模型的构建, 具体操作步骤如下:
   常用的一种用于分类的监督学习算法                   [ 18 ] 。利用逻
   辑回归算法可以预测在不同的影响因素下, 某种
   情况发生的概率。构建逻辑回归模型的核心是结
   合已经获得的样本数据, 在有限时间内进行训练,
   获得回归系数, 在确保良好的学习效果的基础上,
   使得逻辑回归模型具备较好的预测能力。考虑到
   燃气管道失效影响因素是非连续变量, 作者使用
   逻辑回归中的逻辑回归二分类模型                 [ 19 ] 搭建燃气管
                                                                       图5 建模流程
   道失效预测模型。                                                         Fi g .5 Modellin gp rocess

       假设在燃气管道失效影响因素的作用下, 管道                              第一步, 进行数据读取, 将搜集的数据上传到云
   失效的概率为       p , 其取值范围为 0~1 , 则管道不失               环境 中。 PAI 平 台 的 数 据 储 存 在 阿 里 云 的
                   ,/(
   效的概率为1- p p 1- p         ) 为燃气管道失效的逻              DataWorks 管理控制台中, 在 DataWorks中完成相应
                                         , ,…,
                                                     的表结构设计后, 如图6所示, 将数据导入控制台, 完
   辑回归值。取自然对数, 其中, 自变量 X 1 X 2
      为影响管道失效的因素, 如管道压力、 埋深、 土
   X k                                               成存储。存储在 DataWorks中的数据可以在 PAI 平
   壤腐蚀性等因素, 因变量为 , 则逻辑回归函数可以                         台中直接利用读数据表组件进行跨项目读取, 从而完
                           p
   表示为
                                                     成数据读取。













                                             图6 数据表结构

                                          Fi g .6 Datatablestructure
     第二步, 进行数据预处理, 主要包括数据清洗、 缺                       为 L415N 和 L415M , 可以用0表示 L415N , 用1表
   失值填充以及类型变换等操作。因为每个样本的状态                           示 L415M 。

   只考虑失效或未失效, 所以燃气管道失效模型的预测                               ( 2 )多值类数据: 以土壤腐蚀性字段为例, 有
   也可以归属于分类问题。本研究中输入数据包括8个                           弱、 中、 强三个等级( 划分依据), 由弱到强可以依次
   特征列和1个目标列, 在数据预处理的过程中, 需要根                        映射为0~2的数值。
   据每个字段的含义将字符类型转换为数值类型。                                  数据处理的结构化查询语言( SQL ) 脚本如图7

       ( 1 )二值类数据: 以管道材料字段为例, 其取值                    所示。
                                                                                            · 8  ·
                                                                                               9
   92   93   94   95   96   97   98   99   100   101   102