Page 97 - 腐蚀与防护2024年第十一期
P. 97
王明达, 等: 城镇燃气管道腐蚀失效逻辑回归预测模型的构建与应用
造的一款人工智能云计算平台, 提供包含数据标注、 p
ln = β 0+ β 1 X 1+ β 2 X 2+ … + β k X k ( 10 )
模型构建、 模型训练、 模型部署、 推理优化在内的 AI 1-p
开发全链路服务, PAI平台集成了大量稳定的机器 式中: 为常量, , ,…, 为回归系数。
β k
β 1 β 2
β 0
学习算法组件。其可视化的建模方式, 为开发者提 根据公式( 2 ) 可得
(
供了低门槛、 高性能的云原生 AI 工程化能力。 ex p β 0+ β 1 X 1+ β 2 X 2+ … + β k X k )
p= ( 11 )
(
2.3 逻辑回归算法 1+ex p β 0+ β 1 X 1+ β 2 X 2+ … + β k X k )
在城镇燃气管道失效预测中, 管道失效发生 利用公式( 3 ) 可以定量预测燃气管道失效的概
与否可以被看作一个二值变量, 而逻辑回归算法 率, 从而达到预防燃气管道失效的目的。
的因变量实质上是一个二值分类因变量, 所以作 2.4 管道失效预测模型的构建流程
者通过建立逻辑回归模型对城镇燃气管道的失效 管道失效预测模型的构建流程如图5所示。利
风险进行预测。逻辑回归算法是机器学习中比较 用 PAI 平台进行模型的构建, 具体操作步骤如下:
常用的一种用于分类的监督学习算法 [ 18 ] 。利用逻
辑回归算法可以预测在不同的影响因素下, 某种
情况发生的概率。构建逻辑回归模型的核心是结
合已经获得的样本数据, 在有限时间内进行训练,
获得回归系数, 在确保良好的学习效果的基础上,
使得逻辑回归模型具备较好的预测能力。考虑到
燃气管道失效影响因素是非连续变量, 作者使用
逻辑回归中的逻辑回归二分类模型 [ 19 ] 搭建燃气管
图5 建模流程
道失效预测模型。 Fi g .5 Modellin gp rocess
假设在燃气管道失效影响因素的作用下, 管道 第一步, 进行数据读取, 将搜集的数据上传到云
失效的概率为 p , 其取值范围为 0~1 , 则管道不失 环境 中。 PAI 平 台 的 数 据 储 存 在 阿 里 云 的
,/(
效的概率为1- p p 1- p ) 为燃气管道失效的逻 DataWorks 管理控制台中, 在 DataWorks中完成相应
, ,…,
的表结构设计后, 如图6所示, 将数据导入控制台, 完
辑回归值。取自然对数, 其中, 自变量 X 1 X 2
为影响管道失效的因素, 如管道压力、 埋深、 土
X k 成存储。存储在 DataWorks中的数据可以在 PAI 平
壤腐蚀性等因素, 因变量为 , 则逻辑回归函数可以 台中直接利用读数据表组件进行跨项目读取, 从而完
p
表示为
成数据读取。
图6 数据表结构
Fi g .6 Datatablestructure
第二步, 进行数据预处理, 主要包括数据清洗、 缺 为 L415N 和 L415M , 可以用0表示 L415N , 用1表
失值填充以及类型变换等操作。因为每个样本的状态 示 L415M 。
只考虑失效或未失效, 所以燃气管道失效模型的预测 ( 2 )多值类数据: 以土壤腐蚀性字段为例, 有
也可以归属于分类问题。本研究中输入数据包括8个 弱、 中、 强三个等级( 划分依据), 由弱到强可以依次
特征列和1个目标列, 在数据预处理的过程中, 需要根 映射为0~2的数值。
据每个字段的含义将字符类型转换为数值类型。 数据处理的结构化查询语言( SQL ) 脚本如图7
( 1 )二值类数据: 以管道材料字段为例, 其取值 所示。
· 8 ·
9