基于多模型组合的类别不平衡海洋数据质量控制方法
全文请用PC端下载 地址:
http://www.hyyb.org.cn/Magazine/Show.aspx?ID=3564
读书小笔记
作者:宋巍 张贵庆 谢京容 董明媚 岳心阳 杨扬
单位:1. 上海海洋大学信息学院, 上海 201306;
2. 国家海洋信息中心, 天津 300171
分类号:P731.11
出版年·卷·期(页码):2024·41·第三期(61-70)
摘要:提出一种多模型组合的两层海洋数据质量控制框架,选择了多种常见分类算法作为基学习器对数据质量标签进行初级预测,再经过投票法或堆叠(Stacking)法确定海洋数据质量的标识符;针对类别不平衡问题,结合自适应下采样策略,降低数据的不平衡比率,并结合Focal Loss损失函数,提升模型对难分类样本的识别能力。以来源于国际综合海洋大气数据集的海表温度和气温数据为例进行质量控制验证,结果表明:投票法或堆叠法对极少类的错误样本分类的 F1 score(精确率和召回率的加权调和平均值)在海表温度数据上可达到0.980 6和0.981 2,在气温数据上可达到0.9985和0.9983。
关键词:质量控制 海洋气象数据 集成学习 类别不平衡
Abstract:This paper proposes a two-layer framework for ocean data quality control based on the combination of multiple models. Various common classification algorithms are chosen as base learners to predict the primary quality labels of ocean data, and a Voting or Stacking strategy is used to identify the quality of the data. To address the issue of class imbalance, an adaptive undersampling strategy is combined with the Focal loss function to enhance the model's ability to recognize difficult samples. To verify the performance of the proposed method, we apply it to the quality control of sea surface temperature and air temperature data that are from ICOADS (International Comprehensive Ocean-Atmosphere Data Set). The results show that the F1 score (the weighted harmonic mean of precision and recall) of rare anomaly samples by the Voting or Stacking methods can reach 0.980 6 and 0.981 2 for sea surface temperature data, and 0.9985 and 0.9983 for air temperature data.
Key words:quality control; ocean-atmosphere data; ensemble learning; class imbalance
读者也可以通过公众号菜单栏
“相关知识”板块进入《当期目录》和《过刊浏览》
查阅详细期刊内容
未来两天海洋环境预报
预计明天,
渤海、黄海、东海北部有0.5到0.9米的轻浪;
东海南部、钓鱼岛附近海域、台湾以东洋面、巴士海峡有1.1到1.4米的轻浪到中浪;
台湾海峡有0.5到0.8米的轻浪;
南海有0.8到1.3米的轻浪到中浪;
北部湾有0.7到1.0米的轻浪。
预计后天,
我国近海无大浪区。
8月5~9日西北太平洋海浪数值预报
美丽海岛海域海况
预计明天,
永暑礁附近海域有1.3米的中浪,较适宜乘船出行;
我国其他美丽海岛附近海域都是轻浪,海况不错,非常适宜乘船出行和海岛游玩。
美丽海岛是指以下的35个海岛:
觉华岛、长山群岛、菩提岛、长岛、刘公岛、灵山岛、秦山岛、连岛、崇明岛、嵊泗列岛、岱山岛、东极岛、普陀山、大陈岛、玉环岛、洞头岛、南麂岛、嵛山岛、三都岛、平潭岛、湄洲岛、东山岛、钓鱼岛、南澳岛、万山群岛、川山群岛、海陵岛、南三岛、东海岛、涠洲岛、分界洲岛、蜈支洲岛、永兴岛、黄岩岛、永暑礁。
更多滨海旅游预报 尽在中国海洋预报
PC端可登录中国海洋预报网http://www.oceanguide.org.cn
移动端可使用中国海洋预报微信小程序
进入“中国海洋预报”微信小程序
进入“全球海啸预警”微信小程序