nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo journalinfonormal searchdiv searchzone qikanlogo popupnotification paper paperNew
2025, 06, v.46 545-551
基于随机森林及K-means++对玻璃文物的成分分析与鉴别
基金项目(Foundation): 教育部产学合作协同育人项目(20250104122611)
邮箱(Email): 2782585904@qq.com.;
DOI: 10.15923/j.cnki.cn22-1382/t.2025.6.09
摘要:

实验主要以是否风化的高钾、铅钡硅酸盐玻璃为研究对象,针对风化前后玻璃纹饰、类型以及颜色的关系,使用Kendall tau系数及其P值探究之间的相关性和差异性,其中,纹饰和类型与风化系数分别为-0.003 6和-0.344,颜色与风化系数为0.121。对于分类模型,建立随机森林(Random Forest, RF)及K-means++算法,使用网格寻优对RF超参数进行调节,以此来获得影响样本分类的7个重要指标进行数据降维,对降维的数据使用K-means++算法,结合“肘”部图对类别进行选择,实验以铅钡玻璃为例,得出其可分为5个类。对于预测模型建立基于梯度下降的多因素Logistic回归模型,使用梯度下降思想,对Logistic回归模型的β参数进行迭代寻找,模型的准确率和ROC曲线均为1。利用LIME模型,扰动1%~10%的数据,发现预测模型合理且稳定。为后续研究古代硅酸盐玻璃是否风化、分类和预测提供一定的参考价值。

Abstract:

In this paper, the Kendall tau coefficient and its P value were used to explore the correlation and difference between the glass ornamentation, type and color before and after weathering, in which the ornamentation, type and weathering coefficient were -0.003 6 and -0.344, and the color and weathering coefficient were 0.121. For the classification model, the Random Forest(RF) and K-means++ algorithm are established, and the RF hyperparameters are adjusted by grid optimization, so as to obtain 7 important indicators affecting the classification of the sample, the data dimensionality is reduced, the K-means++ algorithm is used for the dimensionality reduction data, and the categories are selected in combination with the "elbow" part diagram, and the experiment takes lead barium glass as an example, and it is concluded that it can be divided into 5 categories. For the prediction model, a multivariate logistic regression model based on gradient descent is established, and the parameters of the logistic regression model are iteratively searched for by using the gradient descent idea, and the accuracy and ROC curve of the model are 1. Using the LIME model, 1%~10% of the data are disturbed, and the prediction model is found to be reasonable and stable. It provides certain reference value for subsequent research on whether ancient silicate glass is weathered, classified and predicted.

参考文献

[1] 黄小娇.中国国家博物馆藏中西方古代玻璃器比较研究[J].文物天地,2023,381(3):86-91.

[2] 王承遇,陶瑛.硅酸盐玻璃的风化[J].硅酸盐学报,2003(1):78-85.

[3] 陶瑛,薄学微,王承遇.钡磷酸盐光学玻璃风化的研究[J].硅酸盐学报,1996(4):53-57.

[4] 周艳艳,王新伟,裴春燕.影响光学玻璃化学稳定性测定结果的因素分析[J].长春理工大学学报(自然科学版),2007(1):95-97.

[5] 张智恒,夏一凡,舒文豪,等.古代玻璃制品的成分分析与种类鉴别[J].中国科技期刊数库工业(A),2023(1):4-8.

[6] 张帅凡,孙瑞娟,任涵卓.古代玻璃制品的化学成分分析与相关性研究[J].化工管理,2023(8):41-44.

[7] 李青会,周虹志,贵教珍,等.一批中国古代玻璃珠化学成分的检测报告[J].江汉考古,2005,4:81-88.

[8] 周志华.机器学习[M].北京:清华大学出版社,2016:33-37.

[9] 路佳佳.基于集成特征选择和随机森林的古代玻璃分类模型[J].硅酸盐学报,2023,51(4):1060-1065.

[10] 郝强.基于深度学习的手机玻璃盖板缺陷检测研究[D].广州:华南理工大学,2021.

[11] 王祉皓,赵芗溦,李智群,等.基于机器学习的风化硅酸盐玻璃原成分预测及亚分类方法[J].硅酸盐学报,2023,51(2):416-426.

[12] 张会刚,朱庆山.遗传算法GA结合BFGS预测玻璃组成[J].计算机与应用化学,2003,20(3):5-8.

[13] 赵美言,胡涛,张玉虎,等.基于机器学习模型的海河北系干旱预测研究[J].干旱区地理,2020,43(4):9-11.

[14] 张小云,康晓霞.基于决策树算法的网络入侵检测系统设计与评估[J].信息技术,2023,47(2):117-122.

[15] 张炳华,张镱锂,谷昌军,等.基于随机森林与特征选择的藏东南土地覆被分类方法及精度评价[J].地理科学,2023,3:1-10.

[16] 方诗乔,胡佩玲,黄莹莹,等.K-means算法的优化及应用[J].现代信息科技,2023,7(6):111-115.

[17] 张蓓蓓,胡敏.基于网格搜索改进随机森林的顾客满意度预测[J].北京信息科技大学学报(自然科学版),2021(4):25-30.

[18] 王昕.梯度下降及优化算法研究综述[J].电脑知识与技术:学术交流,2022(8):71-73.

[19] 李桂琴,邹若飞.肺磨玻璃结节胸部CT影像特征及恶性Logistic多因素预测模型构建研究[J].影像研究与医学应用,2022,6(18):59-61.

[20] 林志萍,杨立洪.基于LIME的改进机器学习可解释性方法[J].数据挖掘,2021,11(2):12-15.

[21] 黄艺龙,秦小林,陈芋文,等.利用LIME对脓毒症预测模型进行可解释性分析[J].计算机应用,2021,41(S1):332-335.

[22] 曹杰,邵笑笑.基于信息增益和Bagging集成学习算法的个人信用评估模型研究[J].数学的实践与认识,2016,46(8):90-98.

[23] 路菡.基于违约状态显著判别的批发零售小企业信用评价研究[D].咸阳:西北农林科技大学,2022.

[24] 王丽,王涛.极端梯度提升改进的森林优化特征选择算法[J].长春工业大学学报,2024,45(4):377-384.

[25] 张丽艳,李洪,陈树彬,等.玻璃的成分和性质的模拟方法[J].硅酸盐学报,2022,50(8):2338-2350.

[26] 孙林,刘梦含,徐久成.基于优化初始聚类中心和轮廓系数的K-means 聚类算法[J].模糊系统与数学,2022,36(1):47-65.

基本信息:

DOI:10.15923/j.cnki.cn22-1382/t.2025.6.09

中图分类号:TP181;K876.5

引用信息:

[1]刘振文,何彭.基于随机森林及K-means++对玻璃文物的成分分析与鉴别[J].长春工业大学学报,2025,46(06):545-551.DOI:10.15923/j.cnki.cn22-1382/t.2025.6.09.

基金信息:

教育部产学合作协同育人项目(20250104122611)

发布时间:

2025-12-04

出版时间:

2025-12-04

检 索 高级检索

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文