近期,太原科技大学屈彩霞、杨海峰、蔡江辉等人利用LAMOST光谱数据开展了双峰轮廓识别与质量评估方法的研究,提出了一套针对LAMOST光谱数据特征的稀有特征提取、特征表征、特征识别及质量评估的技术框架。这套新的技术框架可以为双峰发射线光谱的高效搜寻及证认提供可靠的支撑,对特殊天体的挖掘也具有较好的借鉴意义。 该研究成果已发表于国际知名学术期刊IEEE Access。
双峰发射线轮廓光谱对星系并合过程、星系对的相互作用、活动星系核的喷流等诸多活动现象的深入研究具有重要作用,目前已证认的这类光谱样本非常稀少。LAMOST发布数据中已有超过20万条河外星系光谱数据,这为发现并搜寻此类天体提供了宝贵的数据支持,但是实测光谱呈现的双峰轮廓形状各异、强弱不同、受噪声干扰情况也不同,甚至在哪些发射线上呈现都各不相同。这些复杂多样的特征极大地增加了从海量数据中搜寻双峰发射线轮廓光谱的难度,因此目前主要的方法仍然依赖于繁重的人眼检查。
屈彩霞等人引入数据挖掘以及机器学习中相关子空间、支持向量机(SVM)、概念格等先进技术,通过分析LAMOST光谱中呈现的双峰发射线轮廓的特点,设计了双峰轮廓的识别与评估技术框架(SVM-LATTICE)。该技术框架在保证完备性的前提下,可以实现50%以上的双峰轮廓自动化识别,大幅减少了人眼检查工作;随着光谱数据量的增长,该技术框架具有比传统模板匹配方法更快的自动搜寻速度,同时可以为物理分析提供统计学依据。
国家天文科学数据中心为天文观测设备和研究计划提供数据与技术服务。
图1:双峰发射线轮廓光谱及对应测光图像伪彩图示例
图2:SVM-LATTICE框架示意图:图中每个结点都部署一个分类器,对应一个特征空间集,结点间构成一个双峰轮廓的置信Grid,纵向上较低的层次拥有较高的置信度,由高到低满足置信阈值可以实现搜寻短路;横向上反映不同的特征类别,有利于区分可能的特征激发机制。此外,层次间结点体现了特征在统计上的泛化-例化关系。
相关论文链接:
[1] nadc.china-vo.org//ieeexplore.ieee.org/abstract/document/8756202
[2] nadc.china-vo.org//ieeexplore.ieee.org/document/9079538
新闻来源:http://www.nao.cas.cn/xwzx/kydt/202005/t20200527_5599305.html