Preview

Российский технологический журнал

Расширенный поиск

О выборе метода распознавания астрономических объектов на основе анализа исходных данных, полученных по программе Sloan Digital Sky Survey DR14

https://doi.org/10.32362/2500-316X-2021-9-3-66-77

Полный текст:

Аннотация

В работе проведен анализ набора данных Sloan Digital Sky Survey DR14, в котором в несколько этапов измерений собраны статистические данные о различных астрономических объектах. На поверхности Земли расположено много телескопов, собирающих данные об объектах в небе. На околоземной орбите и в космосе (обычно в точках Лагранжа систем Земля – Луна, Солнце – Земля) расположены или запланированы к размещению телескопы, следящие за небом в разных диапазонах. Значительный объем данных приводит к необходимости статистической обработки этого потока информации, а также к построению автоматических классификаторов по типу объекта. В работе представлены результаты предварительной обработки данных и работы различных видов классификаторов в задаче определения типа астрономического объекта из набора данных Sloan Digital Sky Survey DR14 (звезда, квазар или галактика) на основе нескольких распространенных метрик. Рассмотрены алгоритмы дерева принятий решений, логистическая регрессия, наивный «байесовский» классификатор и ансамбли классификаторов. Показано, что классификация подобных наборов данных может быть проведена без привлечения сложных систем машинного обучения (таких, как нейронные сети). Сделаны выводы об особенностях применения алгоритмов машинного обучения к этой задаче. В некоторых случаях работа классификаторов может быть интерпретирована с точки зрения физики. Точность построенных в работе классификаторов (согласно метрикам, учитывающим несбалансированность классов) достигает 90% и может считаться удовлетворительной и для того, чтобы считать задачу решенной, и для того, чтобы использовать структуру классификаторов для объяснения результатов классификации с точки зрения физики.

Об авторах

В. А. Голов
МИРЭА – Российский технологический университет
Россия

Голов Владислав Александрович, студент группы КМБ-01-16 кафедры высшей математики Института кибернетики

119454, Москва, пр-т Вернадского, д. 78 



Д. А. Петрусевич
МИРЭА – Российский технологический университет
Россия

Петрусевич Денис Андреевич, к.ф.-м.н., доцент кафедры высшей математики Института кибернетики

ResearcherID: AAA-6661-2020, Scopus Author ID: 55900513600

119454, Москва, пр-т Вернадского, д. 78



Список литературы

1. Finch A., Said J.L. Galactic rotation dynamics in f(T) gravity. Eur. Phys. J. C. 2018;78:560. https://doi.org/10.1140/epjc/s10052-018-6028-1

2. Садовникова Е.В., Шатина А.В. Эволюция вращательного движения спутника с гибкими вязкоупругими стержнями на эллиптической орбите. Российский технологический журнал. 2018;6(4):89−104. https://doi.org/10.32362/2500-316X-2018-6-4-89-104 [Sadovnikova E.V., Shatina A.V. Evolution of the rotational motion of a satellite with flexible viscoelastic rods on the elliptic orbit. Rossiiskii Tekhnologicheskii Zhurnal = Russian Technological Journal. 2018;6(4):89−104 (in Russ.).]

3. Lee K.J., Stovall K., Jenet F.A., et al. PEACE: pulsar evaluation algorithm for candidate extraction – a software package for post-analysis processing of pulsar survey candidates.Mon. Not. R. Astron. Soc. 2013;433(1):688−694. https://doi.org/10.1093/mnras/stt758

4. Wang Y.-C., Li M.-T., Pan Z.-C., Zheng J.-H. Pulsar candidate classification with deep convolutional neural networks. Res. Astron. Astrophys. 2019;19(9):133. https://doi.org/10.1088/1674-4527/19/9/133

5. Wang L., Jin J., Jiang Y., Shen Y. A Method for weak pulsar signal detection combining the bispectrum and a deep convolutional neural network. Astrophys. J. 2019;873(1):17. https://doi.org/10.3847/1538-4357/ab0308

6. Zhu W.W., Berndsten A., Madsen E.C., et al. Searching for pulsars using image pattern recognition. Astrophys. J. 2014;781(2):117. https://doi.org/10.1088/0004-637X/781/2/117

7. Abbott B.P., Abbot R., Abbott T.D., et al. Gravitational waves and gamma-rays from a binary neutron star merger: GW170817 and GRB 170817A. Astrophys. J. Lett. 2017;848(2):L13. https://doi.org/10.3847/2041-8213/aa920c

8. Vasconcellos E.C., de Carvalho R.R., Gal R.R., LaBarbera F.L., Capelato H.V., Frago Campos Velho H., Trevisan M., Ruiz R.S.R. Decision tree classifiers for star/galaxy separation. Astrophys. J. 2011;141(6):189. https://doi.org/10.1088/0004-6256/141/6/189

9. Ball N.M., Brunner R.J., Myers A.D. Robust machine learning applied to astronomical data sets. I. Star-galaxy classification of the Sloan digital sky survey DR3 using decision trees. Astrophys. J. 2006;650(1):497−509. https://doi.org/10.1086/507440

10. Ackermann M., Ajello M., Allafort A., et al. A statistical approach to recognizing source classes for unassociated sources in the first Fermi-LAT catalog. Astrophys. J. 2012;753(1):83. https://doi.org/10.1088/0004-637X/753/1/83

11. Saz Parkinson P.M., Xu H., Yu P.L. H., Salvetti D., Marelli M., Falcone A.D. Classification and ranking of Fermi-LAT gamma-ray sources from the 3FGL catalog using machine learning techniques. Astrophys. J. 2016;820(1):8. https://doi.org/10.3847/0004-637X/820/1/8

12. Farrell S.A., Murphy T., Lo K.K. Autoclassification of the variable 3XMM sources using the random forest machine learning algorithm. Astrophys. J. 2015;813(1):28. https://doi.org/10.1088/0004-637X/813/1/28

13. Weaver W.B. Spectral classification of unresolved binary stars with artificial neural networks. Astrophys. J. 2000;541(1):298−305. https://doi.org/10.1086/309425

14. Richards G.T., Nichol R.C., Gray A., et al. Efficient photometric selection of quasars from the Sloan digital sky survey: 100,000 z < 3 quasars from data release one. Astrophys. J. Suppl. Ser. 2004;155(2):257−269. https://doi.org/10.1086/425356

15. Richards G.T., Myers A.D., Peters C.M., et al. Bayesian high-redshift quasar classification from optical and midir photometry. Astrophys. J. Suppl. Ser. 2015;219(2):39. https://doi.org/10.1088/0067-0049/219/2/39

16. Sloan Digital Sky Survey DR14. Classification of stars, galaxies and quasars. Available from URL: https://www.kaggle.com/lucidlenn/sloan-digital-sky-survey

17. James G., Witten D., Hastie T., Tibshirani R. An introduction to statistical learning with applications in R. New York: Springer-Verlag; 2015. 426 p. https://doi.org/10.1007/978-1-4614-7138-7

18. Hastie T., Tibshirani R., Friedman J. The elements of statistical learning. 2nd ed. New York: Springer-Verlag; 2009. 763 p. ISBN 978-0-387-84857-0

19. Sloan digital sky survey data release 7. Available from URL: http://classic.sdss.org/dr7

20. Fermi-LAT 3FGL Catalog. Available from URL: https://fermi.gsfc.nasa.gov/ssc/data/access/lat/4yr_catalog/3FGLtable/#aitoff

21. Davis J., Goadrich M. The relationship between precision-recall and ROC curves. In: Proceedings of the 23rd International Conference on Machine Learning. Pittsburgh, PA, USA; 2006, p. 233−240. https://doi.org/10.1145/1143844.1143874

22. Breiman L., Freidman J.H., Olshen R.A., Stone C.J. Classification and regression trees. Monterey, CA, USA: Wadsworth & Brooks/Cole Advanced Books & Software; 1984. 358 p. ISBN: 0534980548

23. Predicting a pulsar star. Available from URL: https://www.kaggle.com/pavanraj159/predicting-a-pulsar-star

24. VizieR online data catalog: XMM-Newton Serendipitous Source Catalogue 3XMM-DR8 (XMM-SSC, 2018). Available from URL: https://ui.adsabs.harvard.edu/abs/2019yCat.9055....0R/abstract

25. Sloan digital sky survey data release 1. Available from URL: http://classic.sdss.org/dr1/

26. Sloan digital sky survey data release 3. Available from URL: http://classic.sdss.org/dr3/

27. The wide-field infrared survey explorer at IPAC. The AllWise Data Release. Available from URL: http://wise2.ipac.caltech.edu/docs/release/allwise/


Дополнительные файлы

1. Зависимость первой и второй главных компонент в расширенном наборе данных
Тема
Тип Исследовательские инструменты
Посмотреть (44KB)    
Метаданные

Проведен анализ набора статистических данных Sloan Digital Sky Survey DR14 о различных астрономических объектах. Представлены результаты предварительной обработки данных и работы различных видов классификаторов в задаче определения типа астрономического объекта (звезда, квазар или галактика). Рассмотрены алгоритмы дерева принятий решений, логистическая регрессия, наивный «байесовский» классификатор и ансамбли классификаторов. Показано, что классификация подобных наборов данных может быть проведена без привлечения сложных систем машинного обучения. Точность построенных в работе классификаторов достигает 90%.

Для цитирования:


Голов В.А., Петрусевич Д.А. О выборе метода распознавания астрономических объектов на основе анализа исходных данных, полученных по программе Sloan Digital Sky Survey DR14. Российский технологический журнал. 2021;9(3):66-77. https://doi.org/10.32362/2500-316X-2021-9-3-66-77

For citation:


Golov V.A., Petrusevich D.A. Data analysis methods in astronomic objects classification (Sloan Digital Sky Survey DR14). Russian Technological Journal. 2021;9(3):66-77. (In Russ.) https://doi.org/10.32362/2500-316X-2021-9-3-66-77

Просмотров: 41


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2500-316X (Online)