СИСТЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В АСТРОФИЗИЧЕСКИХ ИССЛЕДОВАНИЯХ
Раздел: Организация обучения и методическое обеспечение дисциплин «Основы искусственного интеллекта», «Системы искусственного интеллекта в профессиональной деятельности педагога»
Журнал: Материалы III Всероссийской научно-практической конференции с междун. участием «ИИ в образовании. Современные достижения и перспективы применения: в генерации знаний, управлении, обучении, оценке результатов обучения и формировании компетенций обучающихся»
9 июля 2024 г.
Авторы: Читайло Артем Иванович
Информационно-коммуникационные технологии в педагогическом образовании, 2024. № 6 (93). infed.ru
_______________________________________________________________________
УДК 004.89
А. И. Читайло
A. I. Chitailo
Читайло Артем Иванович, старший преподаватель, КГПИ ФГБОУ ВО «КемГУ», г. Новокузнецк, Россия.
Chitailo Artyom Ivanovich, Senior lecturer, Kuzbass Humanitarian and Pedagogical Institute of Kemerovo State University, Novokuznetsk, Russia.
СИСТЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В АСТРОФИЗИЧЕСКИХ ИССЛЕДОВАНИЯХ
ARTIFICIAL INTELLIGENCE SYSTEMS IN ASTROPHYSICAL RESEARCH
Аннотация. Представлен обзор направлений в астрофизике и космологии, где находят применение различные методы искусственного интеллекта, позволяя более эффективно решать задачи реконструкции изображений, классификации объектов, отбора моделей.
Annotation. An overview of areas in astrophysics and cosmology is presented, where various methods of artificial intelligence are used, allowing one to more effectively solve problems of image reconstruction, object classification, and model selection.
Ключевые слова: астрофизика, космология, искусственный интеллект, машинное обучение, нейронные сети.
Keywords: astrophysics, cosmology, artificial intelligence, machine learning, neural networks.
Астрофизика, наряду с космологией, относится к тем естественнонаучным дисциплинам, где принципиально невозможен прямой эксперимент и где главную роль играет наблюдение. При этом невозможность эксперимента в некоторой степени компенсируется огромным количеством доступных наблюдению космических объектов и их систем, а фундаментальные свойства видимой Вселенной таковы, что позволяют видеть далекие объекты на более ранних этапах, как их собственной эволюции, так и эволюции Вселенной. В свою очередь, технический прогресс средств наблюдений (телескопов, космических аппаратов, вычислительной техники) обуславливает ускоряющихся рост объема накопленных научных данных, при том, что количество ученых, которые занимаются их обработкой, увеличивается значительно медленнее (рис. 1). Вполне закономерно, что, как только появлялись те или иные средства искусственного интеллекта, астрофизики пытались приспособить их для решения своих задач, среди которых важное место занимают распознавание образов, классификация объектов и рядов данных и тому подобные.
Рисунок 1. Кривые роста технических средств, объемов данных и числа ученых (из работы [6])
В последние годы, на гребне очередной волны нейрооптимизма принято говорить о том, как искусственные нейронные сети, в частности, большие языковые (LLM) и мультимодальные (LMM) модели меняют подход к работе с информацией в быту, на производстве и в науке. В Гарварде открыт Центр ИИ в астрофизике (https://astroai.cfa.harvard.edu/), занимающийся поисками эффективных способов применения средств ИИ в науке. Некоторые исследователи [15] предсказывают скорое появление «экзокортекса» – «внешней коры мозга» – в виде технических средств, которые усилят когнитивные возможности ученого за счет быстрого и точного выполнения работ, связанных с поиском информации, планированием действий, интеллектуальным анализом данных и т. п., оставив при этом радость научного поиска и открытия человеку.
Впрочем, применение систем ИИ в науке началось не вчера, и будет только расширяться под давлением ускоренного роста поступающих данных. Рассмотрим далее некоторые приложения средств ИИ в астрофизических и космологических исследованиях.
Реконструкция изображений. Типичной задачей обработки изображений, полученных с помощью оптических инструментов, является деконволюция – реконструкция изображения объекта, с целью уменьшения влияния аберраций оптической системы и атмосферных искажений. Одним из популярных алгоритмов деконволюции является алгоритм Ричардсона-Люси, показавший свою эффективность для смягчения аберраций на снимках космического телескопа Хаббла. Применение сравнительно простых нейронных сетей позволяет выполнять тонкую настройку параметров алгоритма деконволюции и получать значительно улучшенные изображения. Данный подход применим и к другим традиционным алгоритмам реконструкции.
Рисунок 2. Слева – изображение черной дыры в центре М 87 (EHT); в центре – реконструкция алгоритмом PRIMO; справа – реконструированное изображение, приведенное к пространственному разрешению EHT (из работы [8])
В работе [8] предлагается реконструкция изображения черной дыры в центре галактики М 87, опубликованного в 2019 г. командой «Телескопа горизонта событий» (EHT), новым алгоритмом PRIMO на основе машинного обучения. Исходное изображение (рис. 2, слева) представляет собой результат обработки множества радиоинтерферометрических наблюдений с большой базой. Сгенерированное PRIMO изображение из исходных данных наблюдений EHT (рис. 2, в центре), в главном совпадает с опубликованным, показывая при этом некоторые дополнительные подробности, которые, впрочем, авторы работы описывают с осторожностью, подразумевая, что для их обоснования пока недостаточно данных.
Задачи классификации объектов. В наблюдательной науке классификация – один из фундаментальных методов систематизации знаний. Применение аппарата искусственных нейронных сетей (ИНС) для решения задач классификации распространяется все шире.
ИНС используются для отделения следов метеоров от треков космических частиц высоких энергий в экспериментах на низкой околоземной орбите и в верхних слоях земной атмосферы [18]. Здесь следы метеоров играют роль шума, а ИНС позволяют их эффективно выявлять и исключать.
Также одномерные сверточные ИНС помогают отделять изменения блеска звезд, вызванные вариациями условий видимости или инструментальным шумом, от вариаций, вызванных транзитами экзопланет [2], существенно сокращая время обработки кривых яркости в сравнении с традиционными методами.
А вот задача классификации рентгеновских источников осложняется тем, что для них редко возможно надежно определить соответствующий оптический источник, изучение которого помогло бы сузить количество гипотез о природе рентгеновского источника. В работе [11] предлагается вероятностная классификация 8756 рентгеновских источников из обзора космической обсерватории Chandra, выполненная с применением инструментов машинного обучения без учителя (unsupervised learning). Верификация результатов по хорошо изученным рентгеновским источникам подтверждает надежность полученного классификатора.
Как известно, спектроскопия является важнейшим источником информации о космических объектах, нередко позволяющим дать полное, в рамках существующих теорий, описание природы объекта и характера его движения. Однако, сложность спектральных наблюдений обуславливает их малый охват по сравнению с фотометрическими обзорами. В этой связи, предпринимаются попытки восстановления спектральных характеристик объекта на основе фотометрических наблюдений в нескольких стандартных полосах длин волн, что, при успешном восстановлении, может на порядки увеличить число классифицированных источников и, как следствие, например, уточнить ряд теорий строения и эволюции звезд и галактик. В работе [3], озаглавленной «Спектроскопия галактик без спектров...» рассматривается возможность получения из чисто фотометрических данных цифрового Слоановского обзора (Sloan Digital Sky Survey) таких, традиционно спектрометрически измеряемых, параметров галактик, как металличность, возраст, дисперсия звездных скоростей, а также величины красного смещения. Кроме того, с точностью 82 % определяется наличие у галактики активного ядра. Для этого применяются диффузионные модели в комбинации с контрастными сетями.
Схожий подход может применяться и для разделения по фотометрической информации различных типов объектов. В работе [17] подробно обсуждается фотометрический классификатор на основе машинного обучения с учителем, выделяющий нормальные галактики (с достигнутой точностью 88 %), галактики с яркими эмиссионными линиями (82 %), звезды (99 %), квазары (98 %). Уже на данном этапе этот классификатор позволяет эффективно отбирать интересные объекты для дальнейших спектрометрических исследований.
Также проблема отбора данных затрагивается в работе [7], где авторы обсуждают нейросеть на основе трансформера, которая помогает эффективно выбирать звезды из обзоров по параметрам, при этом дополняя часть отсутствующих параметров, потенциально играя роль суперкаталога, объединяющего данные наблюдений APOGEE, Gaia, 2MASS и других.
В работе [4] описывается сверточная ИНС, обученная выделению в спектрах далеких квазаров крайне слабых линий поглощения нейтрального углерода (CI), которые являются индикатором присутствия холодной пыли в межзвездной среде галактики. 14,5 тыс. спектров просматриваются в поисках указанных линий за время порядка 3 секунд с точностью 99,8 %.
Еще одна важная задача – морфологическая классификация галактик, тесно связанная с изучением их эволюции. Первоначально выполненная почти сотню лет назад Э. Хабблом на сравнительно скромном материале имевшихся тогда фотоснимков, она не теряет актуальности с выходом новых обзоров неба, выполняемых новыми инструментами. При этом увеличивается количество объектов для классификации, а существенная часть из них имеет сравнительно низкий сигнал-шум, чтобы быть обработанными традиционными методами компьютерного зрения. Здесь любопытно отметить, что идея использовать нейронные сети для классификации морфологии галактик сначала получила воплощение в виде проекта гражданской науки (citizen science) под названием «Galaxy Zoo», начавшем работу в 2007 г. (https://www.zooniverse.org/). Добровольцы на сайте проекта после краткого обучения классифицируют предъявляемые им изображения галактик из Слоановского обзора (позднее – из множества других), причем классификация одного объекта производится многократно разными людьми. Таким образом, применялись естественные способности человеческого мозга в распознавании зашумленных образов. За первый год работы проекта было проведено более 50 млн. классификаций с помощью «вычислительных мощностей» более, чем 150 тыс. человек. Несмотря на успешность этого проекта, рост количества наблюдений требует дальнейшей интенсификации обработки данных, поэтому исследователи ищут возможности применения автоматизированной обработки, потенциально сильнее масштабируемой, чем проекты гражданской науки. В частности, в работе [10] обсуждается архитектура морфологического классификатора галактик на основе сверточных ИНС, который показывает точность около 95 % на тестовых наборах данных и хорошо устойчив к зашумлению. А в работе [13] обсуждается выделение изображений хорошего качества (для дальнейшего подробного изучения) для галактик, видимых с ребра, на снимках широкоугольного обзора Pan-STARRS1 с помощью технологий машинного обучения. Достигнута точность около 97 %, создан каталог из 100 тыс. интересующих объектов.
Отдельное направление – обработка кривых блеска переменных звезд, с целью их классификации, которое также сталкивается с ростом количества информации, требуя при этом быстрой обработки поступающих данных, которые в силу обзорной природы наблюдений, неполны для отдельно взятого объекта. В работе [5] обсуждается классификатор типов переменных звезд на основе комбинации рекуррентных и сверточных ИНС, достигающий 86 % точности.
Отбор моделей. Предсказание на долгие сроки поведения сложных динамических систем, например, планетных орбит в Солнечной системе, является достаточно сложной задачей, включающей вероятности редких событий. Например, согласно численным расчетам в последующие 5 млрд. лет, с вероятностью ~0,01, орбита Меркурия перестанет быть стабильной. Авторы работы [1] обучили нейросетевую модель на материале более полутысячи симуляций эволюции эксцентриситетов орбит Меркурия и Венеры, и показали возможность оценки вероятности дестабилизации орбиты Меркурия в будущем в зависимости от минимального расстояния пересечения орбит (MOID) Венеры и Меркурия.
В работе [9] авторы предлагают нейронную сеть, которая помогает эффективно моделировать свойства межзвездной среды и газопылевых облаков. При этом достигается точность выше, чем с использованием упрощенных методов сеточных вычислений, а скорость получения результата выше, чем при подробных расчетах, что имеет важное значение в ситуации быстрорастущего объема наблюдательных данных.
Важное практическое значение, помимо теоретического, имеет предсказание солнечных вспышек. Мощные вспышки оказывают сильное влияние на работу спутниковых и наземных систем связи и навигации, оказывают непосредственное влияние на космические аппараты, а также на атмосферу Земли, а в особенных случаях способны приводить к сбоям на сетях электроснабжения и заметно повышать радиационную нагрузку на экипажи и пассажиров авиамаршрутов в верхних широтах. Источниками вспышек являются активные области на Солнце, где плазма, удерживаемая сложной конфигурацией локальных магнитных полей, перегревается, и далее может ускоренно выбрасываться в околосолнечное пространство, что часто сопровождается излучением в УФ и рентгеновском диапазонах. Несмотря на то, что активные области легко наблюдаются как с Земли, так с космических аппаратов во многих спектральных полосах, а по данным поляриметрии можно выяснить конфигурацию магнитного поля внутри этих областей, надежное предсказание мощных вспышек затруднено и в основном опирается на статистику. В проекте AI-FLARES [12] предпринята попытка применить технологии машинного обучения для выделения предвестников солнечных вспышек, которые могут использоваться для уточненных прогнозов. При этом, одной из задач, решенных с помощью ИИ, было точное выделение наиболее горячих мест активного региона из перенасыщенных снимков (рис. 3).
Рисунок 3. Слева – ультрафиолетовое изображение вспышки в условных цветах со значительным перенасыщением; справа – восстановленные интенсивности, позволяющие точно определить места вспышек (из работы [12])
Далее, происходило обучение на материале архивных вспышек, с учетом изменения активного региона на протяжении суток. В результате подтвердилось, что для прогноза требуется учет малого числа параметров активной области (3-4).
Распознавание сигналов. Способность нейросетей распознавать сильно зашумленные сигналы находит применение в сравнительное новой области – гравитационно-волновой астрономии, первые практические результаты которой появились в 2015 г., и теперь происходит многократный рост количества наблюдений ГВ-событий с вводом усовершенствованных детекторов и методов обработки. Прием и выделение гравитационно-волновых сигналов сопряжен с колоссальными трудностями технического и методического характера в силу высокой сложности детекторов и экстремально низкого отношения «сигнал-шум».
В работе [14] обсуждаются подходы к применению аппарата ИНС различных архитектур к вышеуказанной задаче, и делается вывод о возможности примерно тысячекратного ускорения обработки данных в сравнении с традиционными методами. Подробный обзор возможностей применения ИИ в гравитационно-волновой астрономии дан также в [16]. Помимо собственно выделения сигнала, ИНС могут использоваться для уточнения параметров источника (массы компонентов, орбитальные параметры), и в перспективе – уточнения моделей гравитации и постоянной Хаббла.
Применение инструментов ИИ в науке о космосе уже дает интересные результаты и можно смело прогнозировать расширение охваченных тем и методов, что, в свою очередь, ускорит решение старых задач и постановку новых. Глядя с оптимизмом на происходящее в этой области, необходимо отметить, что важным условием здесь является понимание того, как работают эти инструменты и как на полученные выводы влияют полнота и качество обучающих данных, качество входных гипотез.
Список литературы
- Abbot D. AI can identify Solar System instability billions of years in advance / Dorian S. Abbot, J.D. Laurence-Chasen, Robert J. Webber, David M. Hernandez, Jonathan Weare. – DOI: 10.3847/2515-5172/ad18a6. – Текст : электронный // Research Notes of the AAS, Vol. 8. – URL : https://doi.org/10.3847/2515-5172/ad18a6 (дата обращения : 28.06.2024).
- Álvarez S. One-dimensional Convolutional Neural Networks for Detecting Transiting Exoplanets / Santiago Iglesias Álvarez, Enrique Díez Alonso, María Luisa Sánchez и др. – DOI: 10.3390/axioms12040348. – Текст : электронный // Axioms 2023, 12(4), 348. – URL : https://doi.org/10.3390/axioms12040348 (дата обращения : 28.06.2024).
- Doorenbos L. Galaxy spectroscopy without spectra: Galaxy properties from photometric images with conditional diffusion models / Lars Doorenbos, Eva Sextl, Kevin Heng и др. – DOI : 10.48550/arXiv.2406.18175. – Текст : электронный // arXiv:2406.18175v1 [astro-ph.GA]. – URL : https://doi.org/10.48550/arXiv.2406.18175 (дата обращения : 28.06.2024).
- Ge J. Detecting rare neutral atomic-carbon absorbers with a deep neural network / Jian Ge, Kevin Willis, Kaixuan Chao и др. – DOI: 10.1093/mnras/stae799. – Текст : электронный // Monthly Notices of the Royal Astronomical Society, Vol. 531, Issue 1. – URL : https://doi.org/10.1093/mnras/stae799 (дата обращения : 28.06.2024).
- Kang Z. Periodic Variable Star Classification with Deep Learning: Handling Data Imbalance in an Ensemble Augmentation Way / Zihan Kang, Yanxia Zhang, Jingyi Zhang и др. – DOI: 10.1088/1538-3873/acf15e. – Текст : электронный // PASP 135 094501 (2023). – URL : https://doi.org/10.1088/1538-3873/acf15e (дата обращения : 28.06.2024).
- Kleijn G. Object classification with Convolutional Neural Networks: from KiDS to Euclid / G.A. Verdoes Kleijn, C.A. Marocico, Y. Mzayek и др. – DOI : 10.48550/arXiv.2403.01613. – Текст : электронный // arXiv:2403.01613v1 [astro-ph.IM]. – URL : https://doi.org/10.48550/arXiv.2403.01613 (дата обращения : 28.06.2024).
- Leung H. Towards an astronomical foundation model for stars with a Transformer-based model / Henry W. Leung, Jo Bovy. – DOI: 10.1093/mnras/stad3015. – Текст : электронный // Monthly Notices of the Royal Astronomical Society, Vol. 527, Issue 1. – URL : https://doi.org/10.1093/mnras/stad3015 (дата обращения : 28.06.2024).
- Medeiros L. The Image of the M87 Black Hole Reconstructed with PRIMO / Lia Medeiros, Dimitrios Psaltis, Tod R. Lauer, Feryal Özel. – DOI: 10.3847/2041-8213/acc32d. – Текст : электронный // The Astrophysical Journal Letters, Vol. 947, Number 1. – URL : https://iopscience.iop.org/article/10.3847/2041-8213/acc32d (дата обращения : 28.06.2024).
- Palud P. Neural network-based emulation of interstellar medium models / Pierre Palud, Lucas Einig, Franck Le Petit, и др. – DOI: 10.1051/0004-6361/202347074. – Текст : электронный // A&A Volume 678, October 2023. – URL : https://doi.org/10.1051/0004-6361/202347074 (дата обращения : 28.06.2024).
- Pandya S. E(2) Equivariant Neural Networks for Robust Galaxy Morphology Classification / Sneh Pandya, Purvik Patel, Franc O, Jonathan Blazek. – DOI: 10.48550/arXiv.2311.01500. – Текст : электронный // arXiv:2311.01500v1 [astro-ph.GA]. – URL : https://doi.org/10.48550/arXiv.2311.01500 (дата обращения : 28.06.2024).
- Pérez-Díaz V. Unsupervised Machine Learning for the Classification of Astrophysical X-ray Sources / Víctor Samuel Pérez-Díaz, Juan Rafael Martínez-Galarza, Alexander Caicedo, Raffaele D'Abrusco. – DOI: 10.1093/mnras/stae260. – Текст : электронный // Monthly Notices of the Royal Astronomical Society, Vol. 528, Issue 3. – URL : https://doi.org/10.1093/mnras/stae260 (дата обращения : 28.06.2024).
- Piana М. AI-FLARES: Artificial Intelligence for the Analysis of Solar Flares Data / Michele Piana, Federico Benvenuto, Anna Maria Massone и др. – Текст : электронный // arXiv:2401.01104v1 [astro-ph.SR]. – URL : https://doi.org/10.48550/arXiv.2401.01104 (дата обращения : 28.06.2024).
- Savchenko S. Search for the edge-on galaxies using an artificial neural network / S. S. Savchenko, D. I. Makarov, A. V. Antipova, I. S. Tikhonenko. – DOI : 10.1016/j.ascom.2023.100771. – Текст : электронный // Astronomy and Computing, Vol. 46, 100771, 2024. – URL : https://doi.org/10.1016/j.ascom.2023.100771 (дата обращения : 28.06.2024).
- Stergioulas N. Machine Learning Applications in Gravitational Wave Astronomy / Nikolaos Stergioulas. – DOI: 10.48550/arXiv.2401.07406. – Текст : электронный // arXiv:2401.07406v1 [gr-qc]. – URL : https://doi.org/10.48550/arXiv.2401.07406 (дата обращения : 28.06.2024).
- Yager K. Towards a Science Exocortex / Kevin G. Yager. – Текст : электронный // arXiv:2406.17809v1 [cs.AI]. – URL : https://doi.org/10.48550/arXiv.2406.17809 (дата обращения : 28.06.2024).
- Zhao T. Dawning of a New Era in Gravitational Wave Data Analysis: Unveiling Cosmic Mysteries via Artificial Intelligence – A Systematic Review / Tianyu Zhao, Ruijun Shi, Yue Zhou и др. – DOI: 10.48550/arXiv.2311.15585. – Текст : электронный // arXiv:2311.15585v1 [gr-qc]. – URL : https://doi.org/10.48550/arXiv.2311.15585 (дата обращения : 28.06.2024).
- Zeraatgari F. Machine learning-based photometric classification of galaxies, quasars, emission-line galaxies, and stars / Fatemeh Zahra Zeraatgari, Fatemeh Hafezianzade, Yanxia Zhang, и др. – DOI: 10.48550/arXiv.2311.02951. – Текст : электронный // arXiv:2311.02951v1 [astro-ph.GA]. – URL : https://doi.org/10.48550/arXiv.2311.02951 (дата обращения : 28.06.2024).
- Zotov М. Neural Network Based Approach to Recognition of Meteor Tracks in the Mini-EUSO Telescope Data / Mikhail Zotov, Dmitry Anzhiganov, Aleksandr Kryazhenkov и др. – DOI: 10.3390/a16090448. – Текст : электронный // Algorithms 2023, 16(9), 448. – URL : https://doi.org/10.3390/a16090448 (дата обращения : 28.06.2024).
© Читайло А. И., 2024