Современная астрономия сталкивается с неожиданной проблемой: данных стало слишком много. Космические миссии вроде Kepler, TESS и Gaia ежедневно собирают огромные массивы наблюдений. Среди них — миллионы кривых блеска звезд, по которым можно изучать их свойства. Но вручную разбирать такие объемы информации уже невозможно. На помощь приходят методы машинного обучения.
Что такое затменные двойные системы
Затменные двойные звезды — это пары звезд, которые вращаются вокруг общего центра масс так, что периодически перекрывают друг друга. В результате их яркость для наблюдателя меняется во времени. Эти изменения фиксируются в виде так называемой кривой блеска.
По форме этой кривой астрономы могут понять, как устроена система. Например, различают:
- раздельные системы, где звезды не соприкасаются;
- полураздельные, где одна звезда заполняет свою область притяжения;
- контактные системы, где оболочки звезд соприкасаются;
- эллипсоидальные, где форма звезд искажена гравитацией.
Раньше классификация таких систем требовала участия специалистов. Теперь эту задачу всё чаще выполняют алгоритмы.
Почему без машинного обучения не обойтись
Количество данных от современных обзоров не просто велико — оно колоссально. Каждая звезда может иметь тысячи измерений яркости, а самих звезд — миллионы. Обрабатывать такие данные вручную невозможно.
Машинное обучение позволяет:
- автоматически находить закономерности в данных;
- быстро классифицировать объекты;
- снижать вероятность человеческой ошибки;
- работать с временными рядами, такими как кривые блеска.
Особенно эффективны здесь нейросети, способные распознавать сложные формы и детали сигналов.
В исследовании использовались данные из каталогов затменных двойных систем, собранных миссиями Kepler и TESS. Всего было обработано более 7 тысяч кривых блеска.
Перед обучением данные приводят к единому виду:
- кривые «сворачиваются» по периоду (так называемое фазовое сложение);
- значения усредняются, чтобы убрать шум;
- данные стандартизируются для сравнения.
Затем кривые блеска превращают в изображения. Это позволяет использовать мощные архитектуры нейросетей, изначально созданные для анализа картинок.
В качестве модели была выбрана нейросеть VGG-19 — глубокая сверточная сеть с 19 слоями. Она хорошо умеет находить тонкие различия в формах сигналов: небольшие изменения амплитуды, асимметрию, особенности периодичности.
Данные разделили на три части:
- 67% — для обучения,
- 25% — для проверки,
- 8% — для финального теста.
Проверка на реальных данных
После обучения модель протестировали на данных из каталога Gaia DR3. В выборку вошли более 2000 звезд, часть из которых уже имела классификацию.
Результаты оказались разными:
- на данных Kepler и TESS точность достигла 91%;
- на данных Gaia — около 64%.
Почему такая разница? Дело в том, что данные разных миссий отличаются по качеству и способу обработки. Если модель обучалась на одном типе данных, ей сложнее работать с другим.
Например, кривые блеска из Gaia пришлось дополнительно аппроксимировать с помощью математических моделей, чтобы сделать их сопоставимыми с обучающей выборкой.
Какие проблемы удалось выявить
Исследование показало, что даже мощные нейросети сталкиваются с трудностями:
- модели могут путать похожие классы, например контактные и полураздельные системы;
- качество результата сильно зависит от однородности данных;
- небольшие различия в обработке кривых блеска влияют на итоговую точность.
Тем не менее, нейросеть уверенно справляется с задачей в большинстве случаев, особенно при работе с хорошо подготовленными данными.
Что дальше
Авторы работы рассматривают этот результат как важный шаг, но не финальное решение. В будущем планируется:
- расширить обучающую выборку;
- использовать более однородные данные;
- улучшить методы обработки кривых блеска;
- учитывать дополнительные эффекты, например пятна на звездах или гравитационные искажения.
Также перспективным направлением считается более детальный анализ параметров систем, а не только их классификация.
Почему это важно
Автоматическая классификация затменных двойных звезд — не просто удобный инструмент. Это ключ к эффективному использованию огромных астрономических архивов.
Благодаря машинному обучению ученые могут:
- быстрее находить интересные объекты;
- строить статистические модели эволюции звезд;
- глубже понимать процессы в двойных системах.
В эпоху «больших данных» такие технологии становятся неотъемлемой частью астрономии. И, судя по результатам, нейросети уже уверенно справляются с ролью цифровых помощников астрономов.
Источники:
Статья создана по материалам работы на arXiv.org