За последние годы космические миссии Kepler и TESS произвели настоящую революцию в поиске экзопланет. Благодаря точным измерениям яркости звёзд удалось обнаружить тысячи планет за пределами Солнечной системы. Но вместе с этим возникла и новая проблема — огромные объёмы данных, среди которых нужно быстро и точно отделять реальные планеты от ложных сигналов.
Недавнее исследование предлагает современное решение — использовать машинное обучение для автоматической проверки кандидатов в экзопланеты. Такой подход позволяет значительно ускорить анализ данных и повысить точность обнаружения новых миров.
Как обнаруживают экзопланеты
И Kepler, и TESS работают по транзитному методу: телескоп наблюдает за звёздами и фиксирует небольшие падения яркости, возникающие, когда планета проходит перед диском звезды. Из этих «провалов» можно определить:
- глубину транзита — относится к размеру планеты,
- период — время между транзитами,
- длительность транзита,
- свойства звезды — температуру, радиус, металлическость и т.д.
Однако далеко не каждое затемнение — это планета. Его могут вызывать двойные звёзды, шумы приборов или близкие по положению звёзды. Поэтому подтверждение планет — сложная и зачастую длительная работа.
Зачем нужно машинное обучение
Ручная проверка тысяч сигналов занимает месяцы. Чтобы ускорить процесс, исследователи создали набор моделей машинного обучения, обученных на каталоге Kepler, где есть как подтверждённые планеты, так и ложные срабатывания.
Использовались несколько алгоритмов:
- логистическая регрессия,
- метод ближайших соседей,
- решающее дерево,
- случайный лес,
- нейросеть на основе трансформера.
Все модели обучались на одинаковой выборке, включающей 11 параметров транзитов и характеристик звёзд.
Какая модель оказалась лучшей
После тестирования стало ясно, что наилучший результат показывает алгоритм случайного леса. Он:
- правильно классифицировал около 84% объектов,
- лучше всего справился с балансом между точностью и полнотой,
- особенно уверенно определял истинные планеты среди похожих сигналов.
Нейросеть-трансформер показала хорошие результаты, но пока немного уступает случайному лесу — вероятно, из-за ограниченного объёма обучающих данных.
Что показало применение модели к данным TESS
Затем обученную модель применили к каталогу TESS, который содержит тысячи объектов, большинство из которых ещё не проверены вручную. Из 3987 объектов с полными данными модель выделила:
- 2449 вероятных планет.
Сравнение с уже подтверждёнными объектами показало:
- модель правильно определила 86% известных подтверждённых планет,
- и около 69% ложных сигналов.
В сумме это даёт точность около 76%, что выше, чем у ранее использованных ML-подходов к данным TESS.
Важно, что исследователи дополнили данные TESS металлическостью звёзд из каталога Gaia, что заметно улучшило точность — металлическость действительно играет важную роль в формировании планет.
Новые находки: системы с несколькими планетами и кандидаты в зоне обитаемости
Модель выявила:
- 100 ранее не распознанных многопланетных систем,
- несколько планет в зоне обитаемости, где теоретически возможно существование жидкой воды.
Отдельно отмечено:
- 5 систем, в которых уже найдены планеты, расположенные в зоне обитаемости.
- Ещё 15 планет в других системах также потенциально могут находиться в этой зоне при определённых условиях.
Хотя многие из них — не землеподобные, а крупные газовые планеты, это не делает их бесперспективными: у таких миров могут быть обитаемые спутники.
Почему это важно
Полученные результаты показывают, что машинное обучение способно серьёзно ускорить поиск экзопланет:
- уменьшить нагрузку на специалистов,
- повысить однородность и объективность классификации,
- быстрее находить цели для наблюдений с мощными телескопами, включая JWST, телескопы будущей миссии PLATO и другие.
Алгоритмы легко адаптировать под будущие проекты, и по мере увеличения количества данных нейросетевые модели будут работать ещё лучше.
Вывод
Использование машинного обучения стало важным шагом к тому, чтобы более эффективно анализировать данные транзитных миссий. Уже сейчас модель помогает находить интересные кандидаты, среди которых есть и потенциально обитаемые миры. Это делает её мощным инструментом для следующих поколений исследований экзопланет.
Источники:
Статья создана по материалам работы https://arxiv.org/pdf/2512.00967