Exoplanet Hunters

加速 NASA 的尋星之旅 | NASA Space Apps Challenge 2025

我們的團隊與使命

我們是 Exoplanet Hunters,一群熱情的開發者、數據科學家與太空愛好者。我們的使命是利用 AI 的力量,徹底改變我們發現遙遠世界的方式。

挑戰:一個遙遠の世界

NASA Space Apps Challenge

我們的專案響應了 NASA 的「A World Away」挑戰,目標是開發一個 AI/ML 模型,自動分析龐大的太空觀測數據,以識別新的系外行星。

問題:數據洪流中的發現瓶頸

Manual Data Bottleneck Hinders Discovery

手動篩選 Kepler 和 TESS 任務成千上萬的光變曲線,過程緩慢、耗費人力,並且容易因人類疲勞而產生錯誤。這嚴重阻礙了新世界的發現速度。

顯示程式碼的電腦

我們的解決方案

一個 80% 準確率、大眾化的 AI 工具

我們開發了一個基於 XGBoost 的優化機器學習模型,並將其部署在一個簡單的網頁介面後端。讓任何人都能成為系外行星獵人。

數據:驅動我們發現的燃料

我們使用了來自 NASA 系外行星檔案庫的數據進行訓練,其中包含了:

  • 8,297 筆 Kepler 感興趣天體 (KOI) 的原始光變曲線數據。
  • 涵蓋了已確認行星、候選行星及偽陽性信號。
星空數據

創新:784 維特徵的秘密武器

Innovation-784 Feature Signals

我們的創意核心在於利用 TSFRESH 進行深度特徵提取,從原始光變曲線中萃取出 784 個獨特的時間序列特徵,捕捉手動方法常忽略的複雜訊號。

  • 統計屬性 (均值、方差、偏度)
  • 頻域訊號 (傅立葉係數、熵)
  • 能量度量 (絕對能量、數值總和)

我們的工作流程

工作流程圖

模型的表現:量化可靠性

選擇 LC-XGBoost 作為最佳模型,並透過 GridSearch 進行超參數調校,我們取得了優異的成果。

其中,我們最重視的指標是...

82%

召回率 (Recall)

這代表我們成功找出了 82% 的真實行星,最大化了發現的機會。

成果證明:混淆矩陣

混淆矩陣

高召回率的科學意義

在天文學的篩選工具中,寧可錯殺一百(偽陽性),也不可放過一個(偽陰性)。

我們的高召回率確保了偽陰性(False Negatives)被降至最低。在測試中,我們僅僅錯過了 33 顆行星,卻成功辨識了 154 顆。這對於一個不應忽略任何潛在發現的工具至關重要。

科學大眾化:我們的網頁介面

Bring Your Own Data

我們將複雜的模型封裝在一個極簡的介面後端:

  • 使用者可上傳自己的 .csv 或 .dat 光變曲線檔案。
  • 系統會立即回傳行星的分類結果信心分數

這讓專業研究人員與業餘天文學家都能輕鬆使用我們的技術。

上傳您的光變曲線檔案

.csv or .dat

直接影響:為研究人員加速

火箭升空

我們的工具為研究人員提供了一個快速、經統計驗證的方法來篩選行星候選者,能大幅減少手動分析時間,讓他們能更專注於最有潛力的目標上。

教育影響:啟發下一代

這個易於使用的介面,打破了科學的壁壘,能激勵公民科學家和學生直接與真實的 NASA 數據互動,點燃他們對宇宙探索的熱情。

仰望星空

未來展望:擴展性與新任務

軌道上的衛星

我們的模型和特徵工程方法具有高度的可移植性。

未來能直接應用於新的時間序列數據集,確保與 TESSPLATO 等未來任務數據的無縫接軌,持續為天文學界做出貢獻。

技術棧

我們站在巨人的肩膀上,使用了這些強大的開源技術:

Python Scikit-learn XGBoost tsfresh

感謝聆聽

Exoplanet Hunters | Questions & Answers