EFT 是一套規模龐大的物理理論。它不可能靠一次實驗就被宣布成立,也不可能靠一次實驗就被徹底推翻。它只能在一系列可複核、可比較、可持續加壓的實驗中,被逐步支持、被收緊適用範圍,或被證偽。P1 便是這條實驗鏈上第一項星系尺度的檢索工作。它不是孤立事件,而是 P 系列首批實驗中的第一步;P1 已經完成,後續工作仍將沿不同觀測視窗持續展開。

之所以先從 P1 這樣一項實驗切入,有現實原因,也有理論原因。現實上,首批檢驗必須服從現有資源與公開資料的條件;一套新理論不可能一開始就把最昂貴、週期最長的實驗全部鋪開。理論上,EFT 的兩條起始公理是:真空不空,宇宙是一片連續的能量海;粒子不是點,而是捲起、閉合、上鎖的結構。用更短的話說,就是「真空是海,粒子是環」。若這套底圖成立,那麼大量不穩定、短壽命結構的持續生滅,在粗粒化之後,就有理由在宏觀引力讀數中留下平均底座的痕跡。P1 選擇的,正是這條最適合率先切入、也最能觸及底層公理的檢索方向:把 EFT 所說的平均引力效應,與傳統理論中的暗物質效應,做第一輪正面對照

我們具體做的,是一組「換窗複核」的實驗。先看星系內部的物質怎麼轉,再看同類星系在更大尺度上如何讓背景光線產生偏折。前者是旋轉曲線,後者是星系—星系弱透鏡。實驗真正要找的,不是誰能把某一扇窗裡的現象單獨講通,而是誰能在換一扇窗之後,仍舊講的是同一張引力地圖。P1 使用了 104 個星系、2295 個旋轉曲線資料點,以及 4 個質量分組、共 60 個弱透鏡資料點。檢驗方法則很直接:先用旋轉曲線定出模型,再去預測弱透鏡,看它換窗之後還認不認得同一張圖。

第一輪比較裡,EFT 一側提出了 4 個模型:EFT_BIN、EFT_WEXP、EFT_WYUK、EFT_WPOW;對照方先提出 1 個最小冷暗物質基線:DM_RAZOR。結果是,4 個 EFT 模型全部占優。聯合比較的領先量達到 ΔlogL_total = 1155–1337;閉合比較裡,EFT 的分值為 172–281,而 DM_RAZOR 為 127。這裡的分值不是日常意義上的「考試分數」,而是累積證據量。數值越大,表示模型在整體比較中越穩定地占上風;上千的差距,不是靠某一個孤立點突然拉開,而是在大量資料點上逐步積累而成。更關鍵的是,一旦把真實的分組對應關係故意打亂,EFT 的閉合分值會立刻掉到 6–23。這說明它的優勢依賴真實的跨視窗對應關係,而不是隨便怎麼拼都能拼出來。

第二輪比較,問的是另一個更難的問題:會不會只是因為第一輪給暗物質一側設定的基線太簡單,所以 EFT 才顯得贏得明顯。於是題目不變、規則不變,只把暗物質一側繼續補強,加入 7 種更標準的增強寫法,包括濃度散布、絕熱收縮、feedback/core、層級 c–M 散布、單參 core 代理、透鏡端剪切標定,以及組合版 DM_STD;EFT 一側則保留 EFT_BIN 作為代表繼續對照。結果顯示,對照方並非完全沒有追回分數的空間,其中 feedback/core 分支確實把閉合分值從 122.205 小幅推高到 129.454;但這種提升仍明顯落後於 EFT_BIN 的 204.620。尤其 DM_STD 雖然能改善聯合擬合,卻沒有改善跨視窗閉合,說明它更像是把局部擬合做活了,而沒有把「同一張底圖」真正講順。

把這兩輪實驗放在一起看,P1 給出的不是一句「所有爭論到此結束」的口號,而是一個更紮實也更克制的結論:在這次覆蓋的星系尺度範圍內,旋轉曲線和弱透鏡更像是在讀同一張引力地圖;而 EFT 的平均引力響應寫法,比這次被拿來比較的暗物質基線及其補強版本,更貼近這張地圖的共同輪廓。也正因此,P1 的意義不只在於贏下一場擬合比較,而在於它為 EFT 最核心的底圖之一——如果真空確是一片「海」,那麼海就應在宏觀視窗留下底座痕跡——拿出了第一批可以複核的觀測證據。P1 已經完成;沿這條線繼續展開的後續實驗,才會決定這條線索最終是被加固、被改寫,還是被放棄。

這份實驗的完整報告見:Zenodo Concept DOI 10.5281/zenodo.18526334;完整重現軟體包見:Zenodo Concept DOI 10.5281/zenodo.18526286