附錄A 平均引力底座的第一輪星系尺度檢索（P1實驗）

EFT 是一套規模龐大的物理理論。它不可能靠一次實驗就被宣布成立，也不可能靠一次實驗就被徹底推翻。它只能在一系列可複核、可比較、可持續加壓的實驗中，被逐步支持、被收緊適用範圍，或被證偽。P1 便是這條實驗鏈上第一項星系尺度的檢索工作。它不是孤立事件，而是 P 系列首批實驗中的第一步；P1 已經完成，後續工作仍將沿不同觀測視窗持續展開。

之所以先從 P1 這樣一項實驗切入，有現實原因，也有理論原因。現實上，首批檢驗必須服從現有資源與公開資料的條件；一套新理論不可能一開始就把最昂貴、週期最長的實驗全部鋪開。理論上，EFT 的兩條起始公理是：真空不空，宇宙是一片連續的能量海；粒子不是點，而是捲起、閉合、上鎖的結構。用更短的話說，就是「真空是海，粒子是環」。若這套底圖成立，那麼大量不穩定、短壽命結構的持續生滅，在粗粒化之後，就有理由在宏觀引力讀數中留下平均底座的痕跡。P1 選擇的，正是這條最適合率先切入、也最能觸及底層公理的檢索方向：把 EFT 所說的平均引力效應，與傳統理論中的暗物質效應，做第一輪正面對照。

我們具體做的，是一組「換窗複核」的實驗。先看星系內部的物質怎麼轉，再看同類星系在更大尺度上如何讓背景光線產生偏折。前者是旋轉曲線，後者是星系—星系弱透鏡。實驗真正要找的，不是誰能把某一扇窗裡的現象單獨講通，而是誰能在換一扇窗之後，仍舊講的是同一張引力地圖。P1 使用了 104 個星系、2295 個旋轉曲線資料點，以及 4 個質量分組、共 60 個弱透鏡資料點。檢驗方法則很直接：先用旋轉曲線定出模型，再去預測弱透鏡，看它換窗之後還認不認得同一張圖。

第一輪比較裡，EFT 一側提出了 4 個模型：EFT_BIN、EFT_WEXP、EFT_WYUK、EFT_WPOW；對照方先提出 1 個最小冷暗物質基線：DM_RAZOR。結果是，4 個 EFT 模型全部占優。聯合比較的領先量達到 ΔlogL_total = 1155–1337；閉合比較裡，EFT 的分值為 172–281，而 DM_RAZOR 為 127。這裡的分值不是日常意義上的「考試分數」，而是累積證據量。數值越大，表示模型在整體比較中越穩定地占上風；上千的差距，不是靠某一個孤立點突然拉開，而是在大量資料點上逐步積累而成。更關鍵的是，一旦把真實的分組對應關係故意打亂，EFT 的閉合分值會立刻掉到 6–23。這說明它的優勢依賴真實的跨視窗對應關係，而不是隨便怎麼拼都能拼出來。

第二輪比較，問的是另一個更難的問題：會不會只是因為第一輪給暗物質一側設定的基線太簡單，所以 EFT 才顯得贏得明顯。於是題目不變、規則不變，只把暗物質一側繼續補強，加入 7 種更標準的增強寫法，包括濃度散布、絕熱收縮、feedback/core、層級 c–M 散布、單參 core 代理、透鏡端剪切標定，以及組合版 DM_STD；EFT 一側則保留 EFT_BIN 作為代表繼續對照。結果顯示，對照方並非完全沒有追回分數的空間，其中 feedback/core 分支確實把閉合分值從 122.205 小幅推高到 129.454；但這種提升仍明顯落後於 EFT_BIN 的 204.620。尤其 DM_STD 雖然能改善聯合擬合，卻沒有改善跨視窗閉合，說明它更像是把局部擬合做活了，而沒有把「同一張底圖」真正講順。

把這兩輪實驗放在一起看，P1 給出的不是一句「所有爭論到此結束」的口號，而是一個更紮實也更克制的結論：在這次覆蓋的星系尺度範圍內，旋轉曲線和弱透鏡更像是在讀同一張引力地圖；而 EFT 的平均引力響應寫法，比這次被拿來比較的暗物質基線及其補強版本，更貼近這張地圖的共同輪廓。也正因此，P1 的意義不只在於贏下一場擬合比較，而在於它為 EFT 最核心的底圖之一——如果真空確是一片「海」，那麼海就應在宏觀視窗留下底座痕跡——拿出了第一批可以複核的觀測證據。P1 已經完成；沿這條線繼續展開的後續實驗，才會決定這條線索最終是被加固、被改寫，還是被放棄。

這份實驗的完整報告見：Zenodo Concept DOI 10.5281/zenodo.18526334；完整重現軟體包見：Zenodo Concept DOI 10.5281/zenodo.18526286。