← 實驗

能量絲理論 (Energy Filament Theory, EFT) 的平均引力框架,對照冷暗物質(DM)的最小 NFW 基準模型

作者:屠廣林
電子郵件:riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
機構:EFT 工作組,深圳市能量絲科學研究有限公司(中國)
版本:v1.1 | 日期:2026-02-14

預印本(未經過同儕審查)|本版本用於公開傳播與可複核,不代表期刊最終發表版本。

授權條款:報告(CC BY-NC-ND 4.0);完整重現包(CC BY 4.0)。

發布級報告(Concept DOI):https://doi.org/10.5281/zenodo.18526334
完整重現包(Concept DOI):https://doi.org/10.5281/zenodo.18526286

0 執行摘要(Executive Summary)

本報告為 Zenodo 歸檔的發布級完整報告(Archive edition),提供從資料、模型帳本、公平比較、閉合檢驗到重現材料的一體化可稽核鏈條。附錄B(P1A)作為穩健性補充,集中給出“更標準 DM 基準模型 + 關鍵系統誤差”的壓力測試,用於檢驗正文主結論對更現實 DM 建模與透鏡系統誤差處理的敏感性。

核心結論(四句,可直接引用;詳見第2.4節):

(1)在旋轉曲線(RC)擬合中,EFT 系列在所有核函數/先驗組合下均顯著優於 DM_RAZOR;典型提升為 Δlog𝓛_RC ≈ 10^3(見表S1a)。
(2)在 RC→GGL 的閉合檢驗中,EFT 給出更強的跨探針可遷移性:閉合強度 Δlog𝓛_closure(True−Perm)顯著高於 DM_RAZOR,且差異對共變異數 shrinkage、R_min 與 σ_int 掃描具有穩健性(見圖S3、表S1b)。
(3)在聯合擬合(RC+GGL)中,EFT 仍維持穩定優勢,並在負對照(破壞共享映射)下優勢坍塌,支持“平均引力效應”來自共享映射而非擬合偶然性(見圖S4)。
(4)附錄B(P1A)在不顯著增加維度的前提下,用更標準的 DM 基準模型模組與一個關鍵透鏡系統誤差 nuisance 對 DM 側進行壓力測試;這些增強並未消除 EFT 的閉合優勢(見表B1、圖B1)。

資料與程式碼可取得性:報告 Concept DOI 10.5281/zenodo.18526334;完整重現包 Concept DOI 10.5281/zenodo.18526286。附錄B(P1A)對應的標籤為 run_tag=20260213_151233、closure_tag=20260213_161731、joint_tag=20260213_195428。

1 摘要

我們對兩類理論框架在同一資料與同一統計協議下進行可重現的定量比較:能量絲理論(Energy Filament Theory, EFT;與常見縮寫 Effective Field Theory 含義不同)提出的“平均引力修正”模型,以及冷暗物質(DM)NFW 暈的基準模型(DM_RAZOR)。其中 DM_RAZOR 刻意選取為“最小 DM 基準模型”:NFW 暈 + 固定 c–M 關係(不含 halo-to-halo scatter),用於提供可稽核、可複核的對照。 同時需要強調:本文將 EFT 視為一種唯象學的、類 MOND 的有效場/有效響應參數化,用於在統一統計協議下進行檢驗,而非在本文中推導其微觀第一性原理。

資料包含:SPARC 旋轉曲線(RC)經統一前處理與分箱後的 2295 個速度資料點(104 個星系,20 個 RC-bin),以及 KiDS-1000 的星系-星系弱透鏡(GGL)等效面密度 ΔΣ(R)(4 個恆星質量 bin × 每 bin 15 個 R 點,共 60 點,使用完整共變異數)。

我們依次執行 RC-only 推斷、RC→GGL 閉合檢驗(closure)、GGL-only 推斷與 RC+GGL 聯合推斷,並用一致性稽核保證所有引用數值可回溯。在嚴格的參數帳本與共享映射約束下(DM: 20 個 log M200_bin;EFT: 20 個 log V0_bin + 1 個全局 log ℓ),EFT 系列在聯合擬合上顯著優於 DM_RAZOR:ΔlogL_total = 1155–1337(相對 DM_RAZOR)。更關鍵地,閉合檢驗顯示 RC 後驗對 GGL 具有非平庸預測力:EFT 的閉合強度 ΔlogL_closure = 172–281,高於 DM_RAZOR 的 127;而將 RC-bin→GGL-bin 分組隨機打亂後,閉合訊號坍塌至 6–23,驗證該訊號不是統計偶然或實作偏差。在對 σ_int、R_min 與共變異數 shrinkage 的系統掃描下,EFT 相對優勢維持為正並量級穩定。為回應“DM 基準模型過弱/系統誤差當物理”這類常見質疑,我們在附錄B(P1A)提供一套更標準但仍低維、可稽核的 DM 基準模型壓力測試(含階層 c–M scatter + prior、單參 core 代理、lensing m 以及組合 DM_STD);在同一閉合協議下,這些增強並未消除 EFT 的閉合優勢(見表B1/圖B1)。

關鍵詞:旋轉曲線;星系-星系弱透鏡;閉合檢驗;EFT;冷暗物質;貝葉斯推斷

2 引言與結果概覽

旋轉曲線(RC)與星系-星系弱透鏡(GGL)是兩類互補的引力探針:RC 約束盤面內的動力學勢與徑向加速度關係(RAR),GGL 則測量投影質量分布與暈尺度的引力響應。對任何候選理論而言,關鍵不在於能否分別擬合兩套資料,而在於能否在同一套跨資料映射與共享約束下實現一致解釋。

因此,本文以“閉合檢驗(closure test)”為核心統計協議:先用 RC-only 後驗前向預測 GGL,再與置換 RC-bin→GGL-bin 映射的負對照(permutation / shuffle)比較,以評估跨資料遷移預測力(predictive transferability),並排除實作偏差或偶然擬合導致的偽訊號。

理論定位與範圍:本文不試圖在此稿中給出 EFT(能量絲理論)的微觀第一性原理推導或相對論完備形式。相反,我們將 EFT 作為一種低維、類 MOND 的有效場/有效響應參數化(由核函數 f(x) 與全域尺度 ℓ 描述),並在嚴格的參數帳本約束下,透過 RC→GGL 的閉合檢驗來測試其跨資料一致性與遷移預測能力。

研究計畫與範圍聲明:本文屬於一個持續的 P 系列觀測檢索計畫。我們在現有星系尺度資料中尋找兩類可能的有效背景貢獻:(i)可由粗粒化後的平均引力響應描述的“引力底座”(mean gravity floor),以及(ii)與微觀過程漲落相關的“噪聲底座”(stochastic/noise floor)。在本文(P1)中,我們僅聚焦於前者:在不引入任何微觀產生機制假設的前提下,透過 RC→GGL 的閉合檢驗檢索平均引力底座的觀測跡象,並在統一對照協議下與可稽核的 DM 基準模型比較。作為啟發式物理圖像,若存在短壽命自由度,其衰變/湮滅可將靜質量轉化為其他自由度攜帶的能量動量,在有效層面自然對應“平均值貢獻 + 波動貢獻”的分解;但本文不對該微觀圖像作定量建模。

為避免過度解讀,本文範圍邊界如下:
• 本文做什麼:在嚴格參數帳本與共享映射約束下,以閉合檢驗衡量跨資料遷移預測力,並對 EFT 平均引力響應與 DM 基準模型進行可重現對照。
• 本文不做什麼:不討論任何微觀產生機制、豐度/壽命或宇宙學約束;不建模“噪聲底座”對應的隨機項。
• 本文不主張:不以推翻暗物質為目標;P1 不對“底座是否存在”給出終局判決,而是報告階段性證據——在本文選取的穩健測量域內,資料更偏好包含平均引力響應的模型。

同時,我們明確 DM_RAZOR 僅代表一個最小化、可稽核的 NFW 基準模型(固定 c–M 且不含 scatter;不含絕熱收縮 Adiabatic Contraction、反饋 core、非球形與環境項)。因此,正文主結論嚴格限定為:在該最小基準模型與嚴格參數帳本/映射約束下,EFT 的跨資料一致性更強。為回應一個常見問題:更標準的 ΛCDM 基準模型與關鍵透鏡系統誤差建模是否會顯著改變結論,我們將更標準但仍低維可稽核的 DM 增強與透鏡端 nuisance 統一整理為附錄B(P1A:DM 基準模型標準化壓力測試),並維持與正文完全一致的共享映射與閉合檢驗口徑(見表B1/圖B1)。

2.1 Tab S1a–S1b:關鍵指標匯總(Strict)

表 S1a 給出聯合擬合(RC+GGL)的主比較指標(logL、ΔlogL、AICc、BIC);表 S1b 給出閉合檢驗與穩健性掃描指標(closure、shuffle 負對照、σ_int / R_min / cov-shrink 掃描範圍)。所有數值均來自嚴格匯總主表 Tab_Z1_master_summary,並可在發布歸檔包中逐項追溯。

表 S1a|聯合擬合主比較指標(RC+GGL,Strict)。

模型(workspace)

W核

k

聯合logL_total(best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

表 S1b|閉合與穩健性指標(Strict)。

模型(workspace)

閉合ΔlogL(true-perm)

負對照shuffle後ΔlogL

σ_int掃描ΔlogL範圍

R_min掃描ΔlogL範圍

cov-shrink掃描ΔlogL範圍

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig S3:閉合強度(RC-only → 預測 GGL)

閉合強度定義為 ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩:在 RC-only 後驗樣本上前向預測 GGL,並與“置換 RC-bin→GGL-bin 映射”的負對照相比。

圖 S3|閉合強度(越大越好):RC-only → GGL 預測的平均對數概似優勢。


2.3 Fig S4:聯合擬合主比較(RC+GGL)

聯合擬合優勢定義為 ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR)。在相同資料、相同映射、近似相同參數規模下,EFT 系列取得顯著更高的聯合對數概似。

圖 S4|聯合擬合優勢(越大越好):RC+GGL 的 best logL_total 相對 DM_RAZOR。


2.4 四句結論(可直接引用)

(1)在 SPARC 旋轉曲線 + KiDS-1000 弱透鏡的統一聯合分析中,EFT 平均引力框架模型在嚴格對照協議下系統性優於 DM_RAZOR:ΔlogL_total = 1155–1337(相對 DM_RAZOR)。

(2)RC→GGL 閉合檢驗表明 EFT 的預測一致性更強:ΔlogL_closure = 172–281,而 DM_RAZOR 為 127;並且將 RC-bin→GGL-bin 分組隨機打亂後閉合訊號坍塌至 6–23,顯示該訊號依賴正確的跨資料映射而非偶然擬合。

(3)對 σ_int、R_min 與共變異數 shrinkage 的系統掃描均未改變“EFT 優於 DM_RAZOR”的符號與量級,說明該結論對常見系統擾動具有穩健性。

(4)附錄B(P1A)在相同閉合協議下對 DM 基準模型進行“標準化且可稽核”的增強:保留三條一參數增強(SCAT/AC/FB),並新增階層 c–M scatter + prior、單參 core 代理與透鏡端剪切校準 m(及其組合 DM_STD)。結果顯示:僅 feedback/core 分支對閉合強度帶來小幅淨提升(122.21→129.45,ΔΔlogL_closure≈+7.25),其餘增強對閉合強度貢獻不顯著或為負,因此正文主結論不依賴 DM_RAZOR 過弱這一假設。

3 資料與前處理

本研究使用兩類公開資料,並在工程內用可追溯腳本完成下載、校驗(sha256)與前處理。為了保證跨模型公平比較,所有工作區(EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR)共享完全相同的資料產物與分箱映射。


3.1 旋轉曲線(RC,SPARC)

RC 資料來自 SPARC 資料庫的 Rotmod_LTG(175 個 rotmod 文件)。前處理後納入本項目建模的樣本為 104 個星系,共 2295 個 (r, V_obs) 資料點,並按恆星質量等規則劃分為 20 個 RC-bin。每個資料點包含半徑 r(kpc)、觀測速度 V_obs(km/s)與誤差 σ_obs,以及氣體/盤/核球分量速度(V_gas, V_disk, V_bul)。


3.2 弱透鏡(GGL,KiDS-1000 / Brouwer+2021)

GGL 資料採用 Brouwer 等(2021)在 KiDS-1000 上給出的 Fig.3 等效面密度 ΔΣ(R)(4 個恆星質量 bin,每 bin 15 個 R 點),並使用其提供的完整共變異數。工程中將原始 long-form 共變異數重建為每個 bin 的 15×15 方陣,並在 Stage-B 稽核中驗證維度與數值合理性。


3.3 RC-bin → GGL-bin 映射與總樣本量

GGL 的 4 個質量 bin 與 RC 的 20 個 bin 透過固定映射連接:每個 GGL-bin 對應 5 個 RC-bin,並以星系數權重對 RC-bin 貢獻做加權平均。該映射在所有模型中維持不變,是閉合檢驗與聯合擬合公平比較的核心約束。最終聯合資料點總數 n_total = 2355(RC=2295,GGL=60)。

4 模型與統計方法


4.1 EFT 與 DM 的最小數學規範(可稽核/可檢驗)

本節給出可直接對應實現的最小數學規範。

(a)旋轉曲線(RC)模型

對每個 RC 資料點 (r, V_obs, σ_obs),我們使用分量疊加:V_mod²(r) = V_bar²(r) + V_extra²(r)。其中 V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r)。在本文主結果中採用 Υ_d = Υ_b = 0.5(與 SPARC 經驗推薦一致;亦便於減少非必要自由度)。

(b)EFT 平均引力修正(EFT)

EFT 的額外項採用“平均速度平方”形式參數化:V_extra²(r) = V0_bin² · f(r/ℓ)。這裡 V0_bin 是每個 RC-bin 的幅度參數(20 個),ℓ 為全域尺度(1 個),f(x) 為無因次核形狀函數。本文比較的核形狀(均不引入額外連續自由度)為:

物理動機(擴展):EFT 將星系尺度上的額外引力響應理解為對更微觀作用在有限尺度上的粗粒化/尺度平均後的有效響應。在本文中,我們不預設某一具體微觀機制,而採用最小、可稽核的參數化,在統一統計協議下進行受控的比較與檢驗。

為便於直觀理解,可將額外項寫成加速度形式:a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ)。當 r≫ℓ 時,f→1,V_extra→V0_bin,從而給出外區近似平坦的額外速度貢獻;當 r≪ℓ 且 f(x)≈x 時,可引入特徵加速度尺度 a0,bin≈V0_bin²/ℓ(差一個 O(1) 的核函數因子),提供一種類 MOND 的內-外區過渡標度直覺。

本文採用的離散核族(none/exponential/yukawa/powerlaw_tail)可視為對不同“起始斜率/過渡快慢/長程尾端”的低維 proxy(例如 Yukawa-like 的屏蔽 vs 更長尾的響應),用於穩健性壓力測試而非窮盡模型空間。弱透鏡部分,我們由 V_avg(r) 構造等效包絡質量與密度並投影得到 ΔΣ(R);該等效密度應理解為在球對稱、弱場映射假設下對透鏡勢的有效描述(完整細節已移入附錄A)。

上述核形狀在 x→∞ 時均滿足 f(x)→1(即 V_extra²→V0² 的飽和),而在 x≪1 時給出線性或次線性增長:例如 exponential: f≈x;yukawa: f≈0.5x;powerlaw_tail: f≈0.5x。因此,不同核形狀在小半徑的“起始斜率”、過渡快慢與外側尾部上存在可觀測差異,可由 RC+GGL 的聯合與閉合檢驗加以區分。

弱透鏡 ΔΣ(R) 的 EFT 預測由 V_avg(r) 反推出包絡質量與密度,再透過投影積分得到:M_enc(r)=r·V_avg²(r)/G,ρ(r)=(1/4πr²)·dM_enc/dr,Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr,ΔΣ(R)=Σ̄(<R)−Σ(R)。數值實作採用對數網格並在異常時自適應加密,以保證穩定性與可重復性。

(c)DM_RAZOR:NFW 冷暗物質暈基準模型

同時,我們明確 DM_RAZOR 僅代表一個最小化、可稽核的 NFW 基準模型(固定 c–M 且不含 scatter;不含絕熱收縮 Adiabatic Contraction、反饋 core、非球形與環境項)。為了降低“strawman baseline”風險,本文並不聲稱這些效應不存在;相反,我們將其以低維、可稽核的方式納入附錄B(P1A)作為壓力測試:包括 c–M scatter 的階層化處理、core 代理與透鏡端剪切校準 nuisance 等。


4.2 模型帳本與公平比較(共享參數 = 閉合定義)

主比較集合的參數數目為:DM_RAZOR k=20;EFT 系列 k=21(多出的 1 個為全局 log ℓ)。所有模型共享:同一 RC 資料、同一 GGL 資料與共變異數、同一 RC-bin→GGL-bin 映射、同一重子項與單位轉換。此外,核形狀(none / exponential / yukawa / powerlaw_tail)為離散選擇,不額外引入連續參數,從而避免透過“多一個自由度”獲得優勢。


4.3 Likelihood、先驗與採樣器

RC 概似採用對角高斯:σ_eff² = σ_obs² + σ_int²;主結果固定 σ_int=5 km/s,並在 Run-5 中掃描 σ_int。GGL 概似採用逐 bin 的完整共變異數高斯:logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b)。聯合目標為 logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ)。先驗主要體現為物理可行邊界(對 log ℓ、log V0、log M200 的區間約束);當啟用自由 Υ 與 σ_int 時使用弱信息先驗(詳見實現與 release 包設定)。

採樣器使用自適應 block Metropolis 隨機遊走:每步僅更新參數空間的隨機子塊以提高高維接受率,並以窗口接受率對步長做輕量自適應(目標接受率約 0.25)。主結果採用 quick 模式(n_steps=800 等設置),並對每個工作區輸出 trace、殘差與 PPC 圖用於人工與腳本稽核。


4.4 閉合檢驗與負對照(定義)

閉合檢驗(Run-2)在不重新擬合 GGL 的前提下檢驗“RC-only 後驗是否能預測 GGL”。具體做法:在 RC-only 後驗樣本上前向生成 4 個 GGL-bin 的 ΔΣ(R),以完整共變異數計算 logL_true;再將 RC-bin→GGL-bin 的分組映射做隨機置換(permutation)得到 logL_perm。閉合強度定義為 ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩。此外,Run-10 將 20 個 RC-bin 隨機重分組為 4×5(shuffle)並重算閉合,用於檢驗閉合訊號對正確映射的依賴性。

5 主要結果與解釋


5.1 聯合擬合主結果(RC+GGL)

聯合擬合的 best logL_total 與相對優勢 ΔlogL_total(相對 DM_RAZOR)見表 S1a 與圖 S4。主比較集合中,EFT_BIN 的聯合優勢最大(ΔlogL_total=1337.210),其餘 EFT 核形狀亦維持顯著優勢(1154.827–1294.442)。在信息準則上(AICc/BIC),EFT 系列同樣顯著優於 DM_RAZOR,說明優勢並非來自參數數目的偏置。

注:ΔlogL_total≈1337 的主要貢獻來自 RC 項(在 joint 分解中 ΔlogL_RC≈1065,約佔 80%);這可理解為 N=2295 個 RC 資料點上每點 Δχ²≈0.90 的溫和改善在對角高斯概似下自然累積為 10^3 量級的優勢。與此同時,GGL 與閉合檢驗提供獨立的跨資料集約束,並且在 σ_int、R_min 與 cov‑shrink 壓力測試下排序維持穩定(見第 6 節與表 S1b)。


5.2 閉合檢驗結果(RC-only → GGL)

閉合檢驗的關鍵量 ΔlogL_closure 見表 S1b 與圖 S3。EFT 系列的閉合強度為 171.977–280.513,高於 DM_RAZOR 的 126.678。這意味著:在不允許任何額外跨資料自由度的條件下,EFT 在 RC 資料上得到的後驗樣本對 GGL 資料具有更強的可遷移預測能力。

負對照進一步支持閉合訊號的物理相關性:當隨機打亂 RC-bin→GGL-bin 分組後,EFT 的閉合強度降至 6–15(不同核略有差異),而基準模型閉合強度高達 172–281。該“訊號坍塌”排除了由數值實作、單位錯誤或共變異數處理不當導致的偽優勢。

圖 R1|負對照:shuffle 分組後閉合訊號顯著降低(基於 Tab_Z1 指標繪制)。


5.3 結果的含義與限制

本研究的結論是“在本資料集與本協議下,EFT 平均引力修正優於所測試的 DM_RAZOR 基準模型”。需要強調:DM 側僅採用最小 NFW 基準模型與固定 c(M) 關係,未引入例如核心化、非球形、環境項或更復雜的星系-暈連接模型。因此,本文並不宣稱排除所有 DM 模型族;而是提供一個可重現的、以閉合檢驗為中心的對照基準模型,用於評估“RC 與 GGL 是否能被同一套跨資料參數與映射一致解釋”。

為回應這一常見疑問,我們完成了一個獨立擴展工程 P1A(見附錄B),在不改變 RC-bin→GGL-bin 共享映射與稽核框架的前提下,對 DM 基準模型進行“標準化且可稽核”的增強:除三條一參數增強(SCAT/AC/FB)外,進一步加入(i)階層 c–M scatter + mass–concentration prior(DM_HIER_CMSCAT),(ii)一參數 baryonic-feedback core 代理(DM_CORE1P),以及(iii)弱透鏡端剪切校準 nuisance m(DM_RAZOR_M),並給出組合模型 DM_STD;同時保留 EFT_BIN 作為對照參照。

• DM_RAZOR_SCAT(c–M scatter)——引入 halo-to-halo 的濃度彌散參數 σ_logc,用於檢驗“固定 c(M)”是否系統性低估 DM 的可解釋能力;
• DM_RAZOR_AC(Adiabatic Contraction)——用單參數 α_AC 在“無收縮 ↔ 標準收縮”之間連續插值,以最小代價捕捉重子導致的內區收縮趋勢;
• DM_RAZOR_FB(Feedback / core)——用核心尺度(如 log r_core)描述內區核心化對旋轉曲線的抑制效應,並在弱透鏡尺度上維持 NFW 近似。

P1A 的定量 scoreboard 見附錄B表 B1 / 圖 B1(由 Tab_S1_P1A_scoreboard 自動生成)。在閉合指標上,DM_RAZOR_FB 給出小幅淨提升(122.21→129.45,+7.25),其餘增強對閉合強度貢獻不顯著或為負;而在聯合擬合側,加入階層 c–M scatter prior(DM_HIER_CMSCAT)或組合模型(DM_STD)可顯著改善 joint logL,但並未帶來閉合強度提升,提示其主要增加的是聯合擬合的靈活性而非跨探針可遷移性。因此正文的核心結論應理解為:在嚴格共享映射與閉合檢驗約束下,EFT 的跨資料一致性優勢並非源於對 DM 側“過弱基準模型”的選擇。附錄B對應的 P1A 發布包(補充表圖與 full_fit_runpack)將作為附加文件並入與本文 full_fit_runpack 相同的 Zenodo Concept DOI:https://doi.org/10.5281/zenodo.18526286

6 穩健性與對照實驗


6.1 σ_int 掃描(Run-5)

我們對 RC 的內稟散度 σ_int 做系統掃描,並在每個 σ_int 下重復聯合推斷,計算相對 DM_RAZOR 的 ΔlogL_total。各模型在掃描範圍內的 ΔlogL_total 最小/最大值見表 S1b。

圖 R2|σ_int 掃描下 ΔlogL_total 的範圍(越大越好)。


6.2 R_min 掃描(Run-6)

為檢驗中心區資料系統誤差(例如非圓運動、分辨率與重子建模不充分)的影響,我們對 RC 使用 R_min 閾值裁剪並重復聯合推斷。EFT 系列的優勢在 R_min 掃描下維持為正且量級穩定。

圖 R3|R_min 掃描下 ΔlogL_total 的範圍(越大越好)。


6.3 cov-shrink 掃描(Run-7)

為檢驗 GGL 共變異數不確定性,我們對每個質量 bin 的共變異數矩陣應用 shrinkage:C_α=(1−α)C+α·diag(C),並掃描 α。結果表明 EFT 系列的優勢對該處理不敏感。

圖 R4|cov-shrink 掃描下 ΔlogL_total 的範圍(越大越好)。


6.4 消融階梯(Run-8)

在 EFT_BIN 內部做嵌套消融:從極簡模型(無自由參數)到僅保留少量自由度,再到完整的 20-bin 幅度 + 全域尺度。AICc/BIC 顯示完整 EFT_BIN 在資料解釋上顯著必要。

圖 R5|EFT_BIN 的消融階梯(AICc,越小越好)。


6.5 留出預測(Run-9)

我們進一步執行 leave-one-bin-out(LOO)檢驗:在 GGL 的 4 個質量 bin 中每次留出 1 個 bin,用其餘 bin(以及全部 RC)重新推斷,再在留出 bin 上評估測試對數概似。匯總指標見補充表 Tab_R3_leave_one_bin_out(Run-9 產物;第 8.2 節關鍵產物列表中給出文件路徑模式),EFT 系列在最差留出情形下仍明顯優於 DM_RAZOR。

圖 R6|LOO:留出 bin 的對數概似分布(來自 Run-9 產物)。


6.6 負對照:RC-bin shuffle(Run-10)

Run-10 將 20 個 RC-bin 隨機重分組為 4×5,並在維持 RC-only 後驗不變的情況下重算閉合。結果顯示:與原始映射相比,shuffle 會顯著降低閉合的 mean logL_true 與 ΔlogL_closure(見表 S1b 與圖 R1),進一步支持閉合訊號的可解釋性。

圖 R7|負對照:shuffle 映射導致閉合 mean logL_true 明顯下降(來自 Run-10 產物)。

7 可追溯性與一致性稽核(Provenance)

本文所有引用數值均可在發布歸檔的嚴格匯總表與稽核記錄中逐項追溯。為保證正文閱讀更順暢,完整的追溯鏈(tag 列表、稽核表、checksum 清單與核查方式)已移入附錄A。

8 可重現性與 Zenodo 歸檔(Reproducibility & Archive)

資料與程式碼可用性聲明:本文使用的 SPARC 旋轉曲線與 KiDS-1000 弱透鏡資料均為公開資料。發布級報告已歸檔至 Zenodo(Concept DOI:https://doi.org/10.5281/zenodo.18526334),完整重現包已歸檔至 Zenodo(Concept DOI:https://doi.org/10.5281/zenodo.18526286)。詳細的執行步驟、依賴環境、歸檔清單與哈希校驗信息見附錄A;DM 基準模型標準化壓力測試(P1A)的設計、運行標籤與產出見附錄B。

在同一完整重現包 Concept DOI(https://doi.org/10.5281/zenodo.18526286)下,我們按用途提供兩套可重現入口:
• P1(正文)full_fit_runpack:重現 EFT vs DM_RAZOR 的 RC-only / closure / joint 及穩健性掃描,並生成正文表 S1a/S1b 與圖 S3/S4 等資產;
• P1A(附錄B)full_fit_runpack:重現 DM 基準模型標準化壓力測試(SCAT/AC/FB + 階層 c–M scatter prior + core1p + lensing m + DM_STD;含 EFT_BIN 對照),並生成附錄表 B1 與圖 B1。
P1A 的補充表圖與 full_fit_runpack將作為附加文件並入同一 Concept DOI,以維持單一歸檔入口。

9 致謝與聲明


9.1 致謝

感謝 SPARC 與 KiDS-1000 團隊提供公開資料與文檔;感謝本項目重建與稽核流程的參與者。


9.2 作者貢獻

屠廣林負責本研究的概念提出、方案設計、工程實施、資料整理、形式分析、重現流程實現與稽核,以及論文撰寫。


9.3 經費來源

作者屠廣林個人自籌(無外部資助/無基金編號)。


9.4 競争性利益

作者屠廣林與“EFT 工作組,深圳市能量絲科學研究有限公司(中國)”存在關聯關係;無其他競争性利益。


9.5 AI 輔助

使用 OpenAI GPT-5.2 Pro 和 Gemini 3 Pro 進行語言潤色、結構化編輯與重現流程梳理;未用於生成或修改資料、結果、圖表與程式碼;未用於生成引用;作者對全文內容與引用準確性承擔全部責任。

10 參考文獻

附錄A:可追溯性與可重現性細節

本附錄匯總用於長期歸檔的可追溯性與可重現性信息(運行標籤、稽核結果、歸檔清單與核對要點等),便於讀者按需核查與重現。


A.1 可追溯性與稽核細節

為保證長期可追溯性,本項目對每次運行與輸出使用時間戳 tag,並保留歷史產物不覆蓋。本文引用的核心數值來自嚴格匯總(compile_tag=20260205_035929),並已透過以下一致性稽核:

• 所有階段性表格均帶 run_tag 與階段 tag;嚴格匯總腳本從 report/tables 中選擇“完備且一致”的 canonical 表格來源。

• Tab_Z1_master_summary 與 Tab_Z2_conclusion_highlights 的數值與所選 canonical 表格逐項比對。

• 生成 PDF 時對“引用的表/圖的 tag”做標籤稽核,確保不存在混用舊產物。

關鍵標籤(用於定位全部中間產物):run_tag=20260204_122515;closure_tag=20260204_124721;joint_tag=20260204_152714;sigma_sweep_tag=20260204_161852;rmin_sweep_tag=20260204_195247;covshrink_tag=20260204_203219;ablation_tag=20260204_214642;LOO_tag=20260204_224827;negctrl_tag=20260204_234528;strict_compile_tag=20260205_035929;release_tag=20260205_112442。

一致性稽核結果:Tab_AUDIT_checks_strict 顯示 pass=9, fail=0, skip=0(詳見 release 包)。


A.2 可重現性執行步驟與歸檔清單

本研究採用“發布級報告 + 表圖補充材料 + 全量可重跑運行包”的重現體系:讀者可直接查閱 Tables & Figures Supplement 核對本文引用的全部表/圖資產;如需從零重現數值與稽核鏈條,可使用 full_fit_runpack 下載資料並重跑全流程(運行結束後可用包內 reference 表對照腳本驗證表單數值一致性)。


A.2.1 重現 Quickstart(RUN_FULL,Windows PowerShell)

本節給出一條更簡短的重現路徑(Windows PowerShell)。快速核查建議直接查閱 Tables & Figures Supplement,以逐項核對本文引用的表格與圖形。若需端到端重現並生成全部表/圖與稽核產物,請使用 full_fit_runpack:按包內 README/ONE_PAGE_REPRO_CHECKLIST 執行 verify_checksums.ps1 與 RUN_FULL.ps1(建議 Mode=full)。

Zenodo 歸檔入口(Concept DOI):https://doi.org/10.5281/zenodo.18526286
本文主鏈條標籤:run_tag=20260204_122515,strict compile_tag=20260205_035929, release_tag:20260205_112442。


A.2.2 歸檔材料與關鍵核對點(Packages & checks)

Zenodo 歸檔提供以下 3 類互補材料:(1)發布級報告(本文,v1.1;含附錄B:P1A DM 基準模型標準化壓力測試);(2)Tables & Figures Supplement(表格與圖表補充材料:覆蓋本文引用的全部表/圖資產;分別對應 P1 與 P1A);(3)full_fit_runpack(完整重現包:從零下載資料並重跑全流程;分別對應 P1 與 P1A)。其中(1)–(2)支持快速閱讀與獨立核查,(3)提供端到端全量重現能力。

材料類別

文件名(示例)

用途與定位(建議讀者按此順序使用)

發布級報告(中文和英文)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Zenodo 歸檔的完整報告;正文給出主結論與穩健性稽核,附錄B給出 P1A(DM 基準模型標準化壓力測試)。

Tables & Figures Supplement(P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

本文正文引用的全部表格(CSV)與圖形(PNG),含生成腳本與標籤文件。

Tables & Figures Supplement(P1A)

P1A_supplement_figs_tables_v1.zip

附錄B(P1A)引用的全部表格與圖形,含 Tab_S1_P1A_scoreboard 與 Fig_S1_P1A_scoreboard。

full_fit_runpack(P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

端到端全量重現:從零下載資料並重跑 RC-only/closure/joint 與穩健性掃描。

full_fit_runpack(P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

端到端全量重現(附錄B):重跑 DM 7+1 + DM_STD(含 EFT_BIN 對照)並生成附錄資產;包內含 reference 表對照腳本,用於驗證表單數值一致性。

引用建議:引用本文或隨附重現材料時,請注明 Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334)。

重現後應出現並可比對的關鍵產物包括:

附錄B:P1A—DM 基準模型標準化壓力測試(DM 7+1 + DM_STD;含 EFT 對照)

本附錄記錄一個與正文閉合協議一致的“DM 基準模型標準化壓力測試”擴展工程(P1A)。其定位是:在不引入大量自由度、不改變 RC-bin→GGL-bin 共享映射與稽核框架的前提下,把正文使用的最小 DM_RAZOR(NFW + 固定 c–M、無散射/無收縮/無 core)提升為更貼近天體物理實踐、且更能抵御常見質疑的 DM 基準模型集合。P1A 覆蓋並超集此前的三分支壓力測試:在保留 SCAT/AC/FB 的同時,新增階層 c–M scatter + prior、單參 core 代理與透鏡端剪切校準 nuisance m,並提供組合模型 DM_STD;同時保留 EFT_BIN 作為對照參照。

補充說明:附錄B(P1A)中的閉合強度等數值採用更高的 Monte Carlo 預算(例如 ndraw=400, nperm=24),與正文中用於覆蓋完整 EFT 核族的 quick 預算(例如 ndraw=60, nperm=12)不同,因而絕對數值可能存在 O(10) 級的採樣漂移;但在相同預算/同一表內的模型間比較是公平的,且優勢符號與量級在不同預算下維持穩定。


B.1 目的與定位(Why P1A, and why as an Appendix)

P1A 並不試圖窮盡所有 ΛCDM 暈建模可能(例如非球形、環境依賴、復雜的星系-暈連接或高維 baryon physics)。相反,P1A 採用“低維、可稽核、可重現”的原則:每個增強模組只引入 ≤1 個關鍵有效參數,並繼續接受本文的三條硬約束:
(i)參數帳本:新增參數必須明確記帳並與信息準則(AICc/BIC)一起報告;
(ii)共享映射:仍使用同一 RC-bin→GGL-bin 分組映射,不允許為單一資料集單獨‘調映射’;
(iii)閉合檢驗:任何增強都必須在 RC→GGL 的遷移預測上體現真實增益,而不僅是 RC-only 擬合變好。


B.2 DM 7+1 + DM_STD:模組定義、參數與進入聯合後驗的方式

P1A 作為一個獨立 runpack,提供 8 個 DM 工作區(DM 7+1)以及 1 個 EFT 對照:以 DM_RAZOR 為基準模型,構造三條 legacy 一參數增強(DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB),並新增三條更標準的防御性模組(DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M),再給出組合模型 DM_STD。這些模組的共同目標是:在盡量不增加維度的前提下,覆蓋最常見的三類質疑:(a)c–M 關係的彌散與先驗如何進入階層模型;(b)baryonic feedback 的主效應可否由一參 core 代理;(c)透鏡端關鍵系統誤差是否可能被誤當作物理訊號。

Workspace

dm_model

新增參數(≤1)

物理動機(核心)

實作原則(稽核友善)

DM_RAZOR

NFW (fixed c–M, no scatter)

最小化、可稽核的 ΛCDM 暈基準模型;用於與 EFT 做嚴格對照

共享映射固定;參數帳本嚴格;作為 baseline 僅用於相對比較

DM_RAZOR_SCAT

NFW + c–M scatter(legacy)

σ_logc

c–M 關係存在彌散;用一參 log-normal scatter 近似

≤1 新參;仍用共享映射;以閉合增益為驗收標準

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

重子落入可能引發暈絕熱收縮;用一參強度近似

≤1 新參;不改映射;報告 AICc/BIC 變化與閉合增益

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

反饋可在內區形成 core;用一參 core 尺度近似

≤1 新參;閉合/負對照同口徑;不以 RC-only 改善為唯一目標

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc(hier)

更標準的階層化 c_i∼logN(c(M_i),σ_logc);同時影響 RC 與 GGL 聯合後驗

顯式先驗;latent c_i 邊緣化;仍維持低維可稽核

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

用一參 core 代理 baryonic feedback 主效應,避免高維星形成細節

引用標準文獻;≤1 新參;與閉合檢驗綁定

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear(GGL)

將弱透鏡端關鍵系統誤差以有效參數吸收,降低“把系統誤差當物理”風險

nuisance 明確記帳;不允許反向影響 RC;結果以閉合穩健為主

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

把最常見三類常見質疑同時納入一個仍低維的標準基準模型

參數帳本+信息準則齊報;閉合為主指標;作為最強 DM 防御對照

說明:上述參數命名以工程實現為準(例如 σ_logc、α_AC、log r_core、m_shear)。P1A 的設計重點是“把 DM 基準模型做強一點,但仍然可稽核”,而不是把 DM 側變成不可控的高維擬合器。特別地,DM_HIER_CMSCAT 以階層方式引入 c–M scatter:對每個 halo 的濃度 c_i 設定圍繞 c(M_i) 的 log-normal 彌散,並透過全局 σ_logc 與 c(M) 先驗將其約束;該階層結構會同時影響 RC 與 GGL 的聯合後驗。


B.3 與正文一致的統計協議與產物口徑

P1A 復用正文的全部資料產物、共享映射與稽核框架,執行順序與產物口徑維持一致:
(1)Run‑1:RC-only 推斷(輸出 posterior_samples.npz 與 metrics.json);
(2)Run‑2:RC→GGL 閉合檢驗(輸出 closure_summary.json 與 permuted baseline);
(3)Run‑3:RC+GGL 聯合擬合(輸出 joint_summary.json)。
所有引用數字均來自自動匯總表(Tab_S1_P1A_scoreboard),並可透過 P1A full_fit_runpack 在全流程重跑後使用內置 reference 表對照腳本複核。


B.4 主要結果、表圖入口與歸檔計畫(同 DOI)

本節給出 P1A 的核心定量結論。表 B1 匯總 RC-only、RC→GGL 閉合與 RC+GGL 聯合擬合的關鍵指標(括號中為相對 DM_RAZOR baseline 的差值);閉合強度定義為 ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩(越大越好)。圖 B1 給出同一 scoreboard 的可視化。結論要點如下:
• legacy 三分支中,僅 DM_RAZOR_FB(feedback/core)對閉合強度帶來小幅淨提升:122.21→129.45(+7.25);SCAT 與 AC 無淨提升;
• 新增的 DM_HIER_CMSCAT 與 DM_RAZOR_M 對閉合強度影響很小(~0),DM_CORE1P 亦未顯示顯著淨提升;
• 組合模型 DM_STD 可顯著改善 joint logL(更貼近聯合擬合最優),但閉合強度反而下降,提示其主要提升來自聯合擬合靈活性而非跨探針可遷移性;
• EFT_BIN 作為對照在閉合強度與聯合擬合上仍維持明顯優勢,因此正文主結論對“更強 DM 基準模型 + 透鏡 nuisance”的引入具有穩健性。

為便於與正文主比較直接對照,正文 Tab S1a–S1b 匯總了 EFT 系列與 DM_RAZOR 的嚴格對照結果:EFT 模型在聯合擬合中相對 DM_RAZOR 提升 ΔlogL_total≈1155–1337,並在閉合檢驗中達到 ΔlogL_closure=172–281;P1A 只是對 DM 側做“更難的對照”,其作用是降低“strawman baseline / systematics-as-physics”這類質疑點,而非替代正文的主比較。

表 B1|P1A scoreboard(越大越好;括號為相對 DM_RAZOR baseline 的差值)。

模型分支(workspace)

Δk

RC-only best logL_RC (Δ)

閉合強度 ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

圖 B1|P1A scoreboard:閉合與聯合的 ΔlogL 相對 baseline(越大越好)。

本附錄對應的一組已完成運行的示例標籤如下(用於定位 P1A 的中間產物與表圖):
P1A run_tag = 20260213_151233;P1A closure_tag = 20260213_161731;P1A joint_tag = 20260213_195428。


B.5 建議引用方式(Appendix citation note)

當讀者需要在正文主結論之外引用“DM 基準模型標準化壓力測試”時,建議在引用本文主結論的同時注明:‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’