← Eksperyment

Teoria Włókna Energii (Energy Filament Theory, EFT): rama średniej grawitacji w porównaniu z minimalną bazą NFW dla zimnej ciemnej materii (DM)

Autor: Guanglin Tu
E-mail: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Afiliacja: grupa robocza EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Chiny)
Wersja: v1.1 | Data: 2026-02-14

Preprint (bez recenzji naukowej) | Niniejsza wersja służy publicznemu rozpowszechnianiu i weryfikowalnej kontroli; nie stanowi ostatecznej wersji czasopismowej.

Licencja: raport (CC BY-NC-ND 4.0); pełny pakiet reprodukcyjny (CC BY 4.0).

Raport publikacyjny (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Pełny pakiet reprodukcyjny (Concept DOI): https://doi.org/10.5281/zenodo.18526286

I. Streszczenie wykonawcze (Executive Summary)

Niniejszy raport jest pełnym raportem archiwalnym na poziomie publikacyjnym, zdeponowanym w Zenodo. Przedstawia jedną audytowalną ścieżkę: od danych, przez księgę modeli i uczciwe porównanie, po test domknięcia oraz materiały reprodukcyjne. Załącznik B (P1A) pełni funkcję uzupełnienia odpornościowego: zawiera test obciążeniowy „bardziej standardowej bazy DM + kluczowego błędu systematycznego soczewkowania”, służący sprawdzeniu, jak wrażliwe są główne wnioski tekstu na bardziej realistyczne modelowanie DM oraz obsługę systematyk soczewkowania.

Główne wnioski (cztery zdania, gotowe do cytowania; zob. § III.IV):

(1) W dopasowaniach krzywych rotacji (RC) rodzina modeli EFT wyraźnie przewyższa DM_RAZOR we wszystkich kombinacjach funkcji jądra i priorów; typowa poprawa wynosi Δlog𝓛_RC ≈ 10^3 (zob. tabela S1a).
(2) W teście domknięcia RC→GGL EFT daje silniejszą przenośność między sondami: siła domknięcia Δlog𝓛_closure (True−Perm) jest istotnie wyższa niż w DM_RAZOR, a różnica pozostaje odporna na skany covariance shrinkage, R_min oraz σ_int (zob. rysunek S3 i tabela S1b).
(3) W dopasowaniu łącznym (RC+GGL) EFT zachowuje stabilną przewagę; po negatywnej kontroli, która rozrywa wspólne mapowanie, przewaga ta się załamuje. Wspiera to interpretację, że „efekt średniej grawitacji” pochodzi ze wspólnego mapowania, a nie z przypadkowego dopasowania (zob. rysunek S4).
(4) Załącznik B (P1A) testuje stronę DM przy użyciu bardziej standardowych modułów bazowych DM oraz jednego kluczowego nuisance związanego z systematyką soczewkowania, bez istotnego zwiększania wymiarowości; te wzmocnienia nie usuwają przewagi EFT w domknięciu (zob. tabela B1 i rysunek B1).

Dostępność danych i kodu: raport Concept DOI 10.5281/zenodo.18526334; pełny pakiet reprodukcyjny Concept DOI 10.5281/zenodo.18526286. Etykiety odpowiadające załącznikowi B (P1A) to run_tag=20260213_151233, closure_tag=20260213_161731 oraz joint_tag=20260213_195428.

II. Streszczenie

Porównujemy ilościowo i w sposób reprodukowalny dwie ramy teoretyczne, korzystając z tych samych danych i tego samego protokołu statystycznego: model „korekty średniej grawitacji” proponowany przez Teorię filamentów energii (Energy Filament Theory, EFT; nie mylić z powszechnym skrótem Effective Field Theory) oraz bazowy model halo NFW zimnej ciemnej materii (DM_RAZOR). DM_RAZOR celowo wybrano jako „minimalną bazę DM”: halo NFW ze stałą relacją c–M, bez rozrzutu halo-to-halo, aby porównanie było audytowalne i możliwe do powtórzenia. Jednocześnie należy podkreślić, że w tym artykule EFT traktujemy jako fenomenologiczną, MOND-podobną parametryzację Pole efektywne lub efektywnej odpowiedzi, testowaną w jednym protokole statystycznym, a nie jako teorię, której mikrofizyczne wyprowadzenie z pierwszych zasad jest tu prezentowane.

Zbiór danych obejmuje 2295 punktów prędkości z krzywych rotacji SPARC po jednolitym wstępnym przetworzeniu i binowaniu (104 galaktyki, 20 binów RC) oraz równoważną gęstość powierzchniową ΔΣ(R) z galaxy-galaxy weak lensing KiDS-1000 (GGL): 4 biny masy gwiazdowej × 15 punktów R w każdym binie, łącznie 60 punktów, analizowanych z pełną kowariancją.

Kolejno wykonujemy inferencję RC-only, test domknięcia RC→GGL (closure), inferencję GGL-only oraz wspólną inferencję RC+GGL. Audyt spójności zapewnia odtwarzalność wszystkich cytowanych wartości. Przy ścisłej księdze parametrów i ograniczeniu wspólnego mapowania (DM: 20 parametrów log M200_bin; EFT: 20 parametrów log V0_bin + 1 globalny log ℓ) rodzina EFT znacząco przewyższa DM_RAZOR w dopasowaniu łącznym: ΔlogL_total = 1155–1337 względem DM_RAZOR. Co ważniejsze, test domknięcia pokazuje, że posterior z RC ma nietrywialną siłę predykcyjną dla GGL: w EFT ΔlogL_closure = 172–281, wobec 127 dla DM_RAZOR; po losowym przetasowaniu grupowania RC-bin→GGL-bin sygnał domknięcia spada do 6–23. Potwierdza to, że sygnał nie jest przypadkiem statystycznym ani stronniczością implementacji. W systematycznych skanach σ_int, R_min oraz covariance shrinkage względna przewaga EFT pozostaje dodatnia i stabilna co do rzędu wielkości. Aby odpowiedzieć na częsty zarzut, że baza DM jest zbyt słaba albo że systematyki są czytane jako fizyka, w załączniku B (P1A) przedstawiamy silniejszy, lecz nadal niskowymiarowy i audytowalny test obciążeniowy bazy DM, obejmujący hierarchiczny c–M scatter + prior, jednoparametrowy proxy core, lensing m oraz model złożony DM_STD. W tym samym protokole domknięcia te rozszerzenia nie usuwają przewagi EFT (zob. tabela B1/rysunek B1).

Słowa kluczowe: krzywe rotacji; galaxy-galaxy weak lensing; test domknięcia; EFT; zimna ciemna materia; inferencja bayesowska

III. Wprowadzenie i przegląd wyników

Krzywe rotacji (RC) oraz galaxy-galaxy weak lensing (GGL) są dwiema komplementarnymi sondami grawitacyjnymi. RC ogranicza potencjał dynamiczny w dysku i relację przyspieszenia radialnego (RAR), natomiast GGL mierzy rzutowany rozkład masy oraz odpowiedź grawitacyjną w skali halo. Dla każdej teorii-kandydata kluczowe nie jest to, czy potrafi osobno dopasować oba zbiory danych, lecz czy potrafi wyjaśnić je spójnie w ramach jednego mapowania między danymi i jednego wspólnego zestawu ograniczeń.

Dlatego centralnym protokołem statystycznym artykułu jest „test domknięcia” (closure test). Najpierw używamy posteriora RC-only do predykcji GGL w przód, a następnie porównujemy wynik z negatywną kontrolą, w której mapowanie RC-bin→GGL-bin zostaje spermutowane lub przetasowane. Tak mierzymy przenośność predykcyjną między zbiorami danych i odrzucamy pozorne sygnały wynikające z błędów implementacji albo przypadkowego dopasowania.

Pozycja teoretyczna i zakres: artykuł nie próbuje podać mikrofizycznego wyprowadzenia EFT z pierwszych zasad ani relatywistycznie kompletnej postaci EFT. Zamiast tego traktujemy EFT jako niskowymiarową, MOND-podobną parametryzację pola efektywnego lub efektywnej odpowiedzi, opisaną funkcją jądra f(x) oraz globalną skalą ℓ. W ramach ścisłej księgi parametrów testujemy, za pomocą domknięcia RC→GGL, spójność między zbiorami danych i przenośność predykcyjną.

Program badawczy i deklaracja zakresu: ten artykuł jest częścią trwającego programu obserwacyjnego serii P. W istniejących danych w skali galaktyk szukamy dwóch możliwych wkładów efektywnego tła: (i) „podłogi grawitacyjnej” (mean gravity floor), opisywalnej przez gruboziarnistą średnią odpowiedź grawitacyjną, oraz (ii) „podłogi szumu” (stochastic/noise floor), związanej z fluktuacjami procesów mikroskopowych. W tym artykule (P1) koncentrujemy się wyłącznie na pierwszej z nich: bez założeń dotyczących konkretnego mikrofizycznego mechanizmu powstawania szukamy obserwacyjnych oznak średniej podłogi grawitacyjnej poprzez test domknięcia RC→GGL i porównujemy je, w jednolitym protokole kontrolnym, z audytowalną bazą DM. Jako obraz heurystyczny można powiedzieć, że jeśli istnieją krótkożyciowe stopnie swobody, ich rozpad lub anihilacja może przekształcać masę spoczynkową w energię-pęd niesiony przez inne stopnie swobody; na poziomie efektywnym naturalnie odpowiada to rozdziałowi na „wkład średni + wkład fluktuacyjny”. W artykule nie modelujemy jednak tego obrazu mikroskopowego ilościowo.

Aby uniknąć nadinterpretacji, zakres artykułu jest następujący:
• Co artykuł robi: przy ścisłej księdze parametrów i wspólnym mapowaniu mierzy, za pomocą testu domknięcia, przenośność predykcyjną między zbiorami danych oraz reprodukowalnie porównuje średnią odpowiedź grawitacyjną EFT z bazą DM.
• Czego artykuł nie robi: nie omawia żadnego mikrofizycznego mechanizmu powstawania, obfitości, czasu życia ani ograniczeń kosmologicznych; nie modeluje też składnika losowego odpowiadającego „podłodze szumu”.
• Czego artykuł nie twierdzi: jego celem nie jest obalenie ciemnej materii. P1 nie wydaje ostatecznego werdyktu o istnieniu „podłogi”, lecz raportuje dowód etapowy: w wybranej tu, odpornej domenie pomiarowej dane preferują modele zawierające średnią odpowiedź grawitacyjną.

Jednocześnie jasno zaznaczamy, że DM_RAZOR reprezentuje jedynie minimalną, audytowalną bazę NFW: ze stałą relacją c–M, bez scatter, bez adiabatic contraction, feedback core, niesferyczności i składników środowiskowych. Dlatego główny wniosek tekstu jest ściśle ograniczony: przy tej minimalnej bazie oraz przy ścisłej księdze parametrów i mapowania EFT ma silniejszą spójność między danymi. Aby odpowiedzieć na częste pytanie, czy bardziej standardowa baza ΛCDM oraz modelowanie kluczowych systematyk soczewkowania znacząco zmieniłyby wniosek, porządkujemy niskowymiarowe, audytowalne wzmocnienia DM i nuisance po stronie soczewkowania w załączniku B (P1A: standaryzowany test obciążeniowy bazy DM), zachowując dokładnie tę samą co w tekście głównym definicję wspólnego mapowania i testu domknięcia (zob. tabela B1/rysunek B1).

III.I Tab S1a–S1b: podsumowanie kluczowych wskaźników (Strict)

Tabela S1a podaje główne wskaźniki porównawcze dopasowania łącznego (RC+GGL): logL, ΔlogL, AICc i BIC. Tabela S1b podaje wskaźniki testu domknięcia i skanów odporności: closure, negatywną kontrolę shuffle oraz zakresy skanów σ_int / R_min / cov-shrink. Wszystkie liczby pochodzą ze ścisłej tabeli zbiorczej Tab_Z1_master_summary i można je punkt po punkcie odtworzyć w archiwum publikacyjnym.

Tabela S1a|Główne wskaźniki dopasowania łącznego (RC+GGL, Strict).

Model (workspace)

Jądro W

k

Łączne logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabela S1b|Wskaźniki domknięcia i odporności (Strict).

Model (workspace)

Domknięcie ΔlogL (true-perm)

ΔlogL po negatywnej kontroli shuffle

Zakres ΔlogL w skanie σ_int

Zakres ΔlogL w skanie R_min

Zakres ΔlogL w skanie cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


III.II Fig S3: siła domknięcia (RC-only → predykcja GGL)

Siła domknięcia jest zdefiniowana jako ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: na próbkach posteriora RC-only wykonuje się predykcję GGL w przód i porównuje ją z negatywną kontrolą, w której mapowanie RC-bin→GGL-bin zostaje spermutowane.

Rysunek S3|Siła domknięcia (im większa, tym lepiej): średnia przewaga log-likelihood w predykcji RC-only → GGL.


III.III Fig S4: główne porównanie dopasowania łącznego (RC+GGL)

Przewaga w dopasowaniu łącznym jest zdefiniowana jako ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Przy tych samych danych, tym samym mapowaniu i niemal tej samej skali parametrów rodzina EFT uzyskuje znacząco wyższy łączny log-likelihood.

Rysunek S4|Przewaga dopasowania łącznego (im większa, tym lepiej): best logL_total dla RC+GGL względem DM_RAZOR.


III.IV Cztery wnioski (gotowe do bezpośredniego cytowania)

(1) W jednolitej analizie łącznej krzywych rotacji SPARC oraz słabego soczewkowania KiDS-1000 modele średniej odpowiedzi grawitacyjnej EFT systematycznie przewyższają DM_RAZOR w ścisłym protokole kontrolnym: ΔlogL_total = 1155–1337 względem DM_RAZOR.

(2) Test domknięcia RC→GGL pokazuje silniejszą spójność predykcyjną EFT: ΔlogL_closure = 172–281, podczas gdy DM_RAZOR osiąga 127. Po losowym przetasowaniu grupowania RC-bin→GGL-bin sygnał domknięcia spada do 6–23, co wskazuje, że zależy on od poprawnego mapowania między danymi, a nie od przypadkowego dopasowania.

(3) Systematyczne skany σ_int, R_min oraz covariance shrinkage nie zmieniają ani znaku, ani rzędu wielkości wyniku „EFT lepsze od DM_RAZOR”, co pokazuje odporność wniosku na typowe zakłócenia systematyczne.

(4) Załącznik B (P1A) wzmacnia bazę DM w tym samym protokole domknięcia w sposób „standaryzowany i audytowalny”: zachowuje trzy jednoparametrowe wzmocnienia SCAT/AC/FB, dodaje hierarchiczny c–M scatter + prior, jednoparametrowy proxy core oraz parametr kalibracji ścinania m po stronie soczewkowania, wraz z ich kombinacją DM_STD. Wyniki pokazują, że tylko gałąź feedback/core daje niewielką netto poprawę siły domknięcia (122.21→129.45, ΔΔlogL_closure≈+7.25); pozostałe wzmocnienia nie wnoszą istotnego, a czasem wnoszą ujemny wkład do domknięcia. Główny wniosek tekstu nie zależy więc od założenia, że DM_RAZOR jest zbyt słaby.

IV. Dane i przygotowanie wstępne

Badanie korzysta z dwóch rodzajów danych publicznych, a pobieranie, kontrola (sha256) i wstępne przetwarzanie są wykonywane w projekcie za pomocą odtwarzalnych skryptów. Aby zapewnić uczciwe porównanie między modelami, wszystkie workspace’y (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) współdzielą dokładnie te same produkty danych i to samo mapowanie binów.


IV.I Krzywe rotacji (RC, SPARC)

Dane RC pochodzą z bazy SPARC Rotmod_LTG (175 plików rotmod). Po wstępnym przetworzeniu do modelowania włączono 104 galaktyki, łącznie 2295 punktów danych (r, V_obs), podzielonych według masy gwiazdowej i pokrewnych reguł na 20 binów RC. Każdy punkt zawiera promień r (kpc), obserwowaną prędkość V_obs (km/s), błąd σ_obs oraz składowe prędkości gazu, dysku i zgrubienia centralnego (V_gas, V_disk, V_bul).


IV.II Słabe soczewkowanie (GGL, KiDS-1000 / Brouwer+2021)

Dane GGL wykorzystują równoważną gęstość powierzchniową ΔΣ(R) z Fig.3 w pracy Brouwer i in. (2021) dla KiDS-1000: 4 biny masy gwiazdowej, po 15 punktów R w każdym, wraz z pełną kowariancją. W części inżynieryjnej pierwotną kowariancję long-form odtworzono jako macierze 15×15 dla każdego binu, a w audycie Stage-B sprawdzono sensowność wymiarów i wartości liczbowych.


IV.III Mapowanie RC-bin → GGL-bin i łączna liczba próbek

Cztery biny masy GGL są połączone z dwudziestoma binami RC stałym mapowaniem: każdy GGL-bin odpowiada pięciu binom RC, a wkłady RC-bin są uśredniane z wagami liczby galaktyk. Mapowanie to pozostaje niezmienne we wszystkich modelach i stanowi kluczowe ograniczenie uczciwości dla testu domknięcia i dopasowania łącznego. Ostateczna łączna liczba punktów danych wynosi n_total = 2355 (RC=2295, GGL=60).

V. Modele i metody statystyczne


V.I Minimalna specyfikacja matematyczna EFT i DM (audytowalna / testowalna)

W tej sekcji podajemy minimalną specyfikację matematyczną bezpośrednio odpowiadającą implementacji.

(a) Model krzywych rotacji (RC)

Dla każdego punktu danych RC (r, V_obs, σ_obs) używamy sumowania składowych: V_mod²(r) = V_bar²(r) + V_extra²(r). Tutaj V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). W głównych wynikach przyjmujemy Υ_d = Υ_b = 0.5, zgodnie z rekomendacjami empirycznymi SPARC i w celu ograniczenia zbędnych stopni swobody.

(b) Korekta średniej grawitacji EFT (EFT)

Dodatkowy składnik EFT parametryzujemy jako „średni kwadrat prędkości”: V_extra²(r) = V0_bin² · f(r/ℓ). V0_bin jest parametrem amplitudy dla każdego binu RC (20 parametrów), ℓ jest skalą globalną (1 parametr), a f(x) jest bezwymiarową funkcją kształtu jądra. Porównywane w artykule kształty jąder, które nie wprowadzają dodatkowych ciągłych stopni swobody, to:

Motywacja fizyczna (rozszerzona): EFT interpretuje dodatkową odpowiedź grawitacyjną w skali galaktyk jako efektywną odpowiedź po gruboziarnistym uśrednieniu lub uśrednieniu skali bardziej mikroskopowego oddziaływania na skończonych skalach. W tym artykule nie zakładamy konkretnego mechanizmu mikroskopowego; stosujemy minimalną, audytowalną parametryzację, aby prowadzić kontrolowane porównanie i test w jednym protokole statystycznym.

Dla intuicji dodatkowy składnik można zapisać w postaci przyspieszenia: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Gdy r≫ℓ, f→1 i V_extra→V0_bin, co daje w zewnętrznym obszarze niemal płaski wkład dodatkowej prędkości. Gdy r≪ℓ i f(x)≈x, można wprowadzić charakterystyczną skalę przyspieszenia a0,bin≈V0_bin²/ℓ (z dokładnością do czynnika jądra rzędu O(1)), co dostarcza MOND-podobnej intuicji przejścia między obszarem wewnętrznym i zewnętrznym.

Dyskretną rodzinę jąder używaną w artykule (none/exponential/yukawa/powerlaw_tail) można traktować jako niskowymiarowe proxy dla różnych „nachyleń startowych / szybkości przejścia / ogona dalekiego zasięgu”, na przykład ekranowania Yukawa-like wobec dłuższego ogona odpowiedzi. Służy to testom odporności, a nie wyczerpaniu przestrzeni modeli. W części dotyczącej słabego soczewkowania z V_avg(r) konstruujemy równoważną masę i gęstość powłoki, a następnie rzutujemy je do ΔΣ(R); tę efektywną gęstość należy rozumieć jako opis potencjału soczewkowania przy założeniu symetrii sferycznej i słabego pola. Pełne szczegóły przeniesiono do załącznika A.

Wszystkie powyższe kształty jąder spełniają f(x)→1 dla x→∞, czyli V_extra²→V0² w nasyceniu, a dla x≪1 dają wzrost liniowy lub podliniowy: na przykład exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Dlatego różne kształty jąder mają obserwowalnie różne „nachylenia startowe”, szybkości przejścia i zewnętrzne ogony na małych promieniach, które można rozróżniać przez dopasowanie łączne RC+GGL i test domknięcia.

Predykcja EFT dla słabego soczewkowania ΔΣ(R) jest otrzymywana przez odtworzenie z V_avg(r) masy zamkniętej i gęstości powłoki, a następnie przez całkowanie projekcyjne: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Implementacja numeryczna korzysta z siatki logarytmicznej i adaptacyjnie zagęszcza ją w przypadkach anomalii, aby zapewnić stabilność i powtarzalność.

(c) DM_RAZOR: baza halo NFW zimnej ciemnej materii

Jednocześnie jasno zaznaczamy, że DM_RAZOR reprezentuje tylko minimalną, audytowalną bazę NFW: ze stałą relacją c–M, bez scatter, bez adiabatic contraction, feedback core, niesferyczności ani składników środowiskowych. Aby ograniczyć ryzyko „strawman baseline”, nie twierdzimy, że te efekty nie istnieją. Przeciwnie, włączamy je w niskowymiarowy i audytowalny sposób do załącznika B (P1A) jako test obciążeniowy: obejmuje to hierarchiczną obsługę c–M scatter, proxy core oraz nuisance kalibracji ścinania po stronie soczewkowania.


V.II Księga modeli i uczciwe porównanie (wspólne parametry = definicja domknięcia)

Liczba parametrów w głównym zbiorze porównawczym wynosi: DM_RAZOR k=20; rodzina EFT k=21, gdzie dodatkowy parametr to globalny log ℓ. Wszystkie modele współdzielą te same dane RC, te same dane GGL i kowariancję, to samo mapowanie RC-bin→GGL-bin, te same składniki barionowe i te same konwersje jednostek. Ponadto kształt jądra (none / exponential / yukawa / powerlaw_tail) jest wyborem dyskretnym i nie wprowadza dodatkowego parametru ciągłego, co zapobiega uzyskaniu przewagi jedynie przez „jeden stopień swobody więcej”.


V.III Likelihood, priory i sampler

Likelihood RC jest diagonalnie gaussowski: σ_eff² = σ_obs² + σ_int². W wynikach głównych przyjmujemy σ_int=5 km/s i skanujemy σ_int w Run-5. Likelihood GGL jest pełnym gaussowskim likelihoodem kowariancji w każdym binie: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Łączny cel ma postać logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Priory wyrażają głównie granice fizycznej dopuszczalności, czyli zakresy log ℓ, log V0 oraz log M200; przy włączeniu swobodnych Υ i σ_int stosujemy priory słabo informacyjne, zgodnie z konfiguracją implementacji i pakietu release.

Sampler wykorzystuje adaptacyjny random walk block Metropolis: w każdym kroku aktualizowany jest losowy podblok przestrzeni parametrów, co zwiększa akceptację w wysokim wymiarze, a długość kroku jest lekko adaptowana według okienkowej akceptacji, z docelową akceptacją około 0.25. Wyniki główne używają trybu quick (np. n_steps=800), a każdy workspace zapisuje trace, reszty i wykresy PPC do audytu ręcznego i skryptowego.


V.IV Test domknięcia i kontrola negatywna (definicja)

Test domknięcia (Run-2) sprawdza, bez ponownego dopasowywania GGL, czy posterior RC-only potrafi przewidywać GGL. Procedura jest następująca: na próbkach posteriora RC-only generujemy w przód ΔΣ(R) dla 4 binów GGL i obliczamy logL_true z pełną kowariancją; następnie losowo permutujemy grupowanie RC-bin→GGL-bin, aby uzyskać logL_perm. Siłę domknięcia definiujemy jako ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Dodatkowo Run-10 losowo przegrupowuje 20 binów RC w 4×5 (shuffle) i ponownie liczy domknięcie, aby sprawdzić zależność sygnału od poprawnego mapowania.

VI. Główne wyniki i interpretacja


VI.I Główne wyniki dopasowania łącznego (RC+GGL)

Najlepsze logL_total dopasowania łącznego oraz względna przewaga ΔlogL_total względem DM_RAZOR podano w tabeli S1a i na rysunku S4. W głównym zbiorze porównawczym największą przewagę łączną uzyskuje EFT_BIN (ΔlogL_total=1337.210), a pozostałe kształty jąder EFT także zachowują wyraźną przewagę (1154.827–1294.442). Według kryteriów informacyjnych (AICc/BIC) rodzina EFT również znacząco przewyższa DM_RAZOR, co wskazuje, że przewaga nie wynika z samej liczby parametrów.

Uwaga: główny wkład do ΔlogL_total≈1337 pochodzi ze składnika RC (w rozkładzie joint ΔlogL_RC≈1065, około 80%). Można to rozumieć jako umiarkowaną poprawę na poziomie Δχ²≈0.90 na punkt dla N=2295 punktów RC, która przy diagonalnym gaussowskim likelihoodzie naturalnie kumuluje się do przewagi rzędu 10^3. Jednocześnie GGL i test domknięcia dostarczają niezależnych ograniczeń między zbiorami danych, a ranking pozostaje stabilny w testach obciążeniowych σ_int, R_min i cov-shrink (zob. sekcja VII i tabela S1b).


VI.II Wyniki testu domknięcia (RC-only → GGL)

Kluczowa wielkość testu domknięcia, ΔlogL_closure, znajduje się w tabeli S1b i na rysunku S3. Siła domknięcia rodziny EFT wynosi 171.977–280.513 i jest wyższa niż 126.678 dla DM_RAZOR. Oznacza to, że bez dopuszczenia żadnych dodatkowych stopni swobody między danymi próbki posteriora uzyskane przez EFT na danych RC mają silniejszą przenośność predykcyjną dla danych GGL.

Kontrola negatywna dodatkowo wspiera fizyczną istotność sygnału domknięcia: po losowym przetasowaniu grupowania RC-bin→GGL-bin siła domknięcia EFT spada do 6–15, zależnie od jądra, podczas gdy siła domknięcia w oryginalnym mapowaniu wynosi 172–281. To „załamanie sygnału” wyklucza pozorną przewagę wywołaną błędem numerycznym, błędem jednostek albo niewłaściwą obsługą kowariancji.

Rysunek R1|Kontrola negatywna: po przetasowaniu grupowania sygnał domknięcia wyraźnie maleje (na podstawie wskaźników Tab_Z1).


VI.III Znaczenie wyników i ograniczenia

Wniosek z badania brzmi: „w tym zbiorze danych i w tym protokole średnia korekta grawitacyjna EFT przewyższa testowaną bazę DM_RAZOR”. Trzeba podkreślić, że po stronie DM użyto wyłącznie minimalnej bazy NFW ze stałą relacją c(M), bez korekty core, niesferyczności, składników środowiskowych czy bardziej złożonego modelu połączenia galaktyka–halo. Tekst nie twierdzi więc, że wyklucza wszystkie rodziny modeli DM; przedstawia natomiast reprodukowalną bazę porównawczą opartą na teście domknięcia, która pozwala ocenić, czy RC i GGL można spójnie wyjaśnić tym samym zestawem parametrów i mapowania między danymi.

Aby odpowiedzieć na tę często zgłaszaną wątpliwość, ukończyliśmy niezależne rozszerzenie P1A (zob. załącznik B). Nie zmienia ono wspólnego mapowania RC-bin→GGL-bin ani ramy audytu, lecz standaryzuje i wzmacnia bazę DM w sposób audytowalny: oprócz trzech jednoparametrowych wzmocnień SCAT/AC/FB dodaje (i) hierarchiczny c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) jednoparametrowy proxy baryonic-feedback core (DM_CORE1P), oraz (iii) nuisance kalibracji ścinania po stronie słabego soczewkowania m (DM_RAZOR_M), a także model złożony DM_STD. EFT_BIN pozostaje zachowany jako odniesienie kontrolne.

• DM_RAZOR_SCAT (c–M scatter) — wprowadza parametr rozrzutu koncentracji halo-to-halo σ_logc, aby sprawdzić, czy stałe c(M) systematycznie zaniża zdolność wyjaśniającą DM;
• DM_RAZOR_AC (Adiabatic Contraction) — używa jednego parametru α_AC do ciągłej interpolacji między „brakiem kontrakcji” a „standardową kontrakcją”, minimalnym kosztem wychwytując trend wewnętrznej kontrakcji powodowanej przez bariony;
• DM_RAZOR_FB (Feedback / core) — opisuje efekty core w obszarze wewnętrznym za pomocą skali core, np. log r_core, i zachowuje przybliżenie NFW w skali słabego soczewkowania.

Ilościowy scoreboard P1A znajduje się w tabeli B1 / rysunku B1 załącznika B (generowany automatycznie z Tab_S1_P1A_scoreboard). W metryce domknięcia DM_RAZOR_FB daje niewielką poprawę netto (122.21→129.45, +7.25), podczas gdy pozostałe wzmocnienia nie wnoszą istotnego lub wnoszą ujemny wkład do siły domknięcia. Po stronie dopasowania łącznego dodanie hierarchicznego priora c–M scatter (DM_HIER_CMSCAT) albo modelu złożonego (DM_STD) może znacząco poprawić joint logL, ale nie poprawia siły domknięcia; wskazuje to, że wzrost dotyczy głównie elastyczności dopasowania łącznego, a nie przenośności między sondami. Dlatego główny wniosek tekstu należy rozumieć tak: przy ścisłym wspólnym mapowaniu i ograniczeniu testem domknięcia przewaga spójności EFT między danymi nie wynika z wyboru „zbyt słabej bazy” po stronie DM. Pakiet publikacyjny P1A odpowiadający załącznikowi B (uzupełniające tabele/rysunki oraz full_fit_runpack) zostanie włączony jako plik dodatkowy do tego samego Zenodo Concept DOI: https://doi.org/10.5281/zenodo.18526286

VII. Odporność i eksperymenty kontrolne


VII.I Skan σ_int (Run-5)

Systematycznie skanujemy wewnętrzny rozrzut RC, σ_int, i dla każdej wartości σ_int powtarzamy inferencję łączną, obliczając ΔlogL_total względem DM_RAZOR. Minimalne i maksymalne wartości ΔlogL_total w zakresie skanu dla poszczególnych modeli podano w tabeli S1b.

Rysunek R2|Zakres ΔlogL_total w skanie σ_int (im większy, tym lepiej).


VII.II Skan R_min (Run-6)

Aby zbadać wpływ systematycznych błędów danych w obszarze centralnym, takich jak ruchy niekołowe, rozdzielczość czy niedostateczne modelowanie barionów, przycinamy RC progiem R_min i powtarzamy inferencję łączną. Przewaga rodziny EFT w skanie R_min pozostaje dodatnia i stabilna co do rzędu wielkości.

Rysunek R3|Zakres ΔlogL_total w skanie R_min (im większy, tym lepiej).


VII.III Skan cov-shrink (Run-7)

Aby zbadać niepewność kowariancji GGL, stosujemy shrinkage do macierzy kowariancji w każdym binie masy: C_α=(1−α)C+α·diag(C), a następnie skanujemy α. Wyniki pokazują, że przewaga rodziny EFT jest niewrażliwa na tę procedurę.

Rysunek R4|Zakres ΔlogL_total w skanie cov-shrink (im większy, tym lepiej).


VII.IV Drabina ablacji (Run-8)

Wewnątrz EFT_BIN wykonujemy zagnieżdżoną ablacją krokową: od modelu skrajnie prostego, bez wolnych parametrów, przez warianty zachowujące niewielką liczbę stopni swobody, aż po pełną amplitudę 20-bin + skalę globalną. AICc/BIC pokazują, że pełny EFT_BIN jest istotnie potrzebny do wyjaśnienia danych.

Rysunek R5|Drabina ablacji EFT_BIN (AICc; im mniejsze, tym lepiej).


VII.V Predykcja leave-one-bin-out (Run-9)

Dodatkowo wykonujemy test leave-one-bin-out (LOO): wśród 4 binów masy GGL każdorazowo odkładamy 1 bin, inferujemy ponownie na pozostałych binach oraz wszystkich danych RC, a następnie oceniamy testowy log-likelihood na binie odłożonym. Wskaźniki zbiorcze podano w tabeli uzupełniającej Tab_R3_leave_one_bin_out (produkt Run-9; wzorzec ścieżek plików znajduje się w liście kluczowych produktów w § IX.II). Rodzina EFT wyraźnie przewyższa DM_RAZOR nawet w najgorszym przypadku odłożenia.

Rysunek R6|LOO: rozkład log-likelihood dla odłożonego binu (z produktu Run-9).


VII.VI Kontrola negatywna: RC-bin shuffle (Run-10)

Run-10 losowo przegrupowuje 20 binów RC w 4×5 i, przy niezmienionym posteriorze RC-only, ponownie liczy domknięcie. Wyniki pokazują, że w porównaniu z pierwotnym mapowaniem shuffle wyraźnie obniża mean logL_true oraz ΔlogL_closure (zob. tabela S1b i rysunek R1), co dodatkowo wspiera interpretowalność sygnału domknięcia.

Rysunek R7|Kontrola negatywna: mapowanie shuffle wyraźnie obniża mean logL_true domknięcia (z produktu Run-10).

VIII. Traceability i audyt spójności (Provenance)

Wszystkie liczby cytowane w artykule można punkt po punkcie odtworzyć ze ścisłych tabel zbiorczych i zapisów audytowych archiwum publikacyjnego. Aby zachować płynność tekstu głównego, pełny łańcuch provenance — lista tagów, tabele audytu, lista checksum oraz sposób kontroli — przeniesiono do załącznika A.

IX. Reprodukowalność i archiwizacja Zenodo (Reproducibility & Archive)

Oświadczenie o dostępności danych i kodu: krzywe rotacji SPARC oraz dane słabego soczewkowania KiDS-1000 użyte w artykule są danymi publicznymi. Raport publikacyjny został zarchiwizowany w Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), a pełny pakiet reprodukcyjny zarchiwizowano w Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Szczegółowe kroki wykonania, zależności, lista archiwalna i informacje o kontroli hashy znajdują się w załączniku A; projekt, tagi uruchomień i wyniki standaryzowanego testu obciążeniowego bazy DM (P1A) znajdują się w załączniku B.

W ramach tego samego Concept DOI pełnego pakietu reprodukcyjnego (https://doi.org/10.5281/zenodo.18526286) udostępniamy dwa wejścia reprodukcyjne, każde do innego celu:
• P1 (tekst główny) full_fit_runpack: odtwarza RC-only / closure / joint oraz skany odporności EFT vs DM_RAZOR, a także generuje tabele S1a/S1b i rysunki S3/S4 z tekstu głównego;
• P1A (załącznik B) full_fit_runpack: odtwarza standaryzowany test obciążeniowy bazy DM (SCAT/AC/FB + hierarchiczny c–M scatter prior + core1p + lensing m + DM_STD, wraz z kontrolą EFT_BIN) i generuje tabelę B1 oraz rysunek B1 załącznika.
Uzupełniające tabele/rysunki P1A oraz full_fit_runpack zostają włączone jako pliki dodatkowe pod tym samym Concept DOI, aby zachować jedno wejście archiwalne.

X. Podziękowania i oświadczenia


X.I Podziękowania

Dziękujemy zespołom SPARC i KiDS-1000 za publiczne dane i dokumentację; dziękujemy również uczestnikom procesu rekonstrukcji i audytu tego projektu.


X.II Wkład autora

Guanglin Tu odpowiadał za sformułowanie koncepcji badania, projekt metodyczny, implementację techniczną, kurację danych, analizę formalną, wdrożenie procesu reprodukowalności i audytu oraz napisanie artykułu.


X.III Finansowanie

Finansowanie własne Guanglina Tu (brak finansowania zewnętrznego / brak numeru grantu).


X.IV Konflikt interesów

Guanglin Tu jest powiązany z EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Chiny); nie zgłoszono innych konfliktów interesów.


X.V Wsparcie AI

OpenAI GPT-5.2 Pro oraz Gemini 3 Pro wykorzystano do redakcji językowej, edycji strukturalnej i porządkowania procesu reprodukowalności. Nie użyto ich do generowania ani modyfikowania danych, wyników, figur ani kodu; nie użyto ich także do generowania cytowań. Autor ponosi pełną odpowiedzialność za treść artykułu i dokładność odniesień.

XI. Bibliografia

Załącznik A: szczegóły traceability i reprodukowalności

Załącznik zbiera informacje o traceability i reprodukowalności przeznaczone do długoterminowej archiwizacji: tagi uruchomień, wyniki audytu, listy archiwalne i kluczowe punkty kontroli, aby czytelnik mógł je sprawdzić i odtworzyć w razie potrzeby.


A.I Szczegóły traceability i audytu

Aby zapewnić długoterminową odtwarzalność, projekt nadaje każdemu uruchomieniu i wyjściu tag czasowy oraz zachowuje historyczne produkty bez nadpisywania. Kluczowe liczby cytowane w artykule pochodzą ze ścisłej kompilacji (compile_tag=20260205_035929) i przeszły następujące audyty spójności:

• Wszystkie tabele etapowe zawierają run_tag i tag etapu; skrypt ścisłej kompilacji wybiera z report/tables kanoniczne źródła tabel, które są kompletne i spójne.

• Wartości w Tab_Z1_master_summary i Tab_Z2_conclusion_highlights zostały punkt po punkcie porównane z wybranymi tabelami kanonicznymi.

• Podczas generowania PDF wykonywany jest audyt tagów cytowanych tabel i figur, aby upewnić się, że nie doszło do wymieszania starych produktów.

Kluczowe tagi, służące do lokalizacji wszystkich produktów pośrednich: run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Wynik audytu spójności: Tab_AUDIT_checks_strict pokazuje pass=9, fail=0, skip=0 (szczegóły w pakiecie release).


A.II Kroki wykonania reprodukowalności i lista archiwalna

Badanie korzysta z systemu reprodukcji „raport publikacyjny + suplement tabel i figur + pełny pakiet uruchomieniowy do ponownego wykonania”. Czytelnik może bezpośrednio sprawdzić Tables & Figures Supplement, aby zweryfikować wszystkie tabele i figury cytowane w artykule. Aby odtworzyć liczby i łańcuch audytu od zera, można użyć full_fit_runpack do pobrania danych i ponownego wykonania pełnego procesu; po zakończeniu uruchomienia wartości tabel można zweryfikować skryptem porównawczym z tabelą referencyjną zawartym w pakiecie.


A.II.I Reprodukcja Quickstart (RUN_FULL, Windows PowerShell)

Ta sekcja podaje krótszą ścieżkę reprodukcji dla Windows PowerShell. Do szybkiej kontroli zaleca się bezpośrednie sprawdzenie Tables & Figures Supplement, punkt po punkcie dla tabel i figur cytowanych w artykule. Jeżeli potrzebna jest reprodukcja end-to-end i wygenerowanie wszystkich tabel, figur oraz produktów audytu, należy użyć full_fit_runpack: zgodnie z README/ONE_PAGE_REPRO_CHECKLIST w pakiecie uruchomić verify_checksums.ps1 i RUN_FULL.ps1, najlepiej z Mode=full.

Wejście archiwalne Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Tagi głównego łańcucha artykułu: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.


A.II.II Materiały archiwalne i kluczowe punkty kontroli (Packages & checks)

Archiwum Zenodo zawiera trzy komplementarne klasy materiałów: (1) raport publikacyjny (ten artykuł, v1.1, wraz z załącznikiem B: P1A standaryzowany test obciążeniowy bazy DM); (2) Tables & Figures Supplement, czyli suplement tabel i figur obejmujący wszystkie aktywa tabelaryczne i graficzne cytowane w artykule, osobno dla P1 i P1A; (3) full_fit_runpack, czyli pełny pakiet reprodukcyjny, który pobiera dane od zera i ponownie uruchamia cały proces, osobno dla P1 i P1A. Materiały (1)–(2) wspierają szybkie czytanie i niezależną kontrolę, natomiast (3) zapewnia pełną reprodukcję end-to-end.

Kategoria materiału

Nazwa pliku (przykład)

Zastosowanie i pozycjonowanie (zalecana kolejność dla czytelników)

Raport publikacyjny (chiński i angielski)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Pełny raport zarchiwizowany w Zenodo; tekst główny podaje zasadnicze wnioski i audyt odporności, a załącznik B przedstawia P1A (standaryzowany test obciążeniowy bazy DM).

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Wszystkie tabele (CSV) i figury (PNG) cytowane w tekście głównym, wraz ze skryptami generującymi i plikami tagów.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Wszystkie tabele i figury cytowane w załączniku B (P1A), w tym Tab_S1_P1A_scoreboard i Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

Pełna reprodukcja end-to-end: pobranie danych od zera i ponowne uruchomienie RC-only/closure/joint oraz skanów odporności.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

Reprodukcja end-to-end dla załącznika B: ponowne uruchomienie DM 7+1 + DM_STD (wraz z kontrolą EFT_BIN) i wygenerowanie aktywów załącznika; pakiet zawiera skrypt kontroli tabeli referencyjnej do walidacji wartości tabelarycznych.

Zalecenie cytowania: przy cytowaniu artykułu lub towarzyszących mu materiałów reprodukcyjnych należy podać Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Po reprodukcji powinny pojawić się i być możliwe do porównania następujące kluczowe produkty:

Załącznik B: P1A — standaryzowany test obciążeniowy bazy DM (DM 7+1 + DM_STD; z kontrolą EFT)

Załącznik dokumentuje rozszerzenie P1A zgodne z protokołem domknięcia tekstu głównego: standaryzowany test obciążeniowy bazy DM. Jego celem jest, bez wprowadzania wielu stopni swobody oraz bez zmiany wspólnego mapowania RC-bin→GGL-bin ani ramy audytu, podniesienie minimalnego DM_RAZOR z tekstu głównego (NFW + stałe c–M, bez scatter/kontrakcji/core) do kolekcji baz DM bliższej praktyce astrofizycznej i bardziej odpornej na typowe zarzuty. P1A obejmuje i rozszerza wcześniejszy trójgałęziowy test obciążeniowy: zachowuje SCAT/AC/FB, dodaje hierarchiczny c–M scatter + prior, jednoparametrowy proxy core oraz nuisance kalibracji ścinania m po stronie soczewkowania, a także model złożony DM_STD. EFT_BIN pozostaje jako odniesienie kontrolne.

Uwaga dodatkowa: siła domknięcia i inne wartości w załączniku B (P1A) używają wyższego budżetu Monte Carlo, np. ndraw=400 i nperm=24, niż szybkie budżety tekstu głównego obejmujące pełną rodzinę jąder EFT, np. ndraw=60 i nperm=12. Bezwzględne wartości mogą więc różnić się o dryf próbkowania rzędu O(10). Porównania między modelami w tej samej tabeli i tym samym budżecie pozostają jednak uczciwe, a znak i rząd wielkości przewagi są stabilne między budżetami.


B.I Cel i pozycjonowanie (dlaczego P1A i dlaczego jako załącznik)

P1A nie próbuje wyczerpać wszystkich możliwych modeli halo ΛCDM, takich jak niesferyczność, zależność od środowiska, złożone powiązanie galaktyka–halo czy wysokowymiarowa fizyka barionowa. Zamiast tego P1A stosuje zasadę „niskowymiarowo, audytowalnie i reprodukowalnie”: każdy moduł wzmocnienia dodaje najwyżej jeden kluczowy parametr efektywny i podlega trzem twardym ograniczeniom artykułu:
(i) księga parametrów: każdy nowy parametr musi być jawnie zaksięgowany i raportowany wraz z kryteriami informacyjnymi (AICc/BIC);
(ii) wspólne mapowanie: pozostaje to samo grupowanie RC-bin→GGL-bin; nie wolno dostrajać mapowania osobno dla jednego zbioru danych;
(iii) test domknięcia: każde wzmocnienie musi wykazać realny zysk w przenoszeniu predykcji RC→GGL, a nie tylko lepsze dopasowanie RC-only.


B.II DM 7+1 + DM_STD: definicje modułów, parametry i wejście do posteriora łącznego

P1A jest niezależnym runpackiem, który udostępnia 8 workspace’ów DM (DM 7+1) oraz 1 kontrolę EFT. Wychodząc od DM_RAZOR jako bazy, konstruuje trzy historyczne jednoparametrowe wzmocnienia (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), dodaje trzy bardziej standardowe moduły defensywne (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), a następnie model złożony DM_STD. Wspólnym celem tych modułów jest, przy możliwie małym wzroście wymiaru, objęcie trzech najczęstszych krytyk: (a) jak scatter i prior relacji c–M wchodzą do modelu hierarchicznego; (b) czy główny efekt baryonic feedback można przybliżyć jednoparametrowym proxy core; oraz (c) czy kluczowa systematyka po stronie soczewkowania mogłaby zostać błędnie odczytana jako sygnał fizyczny.

Workspace

dm_model

Nowy parametr (≤1)

Motywacja fizyczna (rdzeń)

Zasada implementacji (przyjazna audytowi)

DM_RAZOR

NFW (fixed c–M, no scatter)

Minimalna, audytowalna baza halo ΛCDM; używana do ścisłego porównania z EFT

Stałe wspólne mapowanie; ścisła księga parametrów; baseline używany wyłącznie do porównania względnego

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

Relacja c–M ma rozrzut; przybliżenie jednym parametrem lognormalnego scatter

≤1 nowy parametr; wspólne mapowanie pozostaje; zysk domknięcia jest kryterium akceptacji

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Napływ barionów może powodować adiabatic contraction halo; jeden parametr przybliża siłę efektu

≤1 nowy parametr; mapowanie bez zmian; raportowane zmiany AICc/BIC i zysk domknięcia

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback może tworzyć core w obszarze wewnętrznym; jeden parametr skali core przybliża efekt

≤1 nowy parametr; domknięcie i kontrola negatywna w tej samej definicji; poprawa RC-only nie jest jedynym celem

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Bardziej standardowa hierarchiczna struktura c_i∼logN(c(M_i),σ_logc), wpływająca jednocześnie na posterior łączny RC i GGL

Jawny prior; marginalizacja latentnych c_i; pozostaje niskowymiarowe i audytowalne

DM_CORE1P

1-parameter core proxy (coreNFW/DC14-inspired)

log r_core

Jednoparametrowy proxy core uchwytuje główny efekt baryonic feedback bez wysokowymiarowych szczegółów formowania gwiazd

Cytowana standardowa literatura; ≤1 nowy parametr; powiązanie z testem domknięcia

DM_RAZOR_M

NFW + lensing shear-calibration nuisance

m_shear (GGL)

Kluczowa systematyka po stronie słabego soczewkowania zostaje ujęta jako parametr efektywny, aby zmniejszyć ryzyko czytania systematyki jako fizyki

Nuisance jawnie zaksięgowany; nie może wpływać wstecz na RC; ocena przede wszystkim przez odporne domknięcie

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Łączy trzy najczęstsze klasy krytyki w jednej, nadal niskowymiarowej standardowej bazie

Księga parametrów i kryteria informacyjne raportowane razem; domknięcie jako główny wskaźnik; najsilniejsza defensywna kontrola DM

Objaśnienie: nazwy parametrów podążają za implementacją techniczną, np. σ_logc, α_AC, log r_core oraz m_shear. Celem projektu P1A jest „wzmocnić bazę DM, ale zachować audytowalność”, a nie zamienić stronę DM w niekontrolowany wysokowymiarowy fitter. W szczególności DM_HIER_CMSCAT wprowadza c–M scatter hierarchicznie: dla każdego halo koncentracja c_i ma lognormalny rozrzut wokół c(M_i), ograniczony przez globalne σ_logc i prior c(M). Taka struktura hierarchiczna wpływa jednocześnie na posterior łączny RC i GGL.


B.III Protokół statystyczny i definicja produktów zgodne z tekstem głównym

P1A ponownie wykorzystuje wszystkie produkty danych, wspólne mapowanie i ramę audytu tekstu głównego. Kolejność uruchomień i definicje produktów pozostają takie same:
(1) Run-1: inferencja RC-only (wyjścia posterior_samples.npz i metrics.json);
(2) Run-2: test domknięcia RC→GGL (wyjścia closure_summary.json i permuted baseline);
(3) Run-3: dopasowanie łączne RC+GGL (wyjście joint_summary.json).
Wszystkie cytowane liczby pochodzą z automatycznie złożonej tabeli Tab_S1_P1A_scoreboard i można je po pełnym ponownym uruchomieniu P1A full_fit_runpack sprawdzić za pomocą wbudowanego skryptu porównania z tabelą referencyjną.


B.IV Główne wyniki, wejścia do tabel/figur i plan archiwizacji (ten sam DOI)

Ta sekcja przedstawia kluczowe ilościowe wnioski P1A. Tabela B1 zbiera najważniejsze wskaźniki dla RC-only, testu domknięcia RC→GGL oraz dopasowania łącznego RC+GGL; w nawiasach podano różnice względem bazy DM_RAZOR. Siła domknięcia jest zdefiniowana jako ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩; wyższa wartość jest lepsza. Rysunek B1 wizualizuje ten sam scoreboard. Najważniejsze punkty są następujące:
• spośród trzech gałęzi legacy tylko DM_RAZOR_FB (feedback/core) daje niewielką netto poprawę siły domknięcia: 122.21→129.45 (+7.25); SCAT i AC nie dają zysku netto;
• nowe DM_HIER_CMSCAT i DM_RAZOR_M mają bardzo mały wpływ na siłę domknięcia (~0), a DM_CORE1P również nie pokazuje istotnej poprawy netto;
• model złożony DM_STD może wyraźnie poprawić joint logL i zbliżyć się do optimum dopasowania łącznego, ale siła domknięcia spada. Wskazuje to, że zysk pochodzi głównie z elastyczności dopasowania, nie z przenośności między sondami;
• EFT_BIN jako kontrola pozostaje wyraźnie lepszy w sile domknięcia i w dopasowaniu łącznym. Główny wniosek tekstu jest więc odporny na wprowadzenie „silniejszej bazy DM + lensing nuisance”.

Dla bezpośredniego porównania z głównym równaniem tekstu tabele S1a–S1b podsumowują ścisłe wyniki rodziny EFT i DM_RAZOR: modele EFT poprawiają dopasowanie łączne o ΔlogL_total≈1155–1337 względem DM_RAZOR i osiągają w teście domknięcia ΔlogL_closure=172–281. P1A tylko czyni stronę DM trudniejszym przeciwnikiem; jego funkcją jest zmniejszenie zarzutów typu strawman baseline lub systematics-as-physics, a nie zastąpienie głównego porównania.

Tabela B1|Scoreboard P1A (im większa wartość, tym lepiej; wartości w nawiasach są różnicami względem bazy DM_RAZOR).

Gałąź modelu (workspace)

Δk

RC-only best logL_RC (Δ)

Siła domknięcia ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Rysunek B1|Scoreboard P1A: ΔlogL dla domknięcia i dopasowania łącznego względem baseline (im większa wartość, tym lepiej).

Etykiety jednego ukończonego przykładowego uruchomienia dla tego załącznika są następujące i służą do lokalizacji produktów pośrednich oraz tabel/figur P1A:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.V Zalecana forma cytowania (Appendix citation note)

Gdy czytelnicy chcą obok głównego wniosku przytoczyć również „standaryzowany test obciążeniowy bazy DM”, zaleca się dopisać przy cytowaniu głównego wniosku: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’