← تجربات

P1_RC_GGL: کہکشانی حرکیات اور کمزور عدسی اثر کا سخت بندش ٹیسٹ (گردشی منحنیات + GGL)

EFT اوسط-کششِ ثقل فریم ورک بمقابلہ سرد تاریک مادّے (DM) کے لیے کم سے کم NFW بنیادی خط

مصنف: Guanglin Tu
ای میل: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
وابستگی: EFT Working Group، Shenzhen Energy Filament Science Research Co., Ltd. (China)
ورژن: v1.1 | تاریخ: 2026-02-14

پری پرنٹ (ہم مرتبہ نظرثانی شدہ نہیں) | یہ ورژن عوامی اشاعت اور قابلِ تکراریت کے لیے ہے، اور جرنل میں شائع ہونے والے حتمی ورژن کی نمائندگی نہیں کرتا۔

لائسنس: رپورٹ (CC BY-NC-ND 4.0)؛ مکمل تولیدی پیکیج (CC BY 4.0)۔

اشاعتی معیار کی رپورٹ (Concept DOI): https://doi.org/10.5281/zenodo.18526334
مکمل تولیدی پیکیج (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 انتظامی خلاصہ

یہ رپورٹ Zenodo میں جمع کی گئی اشاعتی معیار کی آرکائیو ایڈیشن ہے۔ یہ ڈیٹا، ماڈل لیجر، منصفانہ موازنہ، بندش ٹیسٹ اور قابلِ تکراریت کے مواد پر مشتمل ایک مربوط اور قابلِ آڈٹ سلسلہ فراہم کرتی ہے۔ ضمیمہ B (P1A) مضبوطی کے اضافی ضمیمے کے طور پر کام کرتا ہے۔ اس میں “زیادہ معیاری DM بنیادی خط + عدسی اثر کی ایک کلیدی منظم خطا” کے ساتھ دباؤ ٹیسٹ کیے گئے ہیں، تاکہ مرکزی نتائج کی حساسیت کو زیادہ حقیقت پسندانہ DM ماڈلنگ اور عدسی منظم خطاؤں کے علاج کے مقابل پر پرکھا جا سکے۔

مرکزی نتائج (چار براہِ راست قابلِ اقتباس بیانات؛ سیکشن 2.4 دیکھیں):

(1) گردشی منحنی (RC) فٹنگ میں، EFT خاندان تمام kernel/prior امتزاجات کے تحت DM_RAZOR سے نمایاں طور پر بہتر کارکردگی دکھاتا ہے؛ ایک عام بہتری Δlog𝓛_RC ≈ 10^3 ہے (جدول S1a دیکھیں)۔
(2) RCGGL بندش ٹیسٹ میں، EFT زیادہ مضبوط cross-probe منتقلی دکھاتا ہے: بندش کی قوت Δlog𝓛_closure (TruePerm) DM_RAZOR کے مقابلے میں نمایاں طور پر زیادہ ہے، اور covariance shrinkage، R_min اور σ_int scans کے تحت یہ فرق مضبوط رہتا ہے (شکل S3 اور جدول S1b دیکھیں)۔
(3) مشترک فٹ (RC+GGL) میں، EFT ایک مستحکم برتری برقرار رکھتا ہے؛ اس منفی کنٹرول کے تحت جو مشترک mapping کو توڑتا ہے، یہ برتری ڈھہ جاتی ہے، جس سے یہ تعبیر تقویت پاتی ہے کہ “اوسط کششِ ثقل اثر” اتفاقی فٹ کے بجائے مشترک mapping سے آتا ہے (شکل S4 دیکھیں)۔
(4) ابعاد میں نمایاں اضافہ کیے بغیر، ضمیمہ B (P1A) DM طرف کو زیادہ معیاری DM بنیادی modules اور عدسی منظم خطا کے ایک اہم nuisance کے ساتھ stress-test کرتا ہے۔ یہ اضافے EFT کی بندش برتری ختم نہیں کرتے (جدول B1 اور شکل B1 دیکھیں)۔

ڈیٹا اور کوڈ کی دستیابی: رپورٹ Concept DOI 10.5281/zenodo.18526334؛ مکمل تولیدی پیکیج Concept DOI 10.5281/zenodo.18526286۔ ضمیمہ B (P1A) سے متعلق tags یہ ہیں: run_tag=20260213_151233، closure_tag=20260213_161731، اور joint_tag=20260213_195428۔

1 خلاصہ

ہم ایک ہی ڈیٹا اور ایک ہی شماریاتی پروٹوکول کے تحت دو نظریاتی فریم ورکوں کا قابلِ تکرار مقداری موازنہ کرتے ہیں: Energy Filament Theory (EFT؛ effective field theory کے عام اختصار سے الگ) کا مجوزہ “اوسط-کششِ ثقل correction” ماڈل، اور سرد تاریک مادّے (DM) کا NFW halo بنیادی ماڈل (DM_RAZOR)۔ DM_RAZOR کو جان بوجھ کر “کم سے کم DM بنیادی خط” کے طور پر چنا گیا ہے: مقررہ cM relation والا NFW halo، جس میں halo-to-halo scatter شامل نہیں، تاکہ ایک قابلِ آڈٹ اور قابلِ تکرار کنٹرول دستیاب رہے۔ یہ بھی واضح رہے کہ یہ مقالہ EFT کو اس کام کے اندر microscopic first principles سے اخذ نہیں کرتا، بلکہ اسے ایک phenomenological، MOND نما effective-field/effective-response parameterization کے طور پر ایک متحد شماریاتی پروٹوکول کے تحت پرکھتا ہے۔

ڈیٹا میں SPARC گردشی منحنیات (RC) سے 2,295 رفتار data points شامل ہیں، جنہیں یکساں preprocessing اور binning سے گزارا گیا ہے (104 کہکشائیں، 20 RC bins)، ساتھ ہی KiDS-1000 galaxygalaxy weak-lensing (GGL) excess surface density ΔΣ(R) شامل ہے (4 stellar-mass bins × ہر bin میں 15 R points، کل 60 points، مکمل covariance کے ساتھ)۔

ہم سلسلہ وار RC-only inference، RCGGL بندش ٹیسٹ، GGL-only inference، اور مشترک RC+GGL inference انجام دیتے ہیں، اور consistency audits کے ذریعے یقینی بناتے ہیں کہ ہر نقل کیا گیا عدد traceable ہو۔ سخت parameter ledger اور shared-mapping constraints کے تحت (DM: 20 log M200_bin parameters؛ EFT: 20 log V0_bin parameters + 1 global log ℓ)، مشترک فٹ میں EFT خاندان DM_RAZOR سے نمایاں طور پر بہتر ہے: DM_RAZOR کے مقابل ΔlogL_total = 1155–1337۔ اس سے بھی اہم یہ کہ بندش ٹیسٹ دکھاتا ہے کہ RC posterior میں GGL کے لیے غیر معمولی predictive power ہے: EFT کی بندش قوت ΔlogL_closure = 172–281 ہے، جو DM_RAZOR کے 127 سے زیادہ ہے۔ جب RC-binGGL-bin grouping کو random shuffle کیا جاتا ہے تو بندش signal 6–23 تک گر جاتا ہے، جو تصدیق کرتا ہے کہ signal نہ تو شماریاتی اتفاق ہے اور نہ implementation artifact۔ σ_int، R_min اور covariance shrinkage کی systematic scans میں EFT کی نسبتی برتری مثبت اور magnitude میں مستحکم رہتی ہے۔ “DM baseline بہت کمزور ہے” یا “systematics کو physics سمجھ لیا گیا ہے” جیسے عام اعتراضات کے جواب میں ضمیمہ B (P1A) زیادہ معیاری مگر اب بھی کم ابعادی اور قابلِ آڈٹ DM-baseline stress test فراہم کرتا ہے، جس میں hierarchical cM scatter + prior، ایک one-parameter core proxy، lensing m، اور combined DM_STD model شامل ہیں۔ اسی closure protocol کے تحت یہ اضافے EFT کی بندش برتری کو ختم نہیں کرتے (جدول B1/شکل B1 دیکھیں)۔

کلیدی الفاظ: گردشی منحنیات؛ کہکشاں-کہکشاں کمزور عدسی اثر؛ بندش ٹیسٹ؛ EFT؛ سرد تاریک مادّہ؛ Bayesian inference

2 تعارف اور نتائج کا جائزہ

گردشی منحنیات (RC) اور galaxygalaxy weak lensing (GGL) کششِ ثقل کے دو تکمیلی probes ہیں: RC disk plane میں dynamical potential اور radial acceleration relation (RAR) کو constrain کرتا ہے، جبکہ GGL projected mass distribution اور halo-scale gravitational response کو measure کرتا ہے۔ کسی بھی candidate theory کے لیے اصل سوال یہ نہیں کہ وہ دونوں datasets کو الگ الگ fit کر سکتی ہے یا نہیں، بلکہ یہ ہے کہ کیا وہ ایک ہی cross-data mapping اور shared constraints کے تحت انہیں مستقل طور پر explain کر سکتی ہے۔

اسی بنا پر یہ مقالہ “closure test” کو اپنا مرکزی شماریاتی پروٹوکول بناتا ہے: پہلے RC-only posterior سے GGL کو forward-predict کیا جاتا ہے، پھر اسے ایک منفی کنٹرول سے compare کیا جاتا ہے جس میں RC-binGGL-bin mapping کو permute/shuffle کیا جاتا ہے۔ اس سے cross-data predictive transferability کا جائزہ لیا جاتا ہے اور implementation bias یا accidental fitting سے پیدا ہونے والے false signals کو رد کیا جاتا ہے۔

نظریاتی پوزیشننگ اور دائرہ کار: یہ مقالہ EFT (Energy Filament Theory) کی microscopic first-principles derivation یا relativistically complete formulation پیش کرنے کی کوشش نہیں کرتا۔ اس کے بجائے، ہم EFT کو کم ابعادی، MOND نما effective-field/effective-response parameterization کے طور پر لیتے ہیں، جسے kernel f(x) اور global scale ℓ سے بیان کیا جاتا ہے، اور سخت parameter ledger کے تحت RCGGL closure test کے ذریعے اس کی cross-data consistency اور transfer predictive power کو جانچتے ہیں۔

تحقیقی پروگرام اور دائرہ کار کا بیان: یہ مقالہ جاری P-series observational retrieval program کا حصہ ہے۔ موجودہ galaxy-scale data میں ہم دو ممکنہ effective background contributions تلاش کرتے ہیں: (i) coarse-grained mean gravitational response سے بیان ہونے والی “mean gravity floor”، اور (ii) microscopic processes میں fluctuations سے وابستہ “stochastic/noise floor”۔ اس مقالے (P1) میں ہم صرف پہلی شق پر توجہ دیتے ہیں: microscopic production mechanisms کے بارے میں کوئی hypothesis شامل کیے بغیر، ہم RCGGL closure test کے ذریعے mean gravity floor کے observational indications بازیافت کرتے ہیں اور ایک unified control protocol کے تحت اسے قابلِ آڈٹ DM baseline سے compare کرتے ہیں۔ heuristic physical picture کے طور پر، اگر short-lived degrees of freedom موجود ہوں تو ان کا decay/annihilation rest mass کو دوسرے degrees of freedom کے ذریعے اٹھائے گئے energy-momentum میں بدل سکتا ہے، جو effective level پر “mean contribution + fluctuation contributiondecomposition سے قدرتی طور پر مطابقت رکھتا ہے؛ تاہم یہ مقالہ اس microscopic picture کو مقداری طور پر model نہیں کرتا۔

حد سے زیادہ تعبیر سے بچنے کے لیے اس مقالے کی حدود یہ ہیں:
• یہ مقالہ کیا کرتا ہے: سخت parameter-ledger اور shared-mapping constraints کے تحت closure testing کے ذریعے cross-data predictive transferability ناپتا ہے اور EFT mean-gravity response اور DM baseline کے درمیان قابلِ تکرار موازنہ کرتا ہے۔
• یہ مقالہ کیا نہیں کرتا: یہ microscopic production mechanisms، abundances/lifetimes یا cosmological constraints پر بحث نہیں کرتا؛ “noise floor” سے متعلق stochastic term کو model نہیں کرتا۔
• یہ مقالہ کیا دعویٰ نہیں کرتا: اس کا مقصد dark matter کو گرانا نہیں؛ P1 اس پر حتمی فیصلہ نہیں دیتا کہ “floor” موجود ہے یا نہیں، بلکہ stage-level evidence رپورٹ کرتا ہے — یعنی یہاں منتخب robust measurement domain کے اندر data ایسے models کو prefer کرتا ہے جن میں mean gravitational response شامل ہو۔

اسی وقت ہم واضح کرتے ہیں کہ DM_RAZOR صرف کم سے کم اور قابلِ آڈٹ NFW baseline کی نمائندگی کرتا ہے (fixed cM اور no scatter؛ no adiabatic contraction، feedback core، nonsphericity یا environmental terms نہیں)۔ اس لیے body text کا مرکزی نتیجہ سختی سے اسی بیان تک محدود ہے: minimal baseline اور strict parameter-ledger/mapping constraints کے تحت EFT زیادہ مضبوط cross-data consistency دکھاتا ہے۔ اس عام سوال کے جواب میں کہ کیا زیادہ معیاری ΛCDM baseline اور lensing-systematics modeling نتیجے کو کافی بدل دیں گے، ہم زیادہ معیاری مگر اب بھی کم ابعادی اور قابلِ آڈٹ DM enhancements اور ایک lensing-side nuisance کو Appendix B میں جمع کرتے ہیں (P1A: DM-baseline standardization stress test)، جبکہ main text جیسی shared mapping اور closure-test protocol بالکل برقرار رکھتے ہیں (جدول B1/شکل B1 دیکھیں)۔

2.1 جدول S1aS1b: کلیدی metrics کا خلاصہ (سخت)

جدول S1a مشترک فٹ (RC+GGL) کے مرکزی comparison metricslogL، ΔlogL، AICc اور BIC — رپورٹ کرتا ہے۔ جدول S1b closure-test اور robustness-scan metrics رپورٹ کرتا ہے: closure، shuffle negative control، اور σ_int / R_min / cov-shrink scan ranges۔ تمام values strict master summary table Tab_Z1_master_summary سے آتی ہیں اور release archive package میں item by item trace کی جا سکتی ہیں۔

جدول S1a | مشترک فٹ کے مرکزی موازنہ metrics (RC+GGL، Strict

BIC

AICc

DM کے مقابل ΔlogL_total

مشترک logL_total (بہترین)

k

W kernel

ماڈل (workspace)

34010.811

33895.885

0.0

-16927.763

20

none

DM_RAZOR

31344.155

31223.501

1337.21

-15590.552

21

none

EFT_BIN

31500.711

31380.057

1258.932

-15668.83

21

exponential

EFT_WEXP

31708.922

31588.268

1154.827

-15772.936

21

yukawa

EFT_WYUK

31429.692

31309.038

1294.442

-15633.321

21

powerlaw_tail

EFT_WPOW

جدول S1b | بندش اور مضبوطی metrics (Strict)۔

cov-shrink scan میں ΔlogL کی range

R_min scan میں ΔlogL کی range

σ_int scan میں ΔlogL کی range

shuffle کے بعد negative-control ΔlogL

بندش ΔlogL (true-perm)

ماڈل (workspace)

22.725

126.678

DM_RAZOR

1337–1351

1243–1289

459–1548

14.984

231.611

EFT_BIN

1259–1277

1169–1207

408–1471

6.04

171.977

EFT_WEXP

1155–1166

1065–1099

380–1341

14.688

179.808

EFT_WYUK

1294–1308

1203–1247

457–1500

6.672

280.513

EFT_WPOW


2.2 شکل S3: بندش قوت (RC-only → پیش گوئی شدہ GGL)

بندش قوت کو ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ کے طور پر define کیا جاتا ہے: RC-only posterior samples پر GGL کو forward-predict کیا جاتا ہے اور ایک منفی کنٹرول سے compare کیا جاتا ہے جس میں RC-binGGL-bin mapping permute کی جاتی ہے۔

شکل S3 | بندش قوت (زیادہ بہتر): RC-onlyGGL prediction کا mean log-likelihood advantage۔


2.3 شکل S4: مرکزی مشترک-فٹ موازنہ (RC+GGL)

مشترک-فٹ برتری کو ΔlogL_totallogL_total(model)logL_total(DM_RAZOR) کے طور پر define کیا جاتا ہے۔ ایک ہی data، ایک ہی mapping، اور تقریباً ایک جیسے parameter scale کے تحت EFT خاندان نمایاں طور پر زیادہ joint log-likelihood حاصل کرتا ہے۔

شکل S4 | مشترک-فٹ برتری (زیادہ بہتر): DM_RAZOR کے مقابل RC+GGL کے لیے بہترین logL_total۔


2.4 چار نتائج (براہِ راست قابلِ اقتباس)

(1) SPARC rotation curves اور KiDS-1000 weak lensing کے unified joint analysis میں، EFT mean-gravity framework model سخت control protocol کے تحت DM_RAZOR سے منظم طور پر بہتر ہے: DM_RAZOR کے مقابل ΔlogL_total = 1155–1337۔

(2) RCGGL closure test EFT کے لیے زیادہ مضبوط predictive consistency دکھاتا ہے: ΔlogL_closure = 172–281، جبکہ DM_RAZOR کے لیے 127 ہے۔ جب RC-binGGL-bin grouping کو random shuffle کیا جاتا ہے، closure signal 6–23 تک collapse ہو جاتا ہے، جس سے ظاہر ہوتا ہے کہ signal accidental fitting کے بجائے درست cross-data mapping پر منحصر ہے۔

(3) σ_int، R_min اور covariance shrinkage کی systematic scans “EFT outperforms DM_RAZOR” کے sign یا scale کو نہیں بدلتی؛ اس سے ظاہر ہے کہ نتیجہ عام systematic perturbations کے مقابل مضبوط ہے۔

(4) اسی closure protocol کے تحت، Appendix B (P1A) DM baseline کو “standardized and auditable” انداز میں مضبوط کرتا ہے: یہ تین one-parameter enhancements (SCAT/AC/FB) برقرار رکھتا ہے اور hierarchical cM scatter + prior، one-parameter core proxy، اور lensing-side shear-calibration m (نیز combined DM_STD model) شامل کرتا ہے۔ نتائج دکھاتے ہیں کہ صرف feedback/core branch closure strength میں چھوٹی net improvement لاتی ہے (122.21129.45، ΔΔlogL_closure≈+7.25)؛ باقی enhancements closure strength میں نہ ہونے کے برابر یا منفی حصہ ڈالتی ہیں۔ اس لیے مرکزی نتیجہ اس بات پر منحصر نہیں کہ DM_RAZOR بہت کمزور baseline ہے۔

3 ڈیٹا اور preprocessing

یہ مطالعہ دو public datasets استعمال کرتا ہے۔ engineering workflow میں downloading، checksum verification (sha256)، اور preprocessing traceable scripts کے ذریعے مکمل ہوتے ہیں۔ منصفانہ cross-model comparison کے لیے تمام workspaces (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) بالکل ایک ہی data products اور bin mappings share کرتے ہیں۔


3.1 گردشی منحنیات (RC، SPARC)

RC data SPARC database کی Rotmod_LTG files (175 rotmod files) سے آتے ہیں۔ preprocessing کے بعد modeling sample میں 104 کہکشائیں اور 2,295 (r, V_obs) data points شامل ہیں، جنہیں stellar mass اور متعلقہ criteria کے مطابق 20 RC bins میں تقسیم کیا گیا ہے۔ ہر data point میں radius r (kpc)، observed velocity V_obs (km/s)، observational error σ_obs، اور gas/disk/bulge component velocities (V_gas, V_disk, V_bul) شامل ہیں۔


3.2 کمزور عدسی اثر (GGL، KiDS-1000 / Brouwer+2021)

GGL data، Brouwer et al. (2021) کی Fig. 3 سے excess surface density ΔΣ(R) استعمال کرتے ہیں، جو KiDS-1000 پر مبنی ہے (4 stellar-mass bins، ہر bin میں 15 R points)، ساتھ فراہم شدہ full covariance کے۔ engineering workflow میں original long-form covariance کو ہر bin کے لیے 15×15 matrix میں reconstruct کیا جاتا ہے، اور Stage-B audits dimensional اور numerical reasonableness verify کرتے ہیں۔


3.3 RC-binGGL-bin mapping اور کل sample size

4 GGL mass bins اور 20 RC bins کو ایک fixed mapping کے ذریعے جوڑا گیا ہے: ہر GGL bin کے مقابل 5 RC bins آتے ہیں، اور RC-bin contributions کو galaxies کی تعداد سے weight کیا جاتا ہے۔ یہ mapping تمام models میں fixed رکھی جاتی ہے اور closure testing اور joint fitting میں fair comparison کے لیے core constraint ہے۔ final joint dataset میں n_total = 2355 points ہیں (RC=2295، GGL=60

4 Models and Statistical Methods


4.1 EFT اور DM کے لیے کم سے کم ریاضیاتی specification (قابلِ آڈٹ/قابلِ ٹیسٹ)

یہ سیکشن وہ minimal mathematical specification دیتا ہے جو براہِ راست implementation سے map ہوتی ہے۔

(a) گردشی منحنی (RC) model

ہر RC data point (r, V_obs, σ_obs) کے لیے ہم component superposition استعمال کرتے ہیں: V_mod²(r) = V_bar²(r) + V_extra²(r)۔ یہاں V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r)۔ اس مقالے کے مرکزی نتائج Υ_d = Υ_b = 0.5 اختیار کرتے ہیں، جو SPARC empirical recommendations سے consistent ہے اور غیر ضروری degrees of freedom کم کرنے میں مدد دیتا ہے۔

(b) EFT mean-gravity correction (EFT)

EFT extra term کو “mean velocity squared” کی شکل میں parameterize کیا گیا ہے: V_extra²(r) = V0_bin² · f(r/ℓ)۔ یہاں V0_bin ہر RC bin کے لیے amplitude parameter ہے (20 parameters)، ℓ ایک global scale ہے (1 parameter)، اور f(x) dimensionless kernel shape function ہے۔ اس مقالے میں compare کیے گئے kernel shapes (جن میں سے کوئی بھی اضافی continuous degrees of freedom نہیں لاتا) یہ ہیں:

طبعی motivation (extended): EFT galaxy scales پر extra gravitational response کو finite scales پر زیادہ microscopic actions کی coarse-graining/scale-averaging سے حاصل effective response کے طور پر interpret کرتا ہے۔ اس مقالے میں ہم کوئی specific microscopic mechanism فرض نہیں کرتے؛ اس کے بجائے unified statistical protocol کے تحت controlled comparison اور testing کے لیے minimal اور auditable parameterization استعمال کرتے ہیں۔

intuition کے لیے extra term کو acceleration form میں لکھا جا سکتا ہے: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ)۔ جب r≫ℓ ہو تو f→1 اور V_extraV0_bin، جس سے outer region میں تقریباً flat extra velocity contribution پیدا ہوتا ہے۔ جب r≪ℓ اور f(x)x ہو تو characteristic acceleration scale a0,binV0_bin²/ℓ متعارف کیا جا سکتا ہے (O(1) kernel-function factor تک)، جو inner-to-outer transition scale کے لیے MOND نما intuition دیتا ہے۔

یہاں استعمال ہونے والا discrete kernel family (none/exponential/yukawa/powerlaw_tail) مختلف “initial slopes / transition speeds / long-range tails” کے low-dimensional proxies کے طور پر دیکھا جا سکتا ہے (مثلاً Yukawa-like screening کے مقابل longer-tailed response)۔ انہیں model space exhaust کرنے کے بجائے robustness stress testing کے لیے استعمال کیا گیا ہے۔ weak-lensing component میں ہم V_avg(r) سے effective envelope mass اور density بناتے ہیں، پھر انہیں project کر کے ΔΣ(R) حاصل کرتے ہیں۔ اس effective density کو spherical symmetry اور weak-field mapping assumptions کے تحت lensing potential کی effective description سمجھنا چاہیے (full details Appendix A میں منتقل کر دی گئی ہیں)۔

اوپر کے تمام kernel shapes f(x)→1 as x→∞ کو satisfy کرتے ہیں (یعنی saturation V_extra²→V0²)، جبکہ x≪1 کے لیے linear یا sublinear growth دیتے ہیں: مثلاً exponential: fx؛ yukawa: f0.5x؛ powerlaw_tail: f0.5x۔ اس لیے مختلف kernel shapes small-radius “initial slope”، transition speed اور outer tail میں observable differences رکھتے ہیں، اور انہیں joint RC+GGL اور closure tests کے ذریعے distinguish کیا جا سکتا ہے۔

weak-lensing ΔΣ(R) کے لیے EFT prediction، V_avg(r) سے envelope mass اور density infer کر کے اور پھر projection integrals لگا کر حاصل کی جاتی ہے: M_enc(r)=r·V_avg²(r)/G، ρ(r)=(1/4πr²)·dM_enc/dr، Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr، اور ΔΣ(R)=Σ̄(<R)−Σ(R)۔ numerical implementation ایک logarithmic grid استعمال کرتا ہے اور exceptional cases میں اسے adaptively refine کرتا ہے تاکہ stability اور reproducibility یقینی رہے۔

(c) DM_RAZOR: NFW سرد-تاریک-مادّہ halo baseline

اسی وقت ہم واضح کرتے ہیں کہ DM_RAZOR صرف minimal، auditable NFW baseline کی نمائندگی کرتا ہے (fixed cM اور no scatter؛ no adiabatic contraction، feedback core، nonsphericity یا environmental terms نہیں)۔ “strawman baseline” کے خطرے کو کم کرنے کے لیے یہ مقالہ دعویٰ نہیں کرتا کہ ایسے effects موجود نہیں۔ اس کے بجائے انہیں Appendix B (P1A) میں low-dimensional اور auditable stress tests کے طور پر شامل کیا گیا ہے، جن میں cM scatter کا hierarchical treatment، core proxy، اور lensing-side shear-calibration nuisance شامل ہیں۔


4.2 Model Ledger اور منصفانہ موازنہ (Shared Parameters = بندش کی تعریف)

مرکزی comparison set میں parameters کی تعداد یہ ہے: DM_RAZOR k=20؛ EFT family k=21 (اضافی parameter global log ℓ ہے)۔ تمام models وہی RC data، وہی GGL data اور covariance، وہی RC-binGGL-bin mapping، وہی baryonic terms، اور وہی unit conversions share کرتے ہیں۔ اس کے علاوہ kernel shape (none / exponential / yukawa / powerlaw_tail) ایک discrete choice ہے اور کوئی اضافی continuous parameter نہیں لاتا، اس لیے “one extra degree of freedom” سے فائدہ حاصل نہیں ہوتا۔


4.3 Likelihood، priors، اور sampler

RC likelihood diagonal Gaussian ہے: σ_eff² = σ_obs² + σ_int²۔ مرکزی نتائج σ_int=5 km/s fix کرتے ہیں، اور Run-5 σ_int scan کرتا ہے۔ GGL likelihood ہر bin کے لیے full-covariance Gaussian استعمال کرتا ہے: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b)۔ مشترک objective ہے logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ)۔ priors بنیادی طور پر physically feasible boundaries encode کرتے ہیں (log ℓ، log V0، اور log M200 پر interval constraints)؛ جب free Υ اور σ_int enabled ہوں تو weakly informative priors استعمال کیے جاتے ہیں (تفصیلات implementation اور release-package configuration میں ہیں)۔

sampler adaptive block Metropolis random walk استعمال کرتا ہے: ہر step parameter space کے صرف random sub-block کو update کرتا ہے تاکہ high dimensions میں acceptance rate بہتر ہو، اور step size کو windowed acceptance rate سے ہلکا adapt کیا جاتا ہے (target acceptance rate تقریباً 0.25)۔ مرکزی نتائج quick mode استعمال کرتے ہیں (مثلاً n_steps=800)، اور ہر workspace manual اور scripted audits کے لیے traces، residuals اور PPC plots output کرتا ہے۔


4.4 Closure Test اور Negative Control (تعریف)

closure test (Run-2) جانچتا ہے کہ آیا RC-only posterior، GGL کو دوبارہ fit کیے بغیر predict کر سکتا ہے۔ خاص طور پر، RC-only posterior samples سے 4 GGL bins کے لیے ΔΣ(R) forward-generate کیا جاتا ہے اور full covariance کے ساتھ logL_true compute کیا جاتا ہے؛ پھر RC-binGGL-bin group mapping کو random permute کر کے logL_perm حاصل کیا جاتا ہے۔ closure strength کی تعریف ہے ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩۔ اضافی طور پر Run-10 بیس RC bins کو random طور پر 4×5 groups میں regroup (shuffle) کرتا ہے اور closure دوبارہ compute کرتا ہے، تاکہ دیکھا جا سکے کہ closure signal correct mapping پر کتنا مضبوطی سے depend کرتا ہے۔

5 مرکزی نتائج اور تعبیر


5.1 مرکزی مشترک-فٹ نتائج (RC+GGL)

joint fit سے best logL_total اور relative advantage ΔlogL_total (DM_RAZOR کے مقابل) جدول S1a اور شکل S4 میں دکھائے گئے ہیں۔ مرکزی comparison set میں EFT_BIN کی joint advantage سب سے بڑی ہے (ΔlogL_total=1337.210)، جبکہ دیگر EFT kernel shapes بھی significant advantages برقرار رکھتے ہیں (1154.8271294.442information criteria (AICc/BIC) کے تحت EFT family بھی DM_RAZOR سے نمایاں طور پر بہتر ہے، جس سے ظاہر ہے کہ برتری parameters کی تعداد کے bias سے نہیں آتی۔

نوٹ: ΔlogL_total≈1337 میں مرکزی contribution RC term سے آتا ہے (joint decomposition میں ΔlogL_RC≈1065، تقریباً 80%)۔ اسے N=2295 RC data points پر فی point تقریباً Δχ²≈0.90 کی modest improvement کے طور پر سمجھا جا سکتا ہے، جو diagonal Gaussian likelihood کے تحت قدرتی طور پر 10^3 order کی برتری میں جمع ہو جاتی ہے۔ اسی وقت GGL اور closure test independent cross-dataset constraints فراہم کرتے ہیں، اور ranking σ_int، R_min اور cov-shrink stress tests کے تحت stable رہتی ہے (سیکشن 6 اور جدول S1b دیکھیں)۔


5.2 Closure Test Results (RC-onlyGGL)

اہم closure-test quantity ΔlogL_closure جدول S1b اور شکل S3 میں report کی گئی ہے۔ EFT family کی closure strengths 171.977280.513 ہیں، جو DM_RAZOR کے 126.678 سے زیادہ ہیں۔ اس کا مطلب ہے کہ اضافی cross-data degrees of freedom کی اجازت دیے بغیر، EFT کے RC data سے حاصل posterior samples میں GGL data کے لیے زیادہ مضبوط transferable predictive power موجود ہے۔

negative control closure signal کی physical relevance کو مزید support کرتا ہے: جب RC-binGGL-bin grouping کو random shuffle کیا جاتا ہے تو EFT کی closure strength 6–15 تک گر جاتی ہے (kernels کے درمیان چھوٹے فرق کے ساتھ)، جبکہ baseline closure strength 172–281 تک ہے۔ یہ “signal collapse” numerical implementation، unit errors یا improper covariance handling سے پیدا ہونے والی false advantages کو رد کرتا ہے۔

شکل R1 | Negative control: shuffle grouping کے بعد closure signal نمایاں طور پر گرتا ہے (Tab_Z1 metrics سے plotted


5.3 نتائج کا مطلب اور حدود

اس مطالعے کا نتیجہ یہ ہے کہ “اس dataset اور اس protocol کے تحت، EFT mean-gravity correction آزمائے گئے DM_RAZOR baseline سے بہتر ہے۔” زور دے کر کہنا ضروری ہے کہ DM طرف صرف fixed c(M) relation کے ساتھ minimal NFW baseline استعمال کرتا ہے، جس میں core formation، nonsphericity، environmental terms، یا زیادہ complex galaxyhalo connection models شامل نہیں۔ اس لیے یہ manuscript تمام DM model families کو exclude کرنے کا دعویٰ نہیں کرتا۔ اس کے بجائے، یہ evaluate کرنے کے لیے reproducible، closure-test-centered control baseline فراہم کرتا ہے کہ آیا RC اور GGL کو ایک ہی cross-data parameters اور mapping سے consistently explain کیا جا سکتا ہے۔

اس common concern کے جواب میں ہم نے independent extension project، P1A مکمل کیا (Appendix B دیکھیں)۔ RC-binGGL-bin shared mapping یا audit framework بدلے بغیر، یہ DM baseline کو “standardized and auditable” انداز میں مضبوط کرتا ہے: تین one-parameter enhancements (SCAT/AC/FB) سے آگے، یہ (i) hierarchical cM scatter + massconcentration prior (DM_HIER_CMSCAT)، (ii) one-parameter baryonic-feedback core proxy (DM_CORE1P)، اور (iii) weak-lensing-side shear-calibration nuisance m (DM_RAZOR_M) شامل کرتا ہے، اور combined model DM_STD report کرتا ہے؛ EFT_BIN کو control reference کے طور پر برقرار رکھا گیا ہے۔

DM_RAZOR_SCAT (cM scatter) — halo-to-halo concentration-scatter parameter σ_logc متعارف کرتا ہے تاکہ دیکھا جا سکے کہ fixed c(M) منظم طور پر DM کی explanatory power کو کم تو نہیں دکھا رہا؛
DM_RAZOR_AC (Adiabatic Contraction) — ایک single parameter α_AC استعمال کرتا ہے جو “no contraction” اور “standard contraction” کے درمیان continuous interpolation کرتا ہے، تاکہ minimal cost پر baryons کے inner halo کو contract کرنے کے tendency کو capture کیا جا سکے؛
DM_RAZOR_FB (Feedback/core)core scale (مثلاً log r_core) استعمال کرتا ہے تاکہ بیان کیا جا سکے کہ inner-core formation rotation curves کو کیسے suppress کرتی ہے، جبکہ weak-lensing scales پر NFW approximation برقرار رہتی ہے۔

quantitative P1A scoreboard Appendix B، Table B1 / Fig. B1 میں دیا گیا ہے (Tab_S1_P1A_scoreboard سے automatically generatedclosure metric میں DM_RAZOR_FB ایک چھوٹی net improvement دیتا ہے (122.21129.45، +7.25)، جبکہ دیگر enhancements closure strength میں نہ ہونے کے برابر یا negative contribution دیتے ہیں۔ joint-fit side پر hierarchical cM scatter prior (DM_HIER_CMSCAT) یا combined model (DM_STD) joint logL کو کافی بہتر بنا سکتے ہیں، مگر closure strength کو بہتر نہیں کرتے، جس سے اشارہ ملتا ہے کہ یہ cross-probe transferability کے بجائے mainly joint-fit flexibility بڑھاتے ہیں۔ لہٰذا main text کا core conclusion یوں پڑھا جانا چاہیے: strict shared-mapping اور closure-test constraints کے تحت، EFT کی cross-data consistency advantage DM side پر “overly weak baseline” چننے سے پیدا نہیں ہوتی۔ Appendix B کے مطابق P1A release package (supplementary tables/figures اور full_fit_runpack) اسی Zenodo Concept DOI کے تحت additional files کے طور پر شامل کیا جائے گا جس کے تحت اس paper کا full_fit_runpack ہے: https://doi.org/10.5281/zenodo.18526286۔

6 Robustness اور Control Experiments


6.1 σ_int Scan (Run-5)

ہم intrinsic RC scatter σ_int کو systematically scan کرتے ہیں اور ہر σ_int پر joint inference دہراتے ہیں، DM_RAZOR کے مقابل ΔlogL_total compute کرتے ہوئے۔ scan range کے اندر ہر model کے minimum/maximum ΔlogL_total values جدول S1b میں report کیے گئے ہیں۔

شکل R2 | σ_int scan کے تحت ΔlogL_total کی range (زیادہ بہتر)۔


6.2 R_min Scan (Run-6)

central-region data کی systematics (مثلاً noncircular motion، resolution، اور ناکافی baryonic modeling) کے اثر کو جانچنے کے لیے ہم RC پر R_min threshold cuts لگاتے ہیں اور joint inference دہراتے ہیں۔ R_min scan کے تحت EFT family کی advantage positive اور scale میں stable رہتی ہے۔

شکل R3 | R_min scan کے تحت ΔlogL_total کی range (زیادہ بہتر)۔


6.3 cov-shrink Scan (Run-7)

GGL covariance میں uncertainty جانچنے کے لیے ہم ہر mass bin کی covariance matrix پر shrinkage لگاتے ہیں: C_α=(1−α)C+α·diag(C)، اور α scan کرتے ہیں۔ نتائج دکھاتے ہیں کہ EFT family کی advantage اس treatment کے لیے insensitive ہے۔

شکل R4 | cov-shrink scan کے تحت ΔlogL_total کی range (زیادہ بہتر)۔


6.4 Ablation Ladder (Run-8)

EFT_BIN کے اندر ہم nested ablations کرتے ہیں: minimal model (no free parameters) سے شروع کر کے ایسے versions تک جو صرف چند degrees of freedom رکھتے ہیں، اور آخر میں complete 20-bin amplitude + global scale model تک۔ AICc/BIC دکھاتے ہیں کہ complete EFT_BIN model کو data سختی سے require کرتا ہے۔

شکل R5 | EFT_BIN ablation ladder (AICc؛ کم بہتر)۔


6.5 Holdout Prediction (Run-9)

ہم مزید leave-one-bin-out (LOO) test چلاتے ہیں: 4 GGL mass bins میں سے ہر بار ایک bin hold out کیا جاتا ہے؛ inference باقی bins (اور تمام RC) سے دوبارہ کیا جاتا ہے، پھر test log-likelihood held-out bin پر evaluate کی جاتی ہے۔ summary metrics supplementary table Tab_R3_leave_one_bin_out میں دیے گئے ہیں (Run-9 product؛ file path patterns Section 8.2 کی key-product list میں درج ہیں)۔ worst held-out case میں بھی EFT family واضح طور پر DM_RAZOR سے superior رہتی ہے۔

شکل R6 | LOO: held-out bin کے لیے log-likelihood distribution (Run-9 products سے)۔


6.6 Negative Control: RC-bin Shuffle (Run-10)

Run-10 بیس RC bins کو random طور پر 4×5 میں regroup کرتا ہے اور RC-only posterior کو unchanged رکھتے ہوئے closure دوبارہ compute کرتا ہے۔ نتائج دکھاتے ہیں کہ original mapping کے مقابل shuffling closure mean logL_true اور ΔlogL_closure دونوں کو نمایاں طور پر کم کرتی ہے (جدول S1b اور شکل R1 دیکھیں)، جو closure signal کی interpretability کو مزید support کرتا ہے۔

شکل R7 | Negative control: shuffle mapping closure mean logL_true میں واضح کمی پیدا کرتی ہے (Run-10 products سے)۔

7 Traceability اور Consistency Audit (Provenance)

اس مقالے میں نقل کیے گئے تمام numerical values release archive کی strict summary tables اور audit records میں item by item trace کیے جا سکتے ہیں۔ main text کو زیادہ readable رکھنے کے لیے full provenance chain (tag list، audit tables، checksum list، اور verification method) Appendix A میں منتقل کر دی گئی ہے۔

8 Reproducibility اور Zenodo Archive

Data and code availability statement: اس paper میں استعمال ہونے والا SPARC rotation-curve data اور KiDS-1000 weak-lensing data public datasets ہیں۔ publication-grade report Zenodo پر archive کی گئی ہے (Concept DOI: https://doi.org/10.5281/zenodo.18526334)، اور full reproduction package بھی Zenodo پر archive کیا گیا ہے (Concept DOI: https://doi.org/10.5281/zenodo.18526286detailed execution steps، dependency environment، archive inventory، اور hash-verification information Appendix A میں دی گئی ہیں؛ DM-baseline standardization stress test (P1A) کا design، run tags، اور outputs Appendix B میں فراہم کیے گئے ہیں۔

اسی full-reproduction-package Concept DOI (https://doi.org/10.5281/zenodo.18526286) کے تحت، ہم use case کے لحاظ سے دو reproducible entry points فراہم کرتے ہیں:
P1 (main text) full_fit_runpack: EFT vs DM_RAZOR کے لیے RC-only / closure / joint analyses اور robustness scans reproduce کرتا ہے، اور main-text assets بناتا ہے جن میں Tables S1a/S1b اور Figs. S3/S4 شامل ہیں؛
P1A (Appendix B) full_fit_runpack: DM-baseline standardization stress test reproduce کرتا ہے (SCAT/AC/FB + hierarchical cM scatter prior + core1p + lensing m + DM_STD، EFT_BIN control سمیت)، اور Appendix Table B1 اور Fig. B1 بناتا ہے۔
single archive entry point برقرار رکھنے کے لیے P1A کی supplementary tables/figures اور full_fit_runpack اسی Concept DOI کے تحت additional files کے طور پر شامل ہوں گے۔

9 Acknowledgments and Declarations


9.1 Acknowledgments

ہم public data اور documentation فراہم کرنے پر SPARC اور KiDS-1000 teams، نیز اس project کے reconstruction اور audit workflow کے participants کا شکریہ ادا کرتے ہیں۔


9.2 Author Contributions

Guanglin Tu conceptual proposal، study design، engineering implementation، data curation، formal analysis، reproducibility workflow implementation and audit، اور manuscript writing کے ذمہ دار تھے۔


9.3 Funding

مصنف Guanglin Tu نے خود مالی معاونت کی (no external funding / no grant number


9.4 Competing Interests

مصنف Guanglin TuEFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)” سے وابستہ ہیں؛ کوئی دیگر competing interests declared نہیں۔


9.5 AI Assistance

OpenAI GPT-5.2 Pro اور Gemini 3 Pro کو language polishing، structural editing، اور reproducibility workflow کی organization کے لیے استعمال کیا گیا۔ انہیں data، results، figures، tables، code بنانے یا modify کرنے، یا citations generate کرنے کے لیے استعمال نہیں کیا گیا۔ پورے manuscript کے content اور citation accuracy کی مکمل ذمہ داری author پر ہے۔

10 References

Appendix A: Traceability اور Reproducibility Details

یہ appendix traceability اور reproducibility کے لیے long-term archive information کا خلاصہ دیتا ہے، جس میں run tags، audit results، archive inventories اور key verification points شامل ہیں، تاکہ readers ضرورت کے مطابق کام کو check اور reproduce کر سکیں۔


A.1 Traceability اور Audit Details

long-term traceability یقینی بنانے کے لیے یہ project ہر run اور output کے لیے timestamped tags استعمال کرتا ہے، اور historical products کو overwrite کیے بغیر محفوظ رکھتا ہے۔ اس manuscript میں cited core values strict compilation (compile_tag=20260205_035929) سے آتی ہیں اور درج ذیل consistency audits pass کر چکی ہیں:

• تمام stage-level tables run_tag اور stage tags رکھتی ہیں؛ strict compilation script report/tables سے “complete and consistent” canonical table sources منتخب کرتا ہے۔

Tab_Z1_master_summary اور Tab_Z2_conclusion_highlights کی values منتخب canonical tables کے مقابل item by item compare کی جاتی ہیں۔

PDF generation کے دوران “referenced table/figure tags” پر tag audit کیا جاتا ہے تاکہ outdated products mix نہ ہوں۔

Key tags (تمام intermediate products locate کرنے کے لیے): run_tag=20260204_122515؛ closure_tag=20260204_124721؛ joint_tag=20260204_152714؛ sigma_sweep_tag=20260204_161852؛ rmin_sweep_tag=20260204_195247؛ covshrink_tag=20260204_203219؛ ablation_tag=20260204_214642؛ LOO_tag=20260204_224827؛ negctrl_tag=20260204_234528؛ strict_compile_tag=20260205_035929؛ release_tag=20260205_112442۔

Consistency-audit result: Tab_AUDIT_checks_strict pass=9، fail=0، skip=0 report کرتا ہے (details کے لیے release package دیکھیں)۔


A.2 Reproducibility Execution Steps اور Archive Inventory

یہ studypublication-grade report + tables/figures supplement + fully rerunnable run package” پر مشتمل reproducibility system اختیار کرتی ہے۔ readers paper میں cited تمام table/figure assets verify کرنے کے لیے Tables & Figures Supplement براہِ راست دیکھ سکتے ہیں؛ numerical values اور audit chain کو scratch سے reproduce کرنے کے لیے وہ full_fit_runpack استعمال کر کے data download اور complete workflow rerun کر سکتے ہیں۔ completion کے بعد package کا built-in reference-table comparison script table-value consistency verify کرنے کے لیے استعمال کیا جا سکتا ہے۔


A.2.1 Reproduction Quickstart (RUN_FULL، Windows PowerShell)

یہ section ایک مختصر reproduction path (Windows PowerShell) دیتا ہے۔ quick checks کے لیے readers کو Tables & Figures Supplement براہِ راست consult کرنے اور cited tables/figures item by item verify کرنے کا مشورہ دیا جاتا ہے۔ end-to-end reproduction اور تمام tables، figures، audit products generate کرنے کے لیے full_fit_runpack استعمال کریں: package README/ONE_PAGE_REPRO_CHECKLIST کے مطابق verify_checksums.ps1 اور RUN_FULL.ps1 چلائیں (Mode=full recommended)۔

Zenodo archive entry (Concept DOI): https://doi.org/10.5281/zenodo.18526286۔
اس paper کے main-chain tags: run_tag=20260204_122515؛ strict compile_tag=20260205_035929؛ release_tag=20260205_112442۔


A.2.2 Archive Materials اور Key Verification Points (Packages & checks)

Zenodo archive materials کی تین complementary categories فراہم کرتا ہے: (1) publication-grade report (یہ paper، v1.1؛ Appendix B سمیت: P1A DM-baseline standardization stress test(2) Tables & Figures Supplement (اس paper میں cited تمام table/figure assets کو cover کرنے والی supplementary tables اور figures، P1 اور P1A کے لیے الگ الگ)؛ اور (3) full_fit_runpack (full reproduction package: scratch سے data download کرتا ہے اور complete workflow rerun کرتا ہے، P1 اور P1A کے لیے الگ الگ)۔ Items (1)(2) quick reading اور independent verification کو support کرتے ہیں؛ item (3) end-to-end full reproducibility فراہم کرتا ہے۔

مقصد اور پوزیشننگ (استعمال کی سفارش کردہ ترتیب)

فائل کا نام (مثال)

مواد کی قسم

Zenodo پر archived مکمل رپورٹ؛ main text core conclusions اور robustness audits دیتا ہے، جبکہ Appendix B P1A (DM-baseline standardization stress test) فراہم کرتا ہے۔

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

اشاعتی معیار کی رپورٹ (چینی اور انگریزی)

main text میں cited تمام tables (CSV) اور figures (PNG)، generation scripts اور tag files سمیت۔

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Tables & Figures Supplement (P1)

Appendix B (P1A) میں cited تمام tables اور figures، Tab_S1_P1A_scoreboard اور Fig_S1_P1A_scoreboard سمیت۔

P1A_supplement_figs_tables_v1.zip

Tables & Figures Supplement (P1A)

End-to-end full reproduction: scratch سے data download کریں اور RC-only/closure/joint اور robustness scans دوبارہ چلائیں۔

P1_RC_GGL_full_fit_runpack_v1_1.zip

full_fit_runpack (P1)

End-to-end full reproduction (Appendix B): DM 7+1 + DM_STD (EFT_BIN control سمیت) rerun کریں اور appendix assets generate کریں؛ package میں table-value consistency verify کرنے کے لیے reference-table comparison script شامل ہے۔

P1A_RC_GGL_full_fit_runpack_v1.zip

full_fit_runpack (P1A)

Citation recommendation: اس paper یا accompanying reproducibility materials کو cite کرتے وقت براہِ کرم Zenodo Concept DOI cite کریں (https://doi.org/10.5281/zenodo.18526334

وہ key products جو reproduction کے بعد ظاہر ہونے اور comparable ہونے چاہئیں، ان میں شامل ہیں:

Appendix B: P1ADM-Baseline Standardization Stress Test (DM 7+1 + DM_STD؛ EFT Control کے ساتھ)

یہ appendix ایک extension project (P1A) document کرتا ہے جو “DM-baseline standardization stress testing” کے لیے ہے اور main text کے closure protocol کے مطابق ہے۔ اس کا کردار main text میں استعمال ہونے والے minimal DM_RAZOR baseline (NFW + fixed cM، no scatter / no contraction / no core) کو ایسے DM baseline set میں upgrade کرنا ہے جو astrophysical practice کے قریب تر ہو اور common critiques کے مقابل زیادہ resistant ہو، مگر degrees of freedom کی بڑی تعداد introduce کیے بغیر اور RC-binGGL-bin shared mapping یا audit framework تبدیل کیے بغیر۔ P1A earlier three-branch stress test کو cover کرتا ہے اور اس کا superset ہے: یہ SCAT/AC/FB برقرار رکھتا ہے، جبکہ hierarchical cM scatter + prior، one-parameter core proxy، اور lensing-side shear-calibration nuisance m شامل کرتا ہے؛ یہ combined model DM_STD بھی فراہم کرتا ہے۔ EFT_BIN کو control reference کے طور پر برقرار رکھا گیا ہے۔

Supplementary note: Appendix B (P1A) میں closure strengths اور related values main text کے quick budget سے زیادہ بڑے Monte Carlo budget استعمال کرتے ہیں (مثلاً ndraw=400، nperm=24)، جبکہ main text میں full EFT kernel family cover کرنے کے لیے quick budget استعمال ہوا (مثلاً ndraw=60، nperm=12)۔ اس لیے absolute values میں O(10)-level sampling drift دکھ سکتا ہے۔ تاہم same budget/table کے اندر model-to-model comparisons fair ہیں، اور advantage کا sign اور scale budgets کے پار stable رہتا ہے۔


B.1 Purpose and Positioning (P1A کیوں، اور Appendix کیوں)

P1A تمام ممکنہ ΛCDM halo modeling choices exhaust کرنے کی کوشش نہیں کرتا (مثلاً nonsphericity، environmental dependence، complex galaxyhalo connections، یا high-dimensional baryon physics)۔ اس کے بجائے، P1Alow-dimensional, auditable, reproducibleprinciple پر چلتا ہے: ہر enhancement module صرف ≤1 key effective parameter متعارف کرتا ہے اور اس paper کے تین hard constraints کے تابع رہتا ہے:
(i) Parameter ledger: ہر new parameter کو explicitly record اور information criteria (AICc/BIC) کے ساتھ report کرنا ہوگا؛
(ii) Shared mapping: وہی RC-binGGL-bin grouping map استعمال ہوتی رہے گی؛ single dataset کے لیے “mapping کو الگ tune کرنا” allowed نہیں؛
(iii) Closure test: کوئی بھی enhancement RCGGL transfer prediction میں genuine gain دکھائے، صرف بہتر RC-only fitting نہیں۔


B.2 DM 7+1 + DM_STD: Module Definitions، Parameters، اور Joint Posterior میں Entry

independent runpack کے طور پر P1A، 8 DM workspaces (DM 7+1) plus 1 EFT control فراہم کرتا ہے: baseline DM_RAZOR سے شروع کرتے ہوئے، یہ تین legacy one-parameter enhancements (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB) بناتا ہے، تین زیادہ standard defensive modules (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) شامل کرتا ہے، اور پھر combined model DM_STD فراہم کرتا ہے۔ ان modules کا مشترک مقصد تین عام ترین critiques کو cover کرنا ہے، dimensionality کو ممکنہ حد تک کم بڑھاتے ہوئے: (a) cM scatter اور priors hierarchical model میں کیسے داخل ہوتے ہیں؛ (b) کیا baryonic feedback کے main effect کو one-parameter core proxy سے capture کیا جا سکتا ہے؛ اور (c) کیا key lensing-side systematics کو physical signal سمجھ لیا جا سکتا ہے۔

Implementation principle (audit-friendly)

طبعی motivation (core)

نئے parameter(s) (≤1)

dm_model

Workspace

Shared mapping fixed؛ strict parameter ledger؛ صرف relative comparison کے baseline کے طور پر استعمال

minimal، auditable ΛCDM halo baseline؛ EFT سے strict comparison کے لیے استعمال

NFW (fixed cM، no scatter)

DM_RAZOR

≤1 new parameter؛ shared mapping retained؛ closure gain acceptance criterion کے طور پر استعمال

cM relation میں scatter ہے؛ one-parameter log-normal scatter سے approximate کیا گیا

σ_logc

NFW + cM scatter (legacy)

DM_RAZOR_SCAT

≤1 new parameter؛ mapping unchanged؛ AICc/BIC changes اور closure gain report

baryonic infall halo adiabatic contraction پیدا کر سکتا ہے؛ one-parameter strength سے approximate

α_AC

NFW + Adiabatic Contraction (legacy)

DM_RAZOR_AC

≤1 new parameter؛ وہی closure/negative-control protocol؛ RC-only improvement واحد target نہیں

feedback inner region میں core بنا سکتا ہے؛ one-parameter core scale سے approximate

log r_core

NFW + feedback core (legacy)

DM_RAZOR_FB

Explicit prior؛ latent c_i marginalized؛ اب بھی low-dimensional اور auditable

زیادہ standard hierarchical c_ilogN(c(M_i),σ_logcRC اور GGL دونوں کے joint posterior کو متاثر کرتا ہے

σ_logc (hier)

Hierarchical cM scatter + prior

DM_HIER_CMSCAT

standard literature cite کرتا ہے؛ ≤1 new parameter؛ closure test سے tied

baryonic feedback کے main effect کے لیے one-parameter core proxy استعمال کرتا ہے، high-dimensional star-formation details سے بچتے ہوئے

log r_core

1-parameter core proxy (coreNFW/DC14-inspired)

DM_CORE1P

Nuisance explicitly recorded؛ RC کو backward affect نہیں کر سکتا؛ results mainly closure robustness سے judged

ایک key weak-lensing systematic کو effective parameter کے طور پر absorb کرتا ہے، systematics کو physics سمجھنے کا خطرہ کم کرتے ہوئے

m_shear (GGL)

NFW + lensing shear-calibration nuisance

DM_RAZOR_M

Parameter ledger + information criteria reported؛ closure primary metric ہے؛ strongest DM defensive control کے طور پر استعمال

تین عام ترین critique classes کو ایک اب بھی low-dimensional standard baseline میں شامل کرتا ہے

σ_logc + log r_core (+ m_shear)

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

DM_STD

نوٹ: اوپر کے parameter names engineering implementation کے مطابق ہیں (مثلاً σ_logc، α_AC، log r_core، اور m_shearP1A کا design focus یہ ہے کہ “DM baseline کو کچھ مضبوط بنایا جائے مگر auditable رکھا جائے”، نہ کہ DM side کو uncontrollable high-dimensional fitter میں بدل دیا جائے۔ خاص طور پر، DM_HIER_CMSCAT cM scatter کو hierarchically introduce کرتا ہے: ہر halo کی concentration c_i کو c(M_i) کے اردگرد log-normal scatter دیا جاتا ہے، global σ_logc اور c(M) prior سے constrained؛ یہ hierarchical structure RC اور GGL دونوں کے joint posterior کو متاثر کرتا ہے۔


B.3 Statistical Protocol اور Product Conventions جو Main Text سے consistent ہیں

P1A main text سے تمام data products، shared mapping، اور audit framework reuse کرتا ہے۔ execution order اور product conventions consistent رہتے ہیں:
(1) Run‑1: RC-only inference (posterior_samples.npz اور metrics.json output کرتا ہے)؛
(2) Run‑2: RCGGL closure test (closure_summary.json اور permuted baseline output کرتا ہے)؛
(3) Run‑3: RC+GGL joint fit (joint_summary.json output کرتا ہے)۔
تمام quoted numbers automatically compiled table (Tab_S1_P1A_scoreboard) سے آتے ہیں اور P1A full_fit_runpack میں built-in reference-table comparison script استعمال کر کے full P1A workflow rerun کرنے کے بعد check کیے جا سکتے ہیں۔


B.4 Main Results، Table/Figure Entry Points، اور Archive Plan (Same DOI)

یہ section P1A کے core quantitative conclusions دیتا ہے۔ Table B1، RC-only، RCGGL closure، اور RC+GGL joint fitting کے key metrics summarize کرتا ہے (parentheses DM_RAZOR baseline کے مقابل differences دیتے ہیں)۔ Closure strength کی تعریف ہے ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm(higher is better)۔ Fig. B1 اسی scoreboard کو visualize کرتا ہے۔ main points درج ذیل ہیں:
• تین legacy branches میں سے صرف DM_RAZOR_FB (feedback/core) closure strength میں small net improvement دیتا ہے: 122.21129.45 (+7.25SCAT اور AC کوئی net improvement نہیں دیتے؛
• نئے شامل کردہ DM_HIER_CMSCAT اور DM_RAZOR_M کے closure strength پر بہت چھوٹے effects (~0) ہیں، اور DM_CORE1P بھی کوئی significant net improvement نہیں دکھاتا؛
combined model DM_STD joint logL کو substantially improve کر سکتا ہے (joint-fit optimum کے قریب)، مگر اس کی closure strength کم ہو جاتی ہے، جو suggest کرتا ہے کہ gain mainly joint-fit flexibility سے آتا ہے، cross-probe transferability سے نہیں؛
control کے طور پر EFT_BIN closure strength اور joint fitting دونوں میں واضح advantage برقرار رکھتا ہے۔ اس لیے main conclusionstronger DM baseline + lensing nuisanceintroduce کرنے کے باوجود robust ہے۔

main-text results کے ساتھ direct comparison کے لیے Tables S1aS1b EFT family اور DM_RAZOR کے درمیان strict comparison summarize کرتے ہیں: EFT models DM_RAZOR کے مقابل joint fit کو ΔlogL_total≈1155–1337 تک improve کرتے ہیں اور closure test میں ΔlogL_closure=172–281 تک پہنچتے ہیں۔ P1A صرف DM side پر “harder control” بناتا ہے؛ اس کا مقصد “strawman baseline” یا “systematics-as-physics” جیسے concerns کم کرنا ہے، main comparison کو replace کرنا نہیں۔

Table B1 | P1A scoreboard (higher is better؛ parentheses DM_RAZOR baseline کے مقابل differences دکھاتے ہیں)۔

Joint best logL_total (Δ)

Closure strength ΔlogL_closure (Δ)

RC-only best logL_RC (Δ)

Δk

Model branch (workspace)

-27347.068 (+0.000)

122.205 (+0.000)

-15702.654 (+0.000)

0

DM_RAZOR

-23153.311 (+4193.758)

121.236 (-0.969)

-15702.294 (+0.361)

1

DM_RAZOR_SCAT

-23982.557 (+3364.511)

121.531 (-0.674)

-15703.689 (-1.035)

1

DM_RAZOR_AC

-27478.531 (-131.463)

129.454 (+7.249)

-15496.046 (+206.609)

1

DM_RAZOR_FB

-23153.160 (+4193.908)

121.978 (-0.227)

-15702.644 (+0.010)

1

DM_HIER_CMSCAT

-27336.258 (+10.810)

122.056 (-0.149)

-15723.158 (-20.504)

1

DM_CORE1P

-27340.451 (+6.617)

122.205 (+0.000)

-15702.654 (+0.000)

0 (+m)

DM_RAZOR_M

-22984.445 (+4362.623)

105.690 (-16.515)

-15832.203 (-129.549)

2 (+m)

DM_STD

-19001.142 (+8345.926)

204.620 (+82.415)

-14631.537 (+1071.117)

1

EFT_BIN

Fig. B1 | P1A scoreboard: baseline کے مقابل closure اور joint ΔlogL (higher is better)۔

اس appendix کے corresponding completed run set کے example tags یہ ہیں (P1A intermediate products اور tables/figures locate کرنے کے لیے استعمال ہوتے ہیں):
P1A run_tag = 20260213_151233؛ P1A closure_tag = 20260213_161731؛ P1A joint_tag = 20260213_195428۔


B.5 Suggested Citation (Appendix Citation Note)

جب readers کو paper کے main conclusions کے علاوہ “DM-baseline standardization stress test” cite کرنا ہو، تو recommend کیا جاتا ہے کہ وہ main conclusion کو درج ذیل note کے ساتھ cite کریں: “اسی closure protocol کے تحت standardized DM-baseline stress tests کے لیے Appendix B (P1A) دیکھیں (legacy SCAT/AC/FB + hierarchical cM scatter prior + core proxy + lensing shear-calibration nuisance)۔”