วิธีเลือกระหว่างระบบเทรดที่แข่งกันอย่างเป็นกลาง

ผมรันระบบเทรด 3 ระบบพร้อมกัน ในเดือนพฤศจิกายน 2026 จะเลือกหนึ่งระบบเพื่อเทรดด้วยเงินจริง คำถามที่ต้องตอบ: จะเลือกผู้ชนะอย่างเป็นกลาง โดยไม่ให้ Gut ของตัวเองโกหก?

คำตอบปกติคือผลการ Backtest ปัญหาคือ: ผลการ Backtest คือจุดที่ความมั่นใจเกินจริงซ่อนตัวอยู่ ระบบที่ดูดีที่สุด In-Sample มักดูปานกลาง Out-of-Sample ยิ่งทดสอบ Configuration มาก ยิ่งมีโอกาสที่ผล "ดีที่สุด" ของคุณเป็นแค่ความโชคดีที่แต่งตัวเหมือน Skill

นี่คือปัญหา Multiple Testing และมีวิธีจัดการที่มีหลักการ

สองเครื่องมือที่ใช้

Deflated Sharpe Ratio (DSR) ปรับลด Sharpe Ratio ลงตามจำนวน Strategy ที่ทดสอบก่อนเลือกผู้ชนะ ยิ่ง Search มาก ยิ่งถูกปรับลดมาก ระบบที่ดูดีหลังทดสอบ 16 Variant สมควรถูกหักมากกว่าระบบที่สร้างครั้งเดียวจากหลักการแล้วไม่เคยแตะอีก

Probability of Backtest Overfitting (PBO) ถามว่า: จากชุด Variant ที่ทดสอบทั้งหมด โอกาสที่ Variant ที่ดูดีที่สุด In-Sample จะยัง Rank ดี Out-of-Sample มีแค่ไหน? PBO ใกล้ 0 หมายความว่ากระบวนการเลือกของคุณ Robust PBO ใกล้ 0.5 หมายความว่ามันแทบจะสุ่มเสี่ยง

ไม่มีเครื่องมือใดสมบูรณ์แบบ แต่ใช้ร่วมกัน พวกมันบังคับให้คุณนำการ Search ที่ทำไปคิดด้วย ไม่ใช่แค่ผลที่ค้นพบ

สิ่งที่ทดสอบ

ผ่านข้อมูล Walk-Forward 20 ปีที่สะอาด (2006–2025) รัน 16 Variant ของ Configuration Pattern Branch ที่ล็อคไว้ Universe: ทุก RS≥80 Breakout Trade ที่ผ่าน Regime Filter ตลอด 212 เดือน รวม 738 Trade

สองส่วนประกอบที่ล็อค:

ส่วนประกอบ	Expectancy	Rank / 16 Variant	Bootstrap 95% CI	p(overfit)
first_pullback × Webster Power Trend exit	+0.820R	อันดับ 4	[+0.45, +1.22]	0.002
failed_reentry × Minervini partial-TP	+0.297R	อันดับ 11	[+0.16, +0.44]	0.331

PBO = 0.475 — ขอบเขต มีแค่ 16 Variant ดังนั้น Resolution ของ PBO จำกัด อ่านว่า "ไม่น่าวิตก แต่ก็ไม่สมบูรณ์แบบ"

ตัวเลขหมายความว่าอะไรสำหรับมกราคม 2027

first_pullback × Webster คือ Workhorse ที่ได้รับการยืนยัน อยู่อันดับ 4 จาก 16 Expectancy ผ่านบาร์ Bootstrap Null (บาร์ที่ Strategy ต้องผ่านเพื่อพิสูจน์ว่า "จริง" ไม่ใช่โชค) และ p(overfit) 0.002 หมายความว่ามีโอกาสเพียง 0.2% ที่กระบวนการ Search แบบสุ่มจะผลิตผลดีขนาดนี้ได้โดยบังเอิญ

ค่า Skew Fat Right Tail (+5.96) บอกว่า Edge อยู่ที่ไหน: ไม่ใช่กำไรเล็กๆ จำนวนมาก แต่คือ Winner ใหญ่ไม่กี่ตัว — Trend Runner ที่ Webster Power Trend Exit ถือไว้จนกว่า Index เองจะยืนยันว่า Trend สิ้นสุดแล้ว นั่นคือ Edge ที่สมเหตุสมผลเชิงกลไก

failed_reentry × Minervini partial-TP จริงแต่ปานกลาง CI ไม่ตัดผ่านศูนย์ (Positive Expectancy จริง) แต่อยู่อันดับ 11 จาก 16 — หมายความว่า 10 Variant อื่นดูดีกว่า In-Sample มันไม่ผ่านบาร์ Bootstrap Null p(overfit) 0.331 หมายความว่ามีโอกาสจริงที่การเลือกนั้นเป็นโชคบางส่วน

มันยังได้ที่ในกลุ่มระบบ — แต่ในฐานะ Decorrelated Diversifier ไม่ใช่ดาราเดี่ยว ทั้งสองระบบมี Correlation −0.139 ซึ่งหมายความว่าเป็นอิสระจากกันจริงๆ การเพิ่มระบบที่อ่อนแอกว่าช่วยปรับปรุง Portfolio Sharpe แม้จะ Underperform เมื่อดูแยก

บทเรียนเรื่องการเลือกเครื่องมือ

Sharpe Ratio เป็นเครื่องมือหลักที่ผิดสำหรับระบบ Trend-Following Edge อยู่ที่ Fat Right Tail — Trade จำนวนน้อยที่วิ่ง +5R, +8R, +12R Sharpe Ratio ลงโทษสิ่งนี้ (มันถือว่าความผันผวนทุกอย่าง รวมถึง Upside เป็น Risk) Deflated Sharpe Ratio สืบทอดความบกพร่องนี้

Bootstrap ที่ไม่พึ่งสมมติฐานการกระจาย — คำนวณ Expectancy Distribution โดยตรงจากข้อมูล เปรียบกับ Null ของโชคล้วนๆ — คือการทดสอบหลักที่มีหลักการสำหรับระบบเหล่านี้ DSR เก็บไว้เพื่อเปรียบเทียบ ไม่ใช่เป็น Verdict หลัก

เรื่องนี้สำคัญสำหรับการอ่าน Backtest ใดๆ ระบบที่สร้างกำไรใหญ่ไม่กี่ครั้งจะดูปานกลางบน Sharpe และยอดเยี่ยมบน Expectancy เชื่อ Metric ที่ตรงกับ Edge

สรุปที่ตรงไปตรงมา

หลังข้อมูล Walk-Forward 20 ปีที่สะอาดและการแก้ไข Multiple Testing อย่างเข้มงวด:

first_pullback × Webster: ได้รับการยืนยันอย่างแข็งแกร่ง Edge จริง ผ่านการปรับสำหรับการ Search อย่างชัดเจน ความเชื่อมั่นสูงสำหรับ Deploy มกราคม 2027
failed_reentry × Minervini: Edge จริง Borderline บน Search-Robustness มีคุณค่าในฐานะ Diversifier เริ่มต้นที่ขนาดอนุรักษ์นิยม ให้ Live Record สะสม

ทั้งสองระบบจะเทรดร่วมกัน แต่ละ 0.25% Risk ต่อ Trade พร้อม Kill Switch รวมที่ Portfolio Drawdown −10%

วิธีการเลือกไม่สมบูรณ์แบบ ไม่มีวิธีใดสมบูรณ์แบบ แต่มันซื่อสัตย์ — นำการ Search มาคิด แยก Search Luck ออกจาก Edge จริง และให้ Confidence Gradient แทนที่จะเป็น Verdict เดียวที่มั่นใจเกินจริง

นั่นมากกว่าสิ่งที่นักเทรดส่วนใหญ่ทำก่อนเสี่ยงเงินจริง

การวิเคราะห์: 738 Trade ใน 16 Strategy Variant ปี 2006–2025 (212 เดือน) แหล่ง Walk-Forward: 20-Window Clean Freshness-Gated Family เครื่องมือ: Deflated Sharpe (López de Prado), PBO via CSCV (Bailey et al.), Distribution-Free Bootstrap Expectancy CI (10,000 draws) เสร็จสิ้น 2026-06-10