MOEasymmetry← บทความทั้งหมด
Research · 2026-06-12 · 3 นาที

92% ของหุ้อ Top Picks ของผม เป็นข้อมูลปลอม

ตามรอย ศึกษา รอจังหวะ จู่โจม
ไทย อ่านภาษาอังกฤษ
⚠️ บันทึกการวิจัยและการเทรดส่วนตัว — ไม่ใช่คำแนะนำการลงทุน ผู้เขียนไม่ได้ให้บริการที่ปรึกษาการลงทุนที่มีใบอนุญาต

ในเดือนพฤษภาคม 2569 ผมค้นพบว่า 92% ของ "Top-10" ในอดีตที่ระบบจัดอันดับ US ของผมสร้างขึ้น เป็น artifacts ของ stale data

ไม่ใช่ noise ไม่ใช่ statistical variation แต่เป็น artifacts หุ้อเหล่านั้นไม่ได้จัดอันดับสูงจริงๆ พวกมันดูเหมือนจัดอันดับสูงเพราะราคาที่ valid ล่าสุดของพวกมันเก่ามาก

สิ่งที่เกิดขึ้น

ผมกำลังรัน information coefficient (IC) analysis เพื่อวัดว่า US RS ratings ของผมทำนาย forward returns ได้ไหม ผมสร้าง ranking คำนวณ 30-day forward returns สำหรับแต่ละชื่อ top-decile และคำนวณ IC ตลอดช่วงเวลาประวัติศาสตร์

ตัวเลข IC ดูสะอาดน่าแปลกใจ สะอาดเกินไป ผม run spot-check

สิ่งที่พบ: หุ้อที่หยุดซื้อขาย — ชื่อที่ถูก delist, tickers ที่ถูกซื้อกิจการใน mergers, บริษัทที่มีช่วง halt นาน — เก็บราคา valid ล่าสุดของพวกมันไว้ไม่มีกำหนด เมื่อการคำนวณ RS ของผมดูที่ราคา stale เหล่านี้เทียบกับข้อมูลล่าสุด พวกมันมักจะดูเหมือนมี relative strength สูงมาก

หุ้อที่ซื้อขายครั้งสุดท้ายที่ $30 ในปี 2022 ปรากฏใน rankings ปี 2024 ของผมราวกับว่ามันไม่เคยลดลง เพราะในฐานข้อมูลของผม มันไม่ได้ลด

วิธีแก้ไข

ผมเพิ่ม freshness filter: หุ้อใดก็ตามที่ last price date เก่ากว่า N trading days ถูก flag เป็น stale และถูกยกเว้นจาก rankings

ตอนนี้ wire ใน fetch_us_rs.py — script ที่คำนวณ US relative strength ratings หุ้อ stale ถูกยกเว้นก่อน ranking ไม่ใช่หลัง

การเปรียบเทียบก่อน-หลังชัดเจน: - ก่อน freshness filter: Top-10 ในอดีตครอบงำโดยชื่อ stale; IC ดูแข็งแกร่งแต่เป็น measurement artifact - หลัง freshness filter: Top-10 refresh เป็นหุ้อที่ active trading; real IC ต้องใช้การวิเคราะห์ระมัดระวังมากขึ้น

นี่เป็น data hygiene failure แบบ classic: ranking system กำลัง optimize ต่อ phantom data การ backtest ใดๆ ที่รันก่อนการแก้ไขนี้กำลังวัด performance บนชื่อที่ไม่สามารถซื้อขายจริงได้

บทเรียนที่กว้างกว่า

Stale data artifacts อันตรายเป็นพิเศษใน relative strength systems เพราะ RS ตาม definition เปรียบเทียบ performance ล่าสุดกับค่าเฉลี่ยของ universe ถ้า universe มี stale entries ที่หยุดเคลื่อนไหว พวกมันจะในที่สุดดูเหมือนแข็งแกร่งมาก (RS สูง) หรืออ่อนแอมาก (RS ต่ำ) เทียบกับตลาดที่ยังคงเคลื่อนไหว

ในทางปฏิบัติหมายความว่า: 1. Date-stamp universe ของคุณเสมอ — ทุกชื่อควรมี "last valid trade date" และถูกยกเว้นโดยอัตโนมัติถ้าเกิน threshold 2. Validate ICs ต่อ live-tradeable universes — ถ้าคุณซื้อชื่อนั้นจริงๆ ไม่ได้ IC contribution ของมันเป็น fictional 3. ตรวจสอบ spot samples — aggregate IC สามารถดูดีขณะที่ซ่อนว่า best performers นั้น untradeable

การแก้ไขตรงไปตรงมาเมื่อคุณเห็นมัน อันตรายคือการไม่สังเกต ระบบที่มี stale data สามารถผ่าน backtest validation ขณะที่ใช้ในการเทรดสดได้อย่างสมบูรณ์ — returns ถูกสร้างโดย positions ที่คุณซื้อไม่ได้

ผมพบสิ่งนี้โดยบังเอิญบน spot-check ตอนนี้ผมรัน freshness validation เป็นส่วนหนึ่งของทุก pipeline run

ตามรอย ศึกษา รอจังหวะ จู่โจม


บันทึกการวิจัยและการเทรดส่วนตัว — ไม่ใช่คำแนะนำการลงทุน ผู้เขียนไม่ได้ให้บริการที่ปรึกษาการลงทุนที่มีใบอนุญาต — MOEasymmetry

Draft 2026-06-12. แหล่งที่มา: US RS rating pipeline audit 2026-05-15 92% ของ historical Top-10 เป็น stale-data artifacts ก่อนการแก้ไข Fix: freshness filter เพิ่มใน fetch_us_rs.py 175K+ corrupt rows quarantined จาก fetcher root-cause fix 2026-05-09 (related) Full methodology ที่ vault methodology/IC-Stale-Data-Freshness-Gate.md

รับบทความวิจัยใหม่ทางอีเมล
ทดสอบจริง · ล้มเหลวจริง · เผยแพร่ทั้งหมด
Subscribe — ฟรี
📊 ดูแดชบอร์ดสด เครื่องสแกน breakout และ track record จริงได้ที่ หน้าหลัก MOEasymmetry — งานวิจัย ไม่ใช่คำแนะนำการลงทุน
← ก่อนหน้า
สัญญาณที่ได้ผล แต่ไม่ใช่แบบที่คิด
งานวิจัยและบันทึกการเทรดส่วนบุคคล ไม่ใช่คำแนะนำการลงทุน · Personal research & trading journal — not investment advice. The author does not provide licensed advisory services.
Home · Articles · Methodology · Track record