AI สามารถมองเห็นรูปแบบที่ตาเปล่ามองไม่เห็น เผยให้เห็นสัญญาณที่ดูเหมือนสัญญาณรบกวนในตอนแรก หากทำได้อย่างถูกต้อง มันจะเปลี่ยนพฤติกรรมที่ดูยุ่งเหยิงให้กลายเป็นข้อมูลคาดการณ์ที่มีประโยชน์ เช่น ยอดขายเดือนหน้า ปริมาณการเข้าชมเว็บไซต์ในวันพรุ่งนี้ และอัตราการเลิกใช้บริการในไตรมาสนี้ แต่หากทำผิดวิธี มันก็จะเป็นเพียงแค่การแสดงท่าทางไม่รู้เรื่อง ในคู่มือนี้ เราจะอธิบายกลไกการทำงานของ AI ในการทำนายแนวโน้มอย่างละเอียด ว่าอะไรคือเคล็ดลับความสำเร็จ และวิธีหลีกเลี่ยงการถูกหลอกด้วยกราฟสวยๆ ผมจะเน้นเรื่องที่ใช้งานได้จริง พร้อมกับบทสนทนาที่ตรงไปตรงมา และการยกคิ้วขึ้นบ้างเป็นครั้งคราว 🙃
บทความที่คุณอาจสนใจอ่านต่อหลังจากบทความนี้:
🔗 วิธีการวัดประสิทธิภาพ AI
ตัวชี้วัดสำคัญสำหรับการประเมินความถูกต้อง ประสิทธิภาพ และความน่าเชื่อถือของระบบ AI
🔗 วิธีการพูดคุยกับ AI
เคล็ดลับเชิงปฏิบัติสำหรับการสื่อสารกับ AI เพื่อปรับปรุงคุณภาพการตอบสนอง
🔗 AI Prompting คืออะไร
คำอธิบายที่ชัดเจนว่าข้อความแจ้งเตือนมีอิทธิพลต่อพฤติกรรมและผลลัพธ์ของ AI อย่างไร
🔗 การติดฉลากข้อมูล AI คืออะไร
บทนำเกี่ยวกับการติดป้ายกำกับข้อมูลอย่างมีประสิทธิภาพเพื่อใช้ในการฝึกฝนโมเดลการเรียนรู้ของเครื่องจักร
อะไรคือสิ่งที่ทำให้การทำนายแนวโน้มด้วย AI ดี ✅
เมื่อผู้คนถามว่า AI ทำนายเทรนด์ได้อย่างไร พวกเขามักหมายถึง: AI สามารถพยากรณ์สิ่งที่ไม่แน่นอนแต่เกิดขึ้นซ้ำๆ ได้อย่างไร การทำนายเทรนด์ที่ดีนั้นมีส่วนประกอบที่ดูธรรมดาแต่สวยงามอยู่ไม่กี่อย่าง:
-
ข้อมูลที่มีสัญญาณ - คุณไม่สามารถคั้นน้ำส้มจากหินได้ คุณจำเป็นต้องมีค่าในอดีตและบริบทประกอบด้วย
-
คุณสมบัติที่สะท้อนความเป็นจริง เช่น ฤดูกาล วันหยุด โปรโมชั่น บริบทระดับมหภาค หรือแม้แต่สภาพอากาศ ไม่จำเป็นต้องมีทั้งหมด แต่เลือกเฉพาะคุณสมบัติที่มีผลต่อการตัดสินใจของคุณ
-
แบบจำลองที่สอดคล้องกับเวลา - วิธีการที่คำนึงถึงเวลาซึ่งเคารพในลำดับ ช่องว่าง และการคลาดเคลื่อน
-
การประเมินที่สะท้อนการใช้งานจริง - การทดสอบย้อนหลังที่จำลองวิธีการทำนายผลจริง ห้ามแอบดู [2]
-
การติดตามการเปลี่ยนแปลง - โลกกำลังเปลี่ยนแปลงไป โมเดลของคุณก็ควรเปลี่ยนแปลงไปด้วยเช่นกัน [5]
นั่นคือโครงกระดูก ส่วนที่เหลือคือกล้ามเนื้อ เส้นเอ็น และคาเฟอีนเล็กน้อย

กระบวนการหลัก: AI ทำนายแนวโน้มจากข้อมูลดิบเพื่อการพยากรณ์ได้อย่างไร 🧪
-
รวบรวมและจัดเรียงข้อมูล
นำชุดข้อมูลเป้าหมายและสัญญาณภายนอกมารวมกัน แหล่งข้อมูลทั่วไป ได้แก่ แคตตาล็อกสินค้า ค่าใช้จ่ายในการโฆษณา ราคา ดัชนีเศรษฐกิจมหภาค และเหตุการณ์ต่างๆ จัดเรียงเวลา จัดการกับค่าที่หายไป และกำหนดหน่วยมาตรฐาน อาจดูไม่น่าดึงดูดใจ แต่มีความสำคัญอย่างยิ่ง -
คุณสมบัติทางวิศวกรรม
สร้างค่าความล่าช้า ค่าเฉลี่ยเคลื่อนที่ ควอนไทล์เคลื่อนที่ แฟล็กวันในสัปดาห์ และตัวบ่งชี้เฉพาะโดเมน สำหรับการปรับตามฤดูกาล ผู้ปฏิบัติงานจำนวนมากจะแยกอนุกรมออกเป็นส่วนประกอบแนวโน้ม ฤดูกาล และส่วนที่เหลือก่อนการสร้างแบบจำลอง โปรแกรม X-13 ของสำนักงานสำมะโนประชากรของสหรัฐอเมริกาถือเป็นแหล่งอ้างอิงหลักสำหรับวิธีการและเหตุผลที่วิธีการนี้ได้ผล [1] -
เลือกครอบครัวต้นแบบ
คุณมีตัวเลือกหลักๆ อยู่ 3 ข้อ:
-
สถิติแบบคลาสสิก : ARIMA, ETS, แบบจำลองสถานะ/คาลมาน สามารถตีความได้และรวดเร็ว
-
การเรียนรู้ของเครื่อง : การเพิ่มประสิทธิภาพด้วยการไล่ระดับ (gradient boosting), ป่าสุ่ม (random forests) ที่มีคุณสมบัติที่คำนึงถึงเวลา มีความยืดหยุ่นสำหรับอนุกรมข้อมูลหลายประเภท
-
การเรียนรู้เชิงลึก : LSTM, Temporal CNNs, Transformers มีประโยชน์เมื่อคุณมีข้อมูลจำนวนมากและโครงสร้างที่ซับซ้อน
-
การทดสอบย้อนหลังอย่างถูกต้อง
การตรวจสอบความถูกต้องแบบไขว้ของอนุกรมเวลาใช้จุดเริ่มต้นแบบหมุนเวียน ดังนั้นคุณจะไม่ฝึกฝนในอนาคตในขณะที่ทดสอบในอดีต นี่คือความแตกต่างระหว่างความแม่นยำที่แท้จริงและการคิดเข้าข้างตัวเอง [2] -
คาดการณ์ ประเมินความไม่แน่นอน และส่ง
การคาดการณ์ผลตอบแทนด้วยช่วงเวลา ตรวจสอบข้อผิดพลาด และฝึกฝนใหม่เมื่อโลกเปลี่ยนแปลง บริการจัดการโดยทั่วไปจะแสดงเมตริกความแม่นยำ (เช่น MAPE, WAPE, MASE) และหน้าต่างการทดสอบย้อนหลังโดยอัตโนมัติ ซึ่งทำให้การกำกับดูแลและแดชบอร์ดง่ายขึ้น [3]
เรื่องเล่าสั้นๆ เกี่ยวกับประสบการณ์การทำงาน: ในการเปิดตัวครั้งหนึ่ง เราใช้เวลาเพิ่มอีกหนึ่งวันไปกับการเพิ่มฟีเจอร์ปฏิทิน (วันหยุดประจำภูมิภาค + ธงโปรโมชั่น) และลดข้อผิดพลาดในช่วงเริ่มต้นได้อย่างเห็นได้ชัดมากกว่าการเปลี่ยนโมเดล คุณภาพของฟีเจอร์สำคัญกว่าความแปลกใหม่ของโมเดล ซึ่งเป็นธีมที่คุณจะได้เห็นอีกครั้ง
ตารางเปรียบเทียบ: เครื่องมือที่ช่วยให้ AI ทำนายแนวโน้ม 🧰
ไม่สมบูรณ์แบบโดยตั้งใจ - โต๊ะจริงที่มีข้อบกพร่องเล็กน้อยจากการใช้งานของมนุษย์
| เครื่องมือ / กอง | ผู้ชมที่ดีที่สุด | ราคา | เหตุผลที่มันได้ผล...ประมาณนั้น | หมายเหตุ |
|---|---|---|---|---|
| ศาสดา | นักวิเคราะห์, ฝ่ายผลิตภัณฑ์ | ฟรี | ฤดูกาลและวันหยุดต่างๆ ถูกรวมไว้แล้ว ทำให้ได้ผลลัพธ์ที่รวดเร็ว | เหมาะสำหรับใช้เป็นค่าพื้นฐาน และใช้ได้ดีกับค่าผิดปกติ |
| สถิติโมเดล ARIMA | นักวิทยาศาสตร์ข้อมูล | ฟรี | โครงสร้างคลาสสิกที่แข็งแกร่ง - สามารถตีความได้ | ต้องระมัดระวังเรื่องความนิ่งของแท่นวาง |
| การพยากรณ์ AI ของ Google Vertex | ทีมงานในระดับขนาดใหญ่ | ระดับการชำระเงิน | AutoML + เครื่องมือสำหรับฟีเจอร์ + ฮุกสำหรับการปรับใช้ | สะดวกมากหากคุณใช้งาน GCP อยู่แล้ว เอกสารประกอบละเอียดครบถ้วน |
| พยากรณ์อากาศของ Amazon | ทีมงานด้านข้อมูล/แมชชีนเลิร์นนิงบน AWS | ระดับการชำระเงิน | การทดสอบย้อนหลัง, ตัวชี้วัดความแม่นยำ, จุดเชื่อมต่อที่ปรับขนาดได้ | เมตริกต่างๆ เช่น MAPE, WAPE, MASE พร้อมใช้งาน [3] |
| กลูออนทีเอส | นักวิจัย, วิศวกร ML | ฟรี | สถาปัตยกรรมเชิงลึกมากมาย ขยายได้ | ยิ่งเขียนโค้ดมาก ยิ่งควบคุมได้มากขึ้น |
| แคทส์ | นักทดลอง | ฟรี | ชุดเครื่องมือของ Meta - ตัวตรวจจับ ตัวพยากรณ์ และเครื่องมือวินิจฉัย | ให้ความรู้สึกเหมือนเป็นทหารสวิส บางครั้งก็ช่างพูด |
| วงโคจร | ผู้เชี่ยวชาญด้านการพยากรณ์ | ฟรี | แบบจำลองเบย์เซียน ช่วงความเชื่อมั่น | เหมาะมากถ้าคุณชอบไพรเออร์ส |
| การพยากรณ์ด้วย PyTorch | ผู้เรียนรู้เชิงลึก | ฟรี | สูตรอาหาร DL สมัยใหม่ เหมาะสำหรับหลายซีรีส์ | นำการ์ดจอและของว่างมาด้วย |
ใช่แล้ว การใช้ถ้อยคำไม่สม่ำเสมอ นั่นเป็นเรื่องจริงในชีวิต
การออกแบบฟีเจอร์ที่สร้างความเปลี่ยนแปลงอย่างแท้จริง 🧩
คำตอบที่ง่ายที่สุดและมีประโยชน์ที่สุดสำหรับคำถามที่ว่า AI ทำนายแนวโน้มได้อย่างไร คือ เราแปลงอนุกรมข้อมูลให้เป็นตารางการเรียนรู้แบบมีผู้กำกับดูแลซึ่งจดจำช่วงเวลาได้ ขั้นตอนพื้นฐานที่ควรทำตามมีดังนี้:
-
ค่าความหน่วงและช่วงเวลา : รวมถึง y[t-1], y[t-7], y[t-28] รวมถึงค่าเฉลี่ยเคลื่อนที่และค่าเบี่ยงเบนมาตรฐาน มันจับภาพโมเมนตัมและความเฉื่อย
-
สัญญาณแสดงฤดูกาล : เดือน สัปดาห์ วันในสัปดาห์ ชั่วโมงในแต่ละวัน เทอมฟูริเยร์ให้เส้นโค้งตามฤดูกาลที่เรียบเนียน
-
ปฏิทินและกิจกรรม : วันหยุด, การเปิดตัวผลิตภัณฑ์, การเปลี่ยนแปลงราคา, โปรโมชั่น เอฟเฟกต์วันหยุดสไตล์ Prophet เป็นเพียงฟีเจอร์ที่มีการตั้งค่าล่วงหน้า
-
การแยกส่วน : ลบส่วนประกอบตามฤดูกาลออกและสร้างแบบจำลองส่วนที่เหลือเมื่อรูปแบบมีความชัดเจน X-13 เป็นฐานที่ได้รับการทดสอบอย่างดีสำหรับสิ่งนี้ [1]
-
ตัวแปรอิสระภายนอก : สภาพอากาศ ดัชนีเศรษฐกิจมหภาค จำนวนการเข้าชมหน้าเว็บ ความสนใจในการค้นหา
-
คำแนะนำในการโต้ตอบ : ใช้การจับคู่แบบง่ายๆ เช่น ธงโปรโมชั่น × วันในสัปดาห์ วิธีนี้อาจดูยุ่งยาก แต่ก็มักได้ผล
หากคุณมีสินค้าหลายชุดที่เกี่ยวข้องกัน เช่น สินค้าหลายพันรายการ คุณสามารถรวบรวมข้อมูลจากสินค้าเหล่านั้นได้โดยใช้โมเดลแบบลำดับชั้นหรือแบบทั่วโลก ในทางปฏิบัติ โมเดลแบบเพิ่มประสิทธิภาพด้วยการไล่ระดับความชันแบบทั่วโลกที่มีคุณสมบัติที่คำนึงถึงเวลา มักให้ผลลัพธ์ที่ดีเกินกว่าที่คาดไว้
การเลือกครอบครัวต้นแบบ: การทะเลาะเบาะแว้งแบบเป็นกันเอง 🤼♀️
-
ARIMA/ETS
: ตีความได้ง่าย รวดเร็ว สร้างพื้นฐานที่มั่นคง ข้อเสีย: การปรับแต่งต่ออนุกรมข้อมูลอาจยุ่งยากเมื่อใช้งานในขนาดใหญ่ การหาค่าสหสัมพันธ์บางส่วนสามารถช่วยเปิดเผยลำดับได้ แต่ก็อย่าคาดหวังปาฏิหาริย์ -
Gradient boosting
: จัดการกับข้อมูลในรูปแบบตารางได้ดี ทนทานต่อสัญญาณผสม ทำงานได้ดีกับอนุกรมข้อมูลที่มีความสัมพันธ์กันหลายชุด ข้อเสีย: คุณต้องออกแบบคุณสมบัติของเวลาให้ดีและต้องคำนึงถึงความสัมพันธ์เชิงสาเหตุด้วย -
การเรียนรู้เชิงลึก
: สามารถจับความไม่เป็นเชิงเส้นและรูปแบบข้ามอนุกรมได้ ข้อเสีย: ต้องการข้อมูลจำนวนมาก แก้ไขข้อผิดพลาดได้ยากกว่า เมื่อมีบริบทที่สมบูรณ์หรือประวัติข้อมูลที่ยาวนาน การเรียนรู้เชิงลึกจะแสดงประสิทธิภาพได้อย่างยอดเยี่ยม แต่ถ้าไม่มีบริบทที่สมบูรณ์หรือประวัติข้อมูลที่ยาวนาน ก็เหมือนรถสปอร์ตที่วิ่งฝ่าการจราจรติดขัดในชั่วโมงเร่งด่วน -
โมเดลไฮบริดและโมเดลแบบผสมผสาน
เอาตรงๆ นะ การใช้โมเดลพื้นฐานตามฤดูกาลร่วมกับตัวเร่งการไล่ระดับสี และการผสมผสานกับ LSTM ที่มีน้ำหนักเบา เป็นความสุขเล็กๆ น้อยๆ ที่หลายคนแอบทำ ผมเองก็เคยเปลี่ยนใจจาก "การใช้โมเดลเดี่ยวอย่างเดียว" มาหลายครั้งแล้วเหมือนกัน
ความสัมพันธ์เชิงสาเหตุกับความสัมพันธ์เชิงสหสัมพันธ์: โปรดใช้ความระมัดระวัง 🧭
เพียงเพราะเส้นสองเส้นขยับเข้าหากันไม่ได้หมายความว่าเส้นหนึ่งจะขับเคลื่อนอีกเส้นหนึ่ง ความเป็นเหตุเป็นผลของ Granger จะทดสอบว่าการเพิ่มตัวขับเคลื่อนที่เป็นไปได้จะช่วยปรับปรุงการทำนายสำหรับเป้าหมายหรือไม่ โดยพิจารณาจากประวัติของตัวขับเคลื่อนเอง เป็นการพูดถึงประโยชน์ในการทำนายภายใต้สมมติฐานการถดถอยอัตโนมัติเชิงเส้น ไม่ใช่ความเป็นเหตุเป็นผลเชิงปรัชญา ซึ่งเป็นความแตกต่างที่ละเอียดอ่อนแต่สำคัญ [4]
ในการใช้งานจริง คุณยังคงต้องตรวจสอบความถูกต้องด้วยความรู้เฉพาะด้าน ตัวอย่างเช่น ผลกระทบจากวันในสัปดาห์มีความสำคัญสำหรับธุรกิจค้าปลีก แต่การเพิ่มจำนวนคลิกโฆษณาของสัปดาห์ที่แล้วอาจซ้ำซ้อนหากค่าใช้จ่ายรวมอยู่ในแบบจำลองแล้ว
การทดสอบย้อนหลังและตัวชี้วัด: จุดที่มักเกิดข้อผิดพลาดมากที่สุด 🔍
เพื่อประเมินว่า AI สามารถทำนายแนวโน้มได้อย่างสมจริงเพียงใด ให้ลองจำลองสถานการณ์การพยากรณ์ในสภาพแวดล้อมจริง:
-
การตรวจสอบความถูกต้องแบบครอสส์วาลิเดชันแบบโรลลิ่งออริจินัล : ฝึกฝนซ้ำๆ บนข้อมูลก่อนหน้าและทำนายกลุ่มข้อมูลถัดไป วิธีนี้เคารพลำดับเวลาและป้องกันการรั่วไหลในอนาคต [2]
-
ตัวชี้วัดข้อผิดพลาด : เลือกสิ่งที่เหมาะสมกับการตัดสินใจของคุณ ตัวชี้วัดเปอร์เซ็นต์เช่น MAPE เป็นที่นิยม แต่ตัวชี้วัดแบบถ่วงน้ำหนัก (WAPE) หรือตัวชี้วัดแบบไร้มาตราส่วน (MASE) มักจะมีประสิทธิภาพดีกว่าสำหรับพอร์ตโฟลิโอและผลรวม [3]
-
ช่วงการคาดการณ์ : อย่าให้แค่ตัวเลขจุดเดียว สื่อสารความไม่แน่นอนด้วย ผู้บริหารมักไม่ชอบช่วงตัวเลข แต่พวกเขาชอบความประหลาดใจที่น้อยลง
ข้อควรระวังเล็กน้อย: เมื่อค่าบางอย่างเป็นศูนย์ ตัวชี้วัดเปอร์เซ็นต์จะผิดเพี้ยนไป ควรใช้ค่าความคลาดเคลื่อนสัมบูรณ์หรือค่าที่ปรับขนาดแล้ว หรือเพิ่มค่าชดเชยเล็กน้อยเข้าไปก็ได้ ขอแค่ใช้ค่าที่สอดคล้องกันก็พอ
การเปลี่ยนแปลงเกิดขึ้นได้: การตรวจจับและปรับตัวให้เข้ากับการเปลี่ยนแปลง 🌊
ตลาดเปลี่ยนแปลง ความชอบเปลี่ยนแปลง เซ็นเซอร์เสื่อมสภาพ การเปลี่ยนแปลงแนวคิด เป็นคำที่ใช้เรียกโดยรวมเมื่อความสัมพันธ์ระหว่างอินพุตและเป้าหมายมีการเปลี่ยนแปลง คุณสามารถตรวจสอบการเปลี่ยนแปลงได้ด้วยการทดสอบทางสถิติ ข้อผิดพลาดแบบหน้าต่างเลื่อน หรือการตรวจสอบการกระจายข้อมูล จากนั้นเลือกกลยุทธ์: หน้าต่างการฝึกอบรมที่สั้นลง การฝึกอบรมซ้ำเป็นระยะ หรือโมเดลปรับตัวที่อัปเดตแบบออนไลน์ การสำรวจภาคสนามแสดงให้เห็นถึงประเภทของการเปลี่ยนแปลงและนโยบายการปรับตัวหลายประเภท ไม่มีนโยบายใดนโยบายเดียวที่เหมาะสมกับทุกกรณี [5]
คู่มือปฏิบัติจริง: ตั้งค่าเกณฑ์การแจ้งเตือนเมื่อเกิดข้อผิดพลาดในการพยากรณ์แบบเรียลไทม์ ฝึกฝนระบบใหม่ตามกำหนดเวลา และเตรียมฐานข้อมูลสำรองไว้เสมอ อาจไม่ดูหรูหรา แต่ได้ผลดีมาก
ความสามารถในการอธิบาย: การเปิดกล่องดำโดยไม่ทำให้กล่องเสียหาย 🔦
ผู้มีส่วนได้ส่วนเสียถามว่าทำไมการคาดการณ์ถึงสูงขึ้น ซึ่งก็สมเหตุสมผล เครื่องมือที่ไม่ขึ้นกับแบบจำลอง เช่น SHAP จะระบุสาเหตุของการคาดการณ์ตามคุณลักษณะต่างๆ ในลักษณะที่มีพื้นฐานทางทฤษฎี ช่วยให้คุณเห็นว่าฤดูกาล ราคา หรือสถานะโปรโมชั่นส่งผลต่อตัวเลขหรือไม่ มันไม่ได้พิสูจน์ความสัมพันธ์เชิงสาเหตุ แต่ช่วยเพิ่มความน่าเชื่อถือและช่วยในการแก้ไขข้อผิดพลาดได้
จากการทดสอบของผมเอง พบว่าปัจจัยตามฤดูกาลรายสัปดาห์และสัญญาณโปรโมชั่นมักจะมีอิทธิพลต่อการคาดการณ์ยอดขายปลีกในระยะสั้น ในขณะที่การคาดการณ์ในระยะยาวจะหันไปใช้ตัวชี้วัดระดับมหภาคมากกว่า ผลลัพธ์ที่ได้อาจแตกต่างกันไปในแต่ละบุคคล (แต่ก็ถือว่าน่าพอใจ)
Cloud & MLOps: พยากรณ์สภาพอากาศได้โดยไม่ต้องใช้เทปกาว 🚚
หากคุณต้องการใช้แพลตฟอร์มที่มีการจัดการ:
-
Google Vertex AI Forecast นำเสนอขั้นตอนการทำงานแบบมีคำแนะนำสำหรับการนำเข้าข้อมูลอนุกรมเวลา การเรียกใช้การพยากรณ์อัตโนมัติด้วย AutoML การทดสอบย้อนหลัง และการปรับใช้เอนด์พอยต์ นอกจากนี้ยังทำงานได้ดีกับระบบจัดการข้อมูลสมัยใหม่ด้วย
-
Amazon Forecast มุ่งเน้นไปที่การใช้งานในวงกว้าง โดยมีการทดสอบย้อนหลังที่เป็นมาตรฐานและเมตริกความแม่นยำที่คุณสามารถดึงผ่าน API ซึ่งช่วยในการกำกับดูแลและแดชบอร์ด [3]
ไม่ว่าจะเลือกวิธีไหนก็ช่วยลดโค้ดซ้ำซ้อนได้ แค่คอยดูทั้งต้นทุนและที่มาของข้อมูล ต้องคอยดูทั้งสองอย่างพร้อมกัน – ยากแต่ทำได้
ตัวอย่างการวิเคราะห์แบบย่อ: จากจำนวนคลิกดิบสู่สัญญาณแนวโน้ม 🧭✨
ลองนึกภาพว่าคุณกำลังคาดการณ์จำนวนผู้สมัครใช้งานแอปแบบฟรีเมียมรายวัน:
-
ข้อมูล : ดึงข้อมูลการสมัครสมาชิกรายวัน ค่าใช้จ่ายในการโฆษณาแยกตามช่องทาง การขัดข้องของเว็บไซต์ และปฏิทินโปรโมชั่นแบบง่ายๆ
-
คุณสมบัติ : ความล่าช้า 1, 7, 14; ค่าเฉลี่ยเคลื่อนที่ 7 วัน; แฟล็กวันในสัปดาห์; แฟล็กโปรโมชั่นไบนารี; เทอมตามฤดูกาลฟูริเยร์; และส่วนที่เหลือตามฤดูกาลที่แยกส่วนเพื่อให้โมเดลเน้นส่วนที่ไม่ซ้ำกัน การแยกส่วนตามฤดูกาลเป็นการเคลื่อนไหวแบบคลาสสิกในงานสถิติอย่างเป็นทางการ - ชื่อน่าเบื่อ แต่ได้ผลตอบแทนมหาศาล [1]
-
โมเดล : เริ่มต้นด้วยตัวถดถอยแบบเพิ่มประสิทธิภาพด้วยการไล่ระดับ (gradient-boosted regressor) เป็นโมเดลระดับโลกครอบคลุมทุกพื้นที่ทางภูมิศาสตร์
-
การทดสอบย้อนหลัง : จุดเริ่มต้นแบบหมุนเวียนพร้อมการพับรายสัปดาห์ ปรับ WAPE ให้เหมาะสมกับกลุ่มธุรกิจหลักของคุณ การทดสอบย้อนหลังที่คำนึงถึงเวลาเป็นสิ่งที่ไม่สามารถต่อรองได้เพื่อให้ได้ผลลัพธ์ที่น่าเชื่อถือ [2]
-
อธิบาย : ตรวจสอบการระบุแหล่งที่มาของฟีเจอร์ทุกสัปดาห์ เพื่อดูว่าธงโปรโมชั่นนั้นมีประโยชน์อะไรบ้าง นอกเหนือจากการทำให้ดูสวยงามในสไลด์
-
ตรวจสอบ : หากผลกระทบของโปรโมชั่นลดลงหรือรูปแบบวันธรรมดาเปลี่ยนไปหลังจากเปลี่ยนผลิตภัณฑ์ ให้เริ่มการฝึกอบรมใหม่ การเบี่ยงเบนไม่ใช่ข้อผิดพลาด - มันเป็นวันพุธ [5]
ผลลัพธ์ที่ได้: การคาดการณ์ที่น่าเชื่อถือพร้อมช่วงความเชื่อมั่น และแดชบอร์ดที่แสดงให้เห็นถึงปัจจัยที่ส่งผลต่อการเปลี่ยนแปลง ลดการถกเถียง เพิ่มการลงมือทำ
กับดักและเรื่องเข้าใจผิดที่ควรหลีกเลี่ยงอย่างเงียบๆ 🚧
-
ความเชื่อผิดๆ: ฟีเจอร์ยิ่งมากยิ่งดี ไม่ใช่เลย ฟีเจอร์ที่ไม่จำเป็นมากเกินไปจะทำให้เกิดการโอเวอร์ฟิตติ้ง ควรเก็บเฉพาะฟีเจอร์ที่ช่วยในการทดสอบย้อนหลังและสอดคล้องกับบริบทของโดเมนเท่านั้น
-
ความเชื่อผิดๆ: โครงข่ายประสาทเทียมแบบลึกเอาชนะทุกอย่างได้ บางครั้งก็ใช่ แต่ส่วนใหญ่ไม่ใช่ หากข้อมูลมีน้อยหรือมีสัญญาณรบกวน วิธีการแบบดั้งเดิมจะเหนือกว่าในด้านความเสถียรและความโปร่งใส
-
ข้อผิดพลาด: การรั่วไหล การปล่อยให้ข้อมูลของวันพรุ่งนี้เข้าสู่การฝึกอบรมในวันนี้โดยไม่ได้ตั้งใจจะทำให้ตัวชี้วัดของคุณดูดีเกินจริงและส่งผลเสียต่อผลผลิตของคุณ [2]
-
ข้อผิดพลาด: การยึดติดกับทศนิยมสุดท้าย หากห่วงโซ่อุปทานของคุณมีความซับซ้อน การถกเถียงระหว่างความคลาดเคลื่อน 7.3 และ 7.4 เปอร์เซ็นต์นั้นไร้สาระ ควรเน้นที่เกณฑ์การตัดสินใจมากกว่า
-
ความเชื่อผิดๆ: ความเป็นเหตุเป็นผลจากความสัมพันธ์ การทดสอบ Granger ตรวจสอบประโยชน์ในการทำนาย ไม่ใช่ความจริงเชิงปรัชญา ใช้เป็นแนวทาง ไม่ใช่หลักคำสอน [4]
รายการตรวจสอบการดำเนินการที่คุณสามารถคัดลอกและวางได้ 📋
-
กำหนดขอบเขตเวลา ระดับการรวมข้อมูล และการตัดสินใจที่คุณจะขับเคลื่อน
-
สร้างดัชนีเวลาที่สะอาด เติมหรือทำเครื่องหมายช่องว่าง และจัดเรียงข้อมูลภายนอกให้ตรงกัน
-
ความหน่วงในการสร้างไอเทม สถิติที่เปลี่ยนแปลงตลอดเวลา ธงประจำฤดูกาล และฟีเจอร์โดเมนบางอย่างที่คุณไว้วางใจ
-
เริ่มต้นด้วยพื้นฐานที่แข็งแกร่ง จากนั้นค่อยปรับปรุงไปสู่โมเดลที่ซับซ้อนขึ้นหากจำเป็น
-
ใช้การทดสอบย้อนหลังแบบ rolling-origin กับเมตริกที่ตรงกับธุรกิจของคุณ [2][3]
-
เพิ่มช่วงเวลาการคาดการณ์ - ไม่สามารถละเว้นได้
-
เรือ ตรวจสอบการลอยตัว และฝึกใหม่ตามกำหนดเวลาและตามการแจ้งเตือน [5]
ยาวเกินไป ฉันอ่านไม่จบ - ข้อคิดเห็นสุดท้าย 💬
ความจริงง่ายๆ เกี่ยวกับวิธีการที่ AI ทำนายแนวโน้มคือ มันไม่ได้เกี่ยวกับอัลกอริทึมมหัศจรรย์มากนัก แต่เป็นเรื่องของการออกแบบที่มีระเบียบวินัยและคำนึงถึงเวลา ต้องได้ข้อมูลและคุณสมบัติที่ถูกต้อง ประเมินอย่างตรงไปตรงมา อธิบายอย่างง่ายๆ และปรับตัวตามการเปลี่ยนแปลงของความเป็นจริง มันเหมือนกับการปรับคลื่นวิทยุที่มีปุ่มหมุนที่เลอะเล็กน้อย – อาจจะยุ่งยากเล็กน้อย บางครั้งก็มีเสียงรบกวน แต่เมื่อรับสัญญาณได้แล้ว เสียงก็จะชัดเจนอย่างน่าประหลาดใจ
ถ้าคุณจะจำอะไรสักอย่างไว้ก็คือ จงเคารพเวลา ตรวจสอบอย่างมีวิจารณญาณ และคอยติดตามอย่างต่อเนื่อง ส่วนที่เหลือก็เป็นเพียงเรื่องของเครื่องมือและรสนิยมเท่านั้น
เอกสารอ้างอิง
-
สำนักงานสำมะโนประชากรแห่งสหรัฐอเมริกา - โครงการปรับฤดูกาล X-13ARIMA- SEATS ลิงก์
-
Hyndman & Athanasopoulos - การพยากรณ์: หลักการและการปฏิบัติ (FPP3), §5.10 การตรวจสอบความถูกต้องแบบไขว้ของอนุกรม เวลา ลิงก์
-
Amazon Web Services - การประเมินความแม่นยำของตัวพยากรณ์ (Amazon Forecast) . ลิงก์
-
มหาวิทยาลัยฮูสตัน - ความสัมพันธ์เชิงสาเหตุแบบแกรนเจอร์ (บันทึกการบรรยาย) . ลิงก์
-
Gama et al. - การสำรวจเกี่ยวกับการปรับตัวต่อการเปลี่ยนแปลงแนวคิด (ฉบับเปิด) ลิงก์