AI คาดการณ์แนวโน้มได้อย่างไร?

AI สามารถมองเห็นรูปแบบที่ตาเปล่ามองไม่เห็น เผยให้เห็นสัญญาณที่ดูเหมือนสัญญาณรบกวนในตอนแรก หากทำได้อย่างถูกต้อง มันจะเปลี่ยนพฤติกรรมที่ดูยุ่งเหยิงให้กลายเป็นข้อมูลคาดการณ์ที่มีประโยชน์ เช่น ยอดขายเดือนหน้า ปริมาณการเข้าชมเว็บไซต์ในวันพรุ่งนี้ และอัตราการเลิกใช้บริการในไตรมาสนี้ แต่หากทำผิดวิธี มันก็จะเป็นเพียงแค่การแสดงท่าทางไม่รู้เรื่อง ในคู่มือนี้ เราจะอธิบายกลไกการทำงานของ AI ในการทำนายแนวโน้มอย่างละเอียด ว่าอะไรคือเคล็ดลับความสำเร็จ และวิธีหลีกเลี่ยงการถูกหลอกด้วยกราฟสวยๆ ผมจะเน้นเรื่องที่ใช้งานได้จริง พร้อมกับบทสนทนาที่ตรงไปตรงมา และการยกคิ้วขึ้นบ้างเป็นครั้งคราว 🙃

บทความที่คุณอาจสนใจอ่านต่อหลังจากบทความนี้:

🔗 วิธีการวัดประสิทธิภาพ AI
ตัวชี้วัดสำคัญสำหรับการประเมินความถูกต้อง ประสิทธิภาพ และความน่าเชื่อถือของระบบ AI

🔗 วิธีการพูดคุยกับ AI
เคล็ดลับเชิงปฏิบัติสำหรับการสื่อสารกับ AI เพื่อปรับปรุงคุณภาพการตอบสนอง

🔗 AI Prompting คืออะไร
คำอธิบายที่ชัดเจนว่าข้อความแจ้งเตือนมีอิทธิพลต่อพฤติกรรมและผลลัพธ์ของ AI อย่างไร

🔗 การติดฉลากข้อมูล AI คืออะไร
บทนำเกี่ยวกับการติดป้ายกำกับข้อมูลอย่างมีประสิทธิภาพเพื่อใช้ในการฝึกฝนโมเดลการเรียนรู้ของเครื่องจักร

อะไรคือสิ่งที่ทำให้การทำนายแนวโน้มด้วย AI ดี ✅

เมื่อผู้คนถามว่า AI ทำนายเทรนด์ได้อย่างไร พวกเขามักหมายถึง: AI สามารถพยากรณ์สิ่งที่ไม่แน่นอนแต่เกิดขึ้นซ้ำๆ ได้อย่างไร การทำนายเทรนด์ที่ดีนั้นมีส่วนประกอบที่ดูธรรมดาแต่สวยงามอยู่ไม่กี่อย่าง:

ข้อมูลที่มีสัญญาณ - คุณไม่สามารถคั้นน้ำส้มจากหินได้ คุณจำเป็นต้องมีค่าในอดีตและบริบทประกอบด้วย
คุณสมบัติที่สะท้อนความเป็นจริง เช่น ฤดูกาล วันหยุด โปรโมชั่น บริบทระดับมหภาค หรือแม้แต่สภาพอากาศ ไม่จำเป็นต้องมีทั้งหมด แต่เลือกเฉพาะคุณสมบัติที่มีผลต่อการตัดสินใจของคุณ
แบบจำลองที่สอดคล้องกับเวลา - วิธีการที่คำนึงถึงเวลาซึ่งเคารพในลำดับ ช่องว่าง และการคลาดเคลื่อน
การประเมินที่สะท้อนการใช้งานจริง - การทดสอบย้อนหลังที่จำลองวิธีการทำนายผลจริง ห้ามแอบดู [2]
การติดตามการเปลี่ยนแปลง - โลกกำลังเปลี่ยนแปลงไป โมเดลของคุณก็ควรเปลี่ยนแปลงไปด้วยเช่นกัน [5]

นั่นคือโครงกระดูก ส่วนที่เหลือคือกล้ามเนื้อ เส้นเอ็น และคาเฟอีนเล็กน้อย

กระบวนการหลัก: AI ทำนายแนวโน้มจากข้อมูลดิบเพื่อการพยากรณ์ได้อย่างไร 🧪

รวบรวมและจัดเรียงข้อมูล
นำชุดข้อมูลเป้าหมายและสัญญาณภายนอกมารวมกัน แหล่งข้อมูลทั่วไป ได้แก่ แคตตาล็อกสินค้า ค่าใช้จ่ายในการโฆษณา ราคา ดัชนีเศรษฐกิจมหภาค และเหตุการณ์ต่างๆ จัดเรียงเวลา จัดการกับค่าที่หายไป และกำหนดหน่วยมาตรฐาน อาจดูไม่น่าดึงดูดใจ แต่มีความสำคัญอย่างยิ่ง
คุณสมบัติทางวิศวกรรม
สร้างค่าความล่าช้า ค่าเฉลี่ยเคลื่อนที่ ควอนไทล์เคลื่อนที่ แฟล็กวันในสัปดาห์ และตัวบ่งชี้เฉพาะโดเมน สำหรับการปรับตามฤดูกาล ผู้ปฏิบัติงานจำนวนมากจะแยกอนุกรมออกเป็นส่วนประกอบแนวโน้ม ฤดูกาล และส่วนที่เหลือก่อนการสร้างแบบจำลอง โปรแกรม X-13 ของสำนักงานสำมะโนประชากรของสหรัฐอเมริกาถือเป็นแหล่งอ้างอิงหลักสำหรับวิธีการและเหตุผลที่วิธีการนี้ได้ผล [1]
เลือกครอบครัวต้นแบบ
คุณมีตัวเลือกหลักๆ อยู่ 3 ข้อ:

สถิติแบบคลาสสิก: ARIMA, ETS, แบบจำลองสถานะ/คาลมาน สามารถตีความได้และรวดเร็ว
การเรียนรู้ของเครื่อง: การเพิ่มประสิทธิภาพด้วยการไล่ระดับ (gradient boosting), ป่าสุ่ม (random forests) ที่มีคุณสมบัติที่คำนึงถึงเวลา มีความยืดหยุ่นสำหรับอนุกรมข้อมูลหลายประเภท
การเรียนรู้เชิงลึก: LSTM, Temporal CNNs, Transformers มีประโยชน์เมื่อคุณมีข้อมูลจำนวนมากและโครงสร้างที่ซับซ้อน

การทดสอบย้อนหลังอย่างถูกต้อง
การตรวจสอบความถูกต้องแบบไขว้ของอนุกรมเวลาใช้จุดเริ่มต้นแบบหมุนเวียน ดังนั้นคุณจะไม่ฝึกฝนในอนาคตในขณะที่ทดสอบในอดีต นี่คือความแตกต่างระหว่างความแม่นยำที่แท้จริงและการคิดเข้าข้างตัวเอง [2]
คาดการณ์ ประเมินความไม่แน่นอน และส่ง
การคาดการณ์ผลตอบแทนด้วยช่วงเวลา ตรวจสอบข้อผิดพลาด และฝึกฝนใหม่เมื่อโลกเปลี่ยนแปลง บริการจัดการโดยทั่วไปจะแสดงเมตริกความแม่นยำ (เช่น MAPE, WAPE, MASE) และหน้าต่างการทดสอบย้อนหลังโดยอัตโนมัติ ซึ่งทำให้การกำกับดูแลและแดชบอร์ดง่ายขึ้น [3]

เรื่องเล่าสั้นๆ เกี่ยวกับประสบการณ์การทำงาน: ในการเปิดตัวครั้งหนึ่ง เราใช้เวลาเพิ่มอีกหนึ่งวันไปกับการเพิ่มฟีเจอร์ปฏิทิน (วันหยุดประจำภูมิภาค + ธงโปรโมชั่น) และลดข้อผิดพลาดในช่วงเริ่มต้นได้อย่างเห็นได้ชัดมากกว่าการเปลี่ยนโมเดล คุณภาพของฟีเจอร์สำคัญกว่าความแปลกใหม่ของโมเดล ซึ่งเป็นธีมที่คุณจะได้เห็นอีกครั้ง

ตารางเปรียบเทียบ: เครื่องมือที่ช่วยให้ AI ทำนายแนวโน้ม 🧰

ไม่สมบูรณ์แบบโดยตั้งใจ - โต๊ะจริงที่มีข้อบกพร่องเล็กน้อยจากการใช้งานของมนุษย์

เครื่องมือ / กอง	ผู้ชมที่ดีที่สุด	ราคา	เหตุผลที่มันได้ผล...ประมาณนั้น	หมายเหตุ
ศาสดา	นักวิเคราะห์, ฝ่ายผลิตภัณฑ์	ฟรี	ฤดูกาลและวันหยุดต่างๆ ถูกรวมไว้แล้ว ทำให้ได้ผลลัพธ์ที่รวดเร็ว	เหมาะสำหรับใช้เป็นค่าพื้นฐาน และใช้ได้ดีกับค่าผิดปกติ
สถิติโมเดล ARIMA	นักวิทยาศาสตร์ข้อมูล	ฟรี	โครงสร้างคลาสสิกที่แข็งแกร่ง - สามารถตีความได้	ต้องระมัดระวังเรื่องความนิ่งของแท่นวาง
การพยากรณ์ AI ของ Google Vertex	ทีมงานในระดับขนาดใหญ่	ระดับการชำระเงิน	AutoML + เครื่องมือสำหรับฟีเจอร์ + ฮุกสำหรับการปรับใช้	สะดวกมากหากคุณใช้งาน GCP อยู่แล้ว เอกสารประกอบละเอียดครบถ้วน
พยากรณ์อากาศของ Amazon	ทีมงานด้านข้อมูล/แมชชีนเลิร์นนิงบน AWS	ระดับการชำระเงิน	การทดสอบย้อนหลัง, ตัวชี้วัดความแม่นยำ, จุดเชื่อมต่อที่ปรับขนาดได้	เมตริกต่างๆ เช่น MAPE, WAPE, MASE พร้อมใช้งาน [3]
กลูออนทีเอส	นักวิจัย, วิศวกร ML	ฟรี	สถาปัตยกรรมเชิงลึกมากมาย ขยายได้	ยิ่งเขียนโค้ดมาก ยิ่งควบคุมได้มากขึ้น
แคทส์	นักทดลอง	ฟรี	ชุดเครื่องมือของ Meta - ตัวตรวจจับ ตัวพยากรณ์ และเครื่องมือวินิจฉัย	ให้ความรู้สึกเหมือนเป็นทหารสวิส บางครั้งก็ช่างพูด
วงโคจร	ผู้เชี่ยวชาญด้านการพยากรณ์	ฟรี	แบบจำลองเบย์เซียน ช่วงความเชื่อมั่น	เหมาะมากถ้าคุณชอบไพรเออร์ส
การพยากรณ์ด้วย PyTorch	ผู้เรียนรู้เชิงลึก	ฟรี	สูตรอาหาร DL สมัยใหม่ เหมาะสำหรับหลายซีรีส์	นำการ์ดจอและของว่างมาด้วย

ใช่แล้ว การใช้ถ้อยคำไม่สม่ำเสมอ นั่นเป็นเรื่องจริงในชีวิต

การออกแบบฟีเจอร์ที่สร้างความเปลี่ยนแปลงอย่างแท้จริง 🧩

คำตอบที่ง่ายที่สุดและมีประโยชน์ที่สุดสำหรับคำถามที่ว่า AI ทำนายแนวโน้มได้อย่างไร คือ เราแปลงอนุกรมข้อมูลให้เป็นตารางการเรียนรู้แบบมีผู้กำกับดูแลซึ่งจดจำช่วงเวลาได้ ขั้นตอนพื้นฐานที่ควรทำตามมีดังนี้:

ค่าความหน่วงและช่วงเวลา: รวมถึง y[t-1], y[t-7], y[t-28] รวมถึงค่าเฉลี่ยเคลื่อนที่และค่าเบี่ยงเบนมาตรฐาน มันจับภาพโมเมนตัมและความเฉื่อย
สัญญาณแสดงฤดูกาล: เดือน สัปดาห์ วันในสัปดาห์ ชั่วโมงในแต่ละวัน เทอมฟูริเยร์ให้เส้นโค้งตามฤดูกาลที่เรียบเนียน
ปฏิทินและกิจกรรม: วันหยุด, การเปิดตัวผลิตภัณฑ์, การเปลี่ยนแปลงราคา, โปรโมชั่น เอฟเฟกต์วันหยุดสไตล์ Prophet เป็นเพียงฟีเจอร์ที่มีการตั้งค่าล่วงหน้า
การแยกส่วน: ลบส่วนประกอบตามฤดูกาลออกและสร้างแบบจำลองส่วนที่เหลือเมื่อรูปแบบมีความชัดเจน X-13 เป็นฐานที่ได้รับการทดสอบอย่างดีสำหรับสิ่งนี้ [1]
ตัวแปรอิสระภายนอก: สภาพอากาศ ดัชนีเศรษฐกิจมหภาค จำนวนการเข้าชมหน้าเว็บ ความสนใจในการค้นหา
คำแนะนำในการโต้ตอบ: ใช้การจับคู่แบบง่ายๆ เช่น ธงโปรโมชั่น × วันในสัปดาห์ วิธีนี้อาจดูยุ่งยาก แต่ก็มักได้ผล

หากคุณมีสินค้าหลายชุดที่เกี่ยวข้องกัน เช่น สินค้าหลายพันรายการ คุณสามารถรวบรวมข้อมูลจากสินค้าเหล่านั้นได้โดยใช้โมเดลแบบลำดับชั้นหรือแบบทั่วโลก ในทางปฏิบัติ โมเดลแบบเพิ่มประสิทธิภาพด้วยการไล่ระดับความชันแบบทั่วโลกที่มีคุณสมบัติที่คำนึงถึงเวลา มักให้ผลลัพธ์ที่ดีเกินกว่าที่คาดไว้

การเลือกครอบครัวต้นแบบ: การทะเลาะเบาะแว้งแบบเป็นกันเอง 🤼♀️

ARIMA/ETS
: ตีความได้ง่าย รวดเร็ว สร้างพื้นฐานที่มั่นคง ข้อเสีย: การปรับแต่งต่ออนุกรมข้อมูลอาจยุ่งยากเมื่อใช้งานในขนาดใหญ่ การหาค่าสหสัมพันธ์บางส่วนสามารถช่วยเปิดเผยลำดับได้ แต่ก็อย่าคาดหวังปาฏิหาริย์
Gradient boosting
: จัดการกับข้อมูลในรูปแบบตารางได้ดี ทนทานต่อสัญญาณผสม ทำงานได้ดีกับอนุกรมข้อมูลที่มีความสัมพันธ์กันหลายชุด ข้อเสีย: คุณต้องออกแบบคุณสมบัติของเวลาให้ดีและต้องคำนึงถึงความสัมพันธ์เชิงสาเหตุด้วย
การเรียนรู้เชิงลึก
: สามารถจับความไม่เป็นเชิงเส้นและรูปแบบข้ามอนุกรมได้ ข้อเสีย: ต้องการข้อมูลจำนวนมาก แก้ไขข้อผิดพลาดได้ยากกว่า เมื่อมีบริบทที่สมบูรณ์หรือประวัติข้อมูลที่ยาวนาน การเรียนรู้เชิงลึกจะแสดงประสิทธิภาพได้อย่างยอดเยี่ยม แต่ถ้าไม่มีบริบทที่สมบูรณ์หรือประวัติข้อมูลที่ยาวนาน ก็เหมือนรถสปอร์ตที่วิ่งฝ่าการจราจรติดขัดในชั่วโมงเร่งด่วน
โมเดลไฮบริดและโมเดลแบบผสมผสาน
เอาตรงๆ นะ การใช้โมเดลพื้นฐานตามฤดูกาลร่วมกับตัวเร่งการไล่ระดับสี และการผสมผสานกับ LSTM ที่มีน้ำหนักเบา เป็นความสุขเล็กๆ น้อยๆ ที่หลายคนแอบทำ ผมเองก็เคยเปลี่ยนใจจาก "การใช้โมเดลเดี่ยวอย่างเดียว" มาหลายครั้งแล้วเหมือนกัน

ความสัมพันธ์เชิงสาเหตุกับความสัมพันธ์เชิงสหสัมพันธ์: โปรดใช้ความระมัดระวัง 🧭

เพียงเพราะเส้นสองเส้นขยับเข้าหากันไม่ได้หมายความว่าเส้นหนึ่งจะขับเคลื่อนอีกเส้นหนึ่ง ความเป็นเหตุเป็นผลของ Granger จะทดสอบว่าการเพิ่มตัวขับเคลื่อนที่เป็นไปได้จะช่วยปรับปรุงการทำนายสำหรับเป้าหมายหรือไม่ โดยพิจารณาจากประวัติของตัวขับเคลื่อนเอง เป็นการพูดถึงประโยชน์ในการทำนายภายใต้สมมติฐานการถดถอยอัตโนมัติเชิงเส้น ไม่ใช่ความเป็นเหตุเป็นผลเชิงปรัชญา ซึ่งเป็นความแตกต่างที่ละเอียดอ่อนแต่สำคัญ [4]

ในการใช้งานจริง คุณยังคงต้องตรวจสอบความถูกต้องด้วยความรู้เฉพาะด้าน ตัวอย่างเช่น ผลกระทบจากวันในสัปดาห์มีความสำคัญสำหรับธุรกิจค้าปลีก แต่การเพิ่มจำนวนคลิกโฆษณาของสัปดาห์ที่แล้วอาจซ้ำซ้อนหากค่าใช้จ่ายรวมอยู่ในแบบจำลองแล้ว

การทดสอบย้อนหลังและตัวชี้วัด: จุดที่มักเกิดข้อผิดพลาดมากที่สุด 🔍

เพื่อประเมินว่า AI สามารถทำนายแนวโน้มได้อย่างสมจริงเพียงใด ให้ลองจำลองสถานการณ์การพยากรณ์ในสภาพแวดล้อมจริง:

การตรวจสอบความถูกต้องแบบครอสส์วาลิเดชันแบบโรลลิ่งออริจินัล: ฝึกฝนซ้ำๆ บนข้อมูลก่อนหน้าและทำนายกลุ่มข้อมูลถัดไป วิธีนี้เคารพลำดับเวลาและป้องกันการรั่วไหลในอนาคต [2]
ตัวชี้วัดข้อผิดพลาด: เลือกสิ่งที่เหมาะสมกับการตัดสินใจของคุณ ตัวชี้วัดเปอร์เซ็นต์เช่น MAPE เป็นที่นิยม แต่ตัวชี้วัดแบบถ่วงน้ำหนัก (WAPE) หรือตัวชี้วัดแบบไร้มาตราส่วน (MASE) มักจะมีประสิทธิภาพดีกว่าสำหรับพอร์ตโฟลิโอและผลรวม [3]
ช่วงการคาดการณ์: อย่าให้แค่ตัวเลขจุดเดียว สื่อสารความไม่แน่นอนด้วย ผู้บริหารมักไม่ชอบช่วงตัวเลข แต่พวกเขาชอบความประหลาดใจที่น้อยลง

ข้อควรระวังเล็กน้อย: เมื่อค่าบางอย่างเป็นศูนย์ ตัวชี้วัดเปอร์เซ็นต์จะผิดเพี้ยนไป ควรใช้ค่าความคลาดเคลื่อนสัมบูรณ์หรือค่าที่ปรับขนาดแล้ว หรือเพิ่มค่าชดเชยเล็กน้อยเข้าไปก็ได้ ขอแค่ใช้ค่าที่สอดคล้องกันก็พอ

การเปลี่ยนแปลงเกิดขึ้นได้: การตรวจจับและปรับตัวให้เข้ากับการเปลี่ยนแปลง 🌊

ตลาดเปลี่ยนแปลง ความชอบเปลี่ยนแปลง เซ็นเซอร์เสื่อมสภาพ การเปลี่ยนแปลงแนวคิด เป็นคำที่ใช้เรียกโดยรวมเมื่อความสัมพันธ์ระหว่างอินพุตและเป้าหมายมีการเปลี่ยนแปลง คุณสามารถตรวจสอบการเปลี่ยนแปลงได้ด้วยการทดสอบทางสถิติ ข้อผิดพลาดแบบหน้าต่างเลื่อน หรือการตรวจสอบการกระจายข้อมูล จากนั้นเลือกกลยุทธ์: หน้าต่างการฝึกอบรมที่สั้นลง การฝึกอบรมซ้ำเป็นระยะ หรือโมเดลปรับตัวที่อัปเดตแบบออนไลน์ การสำรวจภาคสนามแสดงให้เห็นถึงประเภทของการเปลี่ยนแปลงและนโยบายการปรับตัวหลายประเภท ไม่มีนโยบายใดนโยบายเดียวที่เหมาะสมกับทุกกรณี [5]

คู่มือปฏิบัติจริง: ตั้งค่าเกณฑ์การแจ้งเตือนเมื่อเกิดข้อผิดพลาดในการพยากรณ์แบบเรียลไทม์ ฝึกฝนระบบใหม่ตามกำหนดเวลา และเตรียมฐานข้อมูลสำรองไว้เสมอ อาจไม่ดูหรูหรา แต่ได้ผลดีมาก

ความสามารถในการอธิบาย: การเปิดกล่องดำโดยไม่ทำให้กล่องเสียหาย 🔦

ผู้มีส่วนได้ส่วนเสียถามว่าทำไมการคาดการณ์ถึงสูงขึ้น ซึ่งก็สมเหตุสมผล เครื่องมือที่ไม่ขึ้นกับแบบจำลอง เช่น SHAP จะระบุสาเหตุของการคาดการณ์ตามคุณลักษณะต่างๆ ในลักษณะที่มีพื้นฐานทางทฤษฎี ช่วยให้คุณเห็นว่าฤดูกาล ราคา หรือสถานะโปรโมชั่นส่งผลต่อตัวเลขหรือไม่ มันไม่ได้พิสูจน์ความสัมพันธ์เชิงสาเหตุ แต่ช่วยเพิ่มความน่าเชื่อถือและช่วยในการแก้ไขข้อผิดพลาดได้

จากการทดสอบของผมเอง พบว่าปัจจัยตามฤดูกาลรายสัปดาห์และสัญญาณโปรโมชั่นมักจะมีอิทธิพลต่อการคาดการณ์ยอดขายปลีกในระยะสั้น ในขณะที่การคาดการณ์ในระยะยาวจะหันไปใช้ตัวชี้วัดระดับมหภาคมากกว่า ผลลัพธ์ที่ได้อาจแตกต่างกันไปในแต่ละบุคคล (แต่ก็ถือว่าน่าพอใจ)

Cloud & MLOps: พยากรณ์สภาพอากาศได้โดยไม่ต้องใช้เทปกาว 🚚

หากคุณต้องการใช้แพลตฟอร์มที่มีการจัดการ:

Google Vertex AI Forecast นำเสนอขั้นตอนการทำงานแบบมีคำแนะนำสำหรับการนำเข้าข้อมูลอนุกรมเวลา การเรียกใช้การพยากรณ์อัตโนมัติด้วย AutoML การทดสอบย้อนหลัง และการปรับใช้เอนด์พอยต์ นอกจากนี้ยังทำงานได้ดีกับระบบจัดการข้อมูลสมัยใหม่ด้วย
Amazon Forecast มุ่งเน้นไปที่การใช้งานในวงกว้าง โดยมีการทดสอบย้อนหลังที่เป็นมาตรฐานและเมตริกความแม่นยำที่คุณสามารถดึงผ่าน API ซึ่งช่วยในการกำกับดูแลและแดชบอร์ด [3]

ไม่ว่าจะเลือกวิธีไหนก็ช่วยลดโค้ดซ้ำซ้อนได้ แค่คอยดูทั้งต้นทุนและที่มาของข้อมูล ต้องคอยดูทั้งสองอย่างพร้อมกัน – ยากแต่ทำได้

ตัวอย่างการวิเคราะห์แบบย่อ: จากจำนวนคลิกดิบสู่สัญญาณแนวโน้ม 🧭✨

ลองนึกภาพว่าคุณกำลังคาดการณ์จำนวนผู้สมัครใช้งานแอปแบบฟรีเมียมรายวัน:

ข้อมูล: ดึงข้อมูลการสมัครสมาชิกรายวัน ค่าใช้จ่ายในการโฆษณาแยกตามช่องทาง การขัดข้องของเว็บไซต์ และปฏิทินโปรโมชั่นแบบง่ายๆ
คุณสมบัติ: ความล่าช้า 1, 7, 14; ค่าเฉลี่ยเคลื่อนที่ 7 วัน; แฟล็กวันในสัปดาห์; แฟล็กโปรโมชั่นไบนารี; เทอมตามฤดูกาลฟูริเยร์; และส่วนที่เหลือตามฤดูกาลที่แยกส่วนเพื่อให้โมเดลเน้นส่วนที่ไม่ซ้ำกัน การแยกส่วนตามฤดูกาลเป็นการเคลื่อนไหวแบบคลาสสิกในงานสถิติอย่างเป็นทางการ - ชื่อน่าเบื่อ แต่ได้ผลตอบแทนมหาศาล [1]
โมเดล: เริ่มต้นด้วยตัวถดถอยแบบเพิ่มประสิทธิภาพด้วยการไล่ระดับ (gradient-boosted regressor) เป็นโมเดลระดับโลกครอบคลุมทุกพื้นที่ทางภูมิศาสตร์
การทดสอบย้อนหลัง: จุดเริ่มต้นแบบหมุนเวียนพร้อมการพับรายสัปดาห์ ปรับ WAPE ให้เหมาะสมกับกลุ่มธุรกิจหลักของคุณ การทดสอบย้อนหลังที่คำนึงถึงเวลาเป็นสิ่งที่ไม่สามารถต่อรองได้เพื่อให้ได้ผลลัพธ์ที่น่าเชื่อถือ [2]
อธิบาย: ตรวจสอบการระบุแหล่งที่มาของฟีเจอร์ทุกสัปดาห์ เพื่อดูว่าธงโปรโมชั่นนั้นมีประโยชน์อะไรบ้าง นอกเหนือจากการทำให้ดูสวยงามในสไลด์
ตรวจสอบ: หากผลกระทบของโปรโมชั่นลดลงหรือรูปแบบวันธรรมดาเปลี่ยนไปหลังจากเปลี่ยนผลิตภัณฑ์ ให้เริ่มการฝึกอบรมใหม่ การเบี่ยงเบนไม่ใช่ข้อผิดพลาด - มันเป็นวันพุธ [5]

ผลลัพธ์ที่ได้: การคาดการณ์ที่น่าเชื่อถือพร้อมช่วงความเชื่อมั่น และแดชบอร์ดที่แสดงให้เห็นถึงปัจจัยที่ส่งผลต่อการเปลี่ยนแปลง ลดการถกเถียง เพิ่มการลงมือทำ

กับดักและเรื่องเข้าใจผิดที่ควรหลีกเลี่ยงอย่างเงียบๆ 🚧

ความเชื่อผิดๆ: ฟีเจอร์ยิ่งมากยิ่งดี ไม่ใช่เลย ฟีเจอร์ที่ไม่จำเป็นมากเกินไปจะทำให้เกิดการโอเวอร์ฟิตติ้ง ควรเก็บเฉพาะฟีเจอร์ที่ช่วยในการทดสอบย้อนหลังและสอดคล้องกับบริบทของโดเมนเท่านั้น
ความเชื่อผิดๆ: โครงข่ายประสาทเทียมแบบลึกเอาชนะทุกอย่างได้ บางครั้งก็ใช่ แต่ส่วนใหญ่ไม่ใช่ หากข้อมูลมีน้อยหรือมีสัญญาณรบกวน วิธีการแบบดั้งเดิมจะเหนือกว่าในด้านความเสถียรและความโปร่งใส
ข้อผิดพลาด: การรั่วไหล การปล่อยให้ข้อมูลของวันพรุ่งนี้เข้าสู่การฝึกอบรมในวันนี้โดยไม่ได้ตั้งใจจะทำให้ตัวชี้วัดของคุณดูดีเกินจริงและส่งผลเสียต่อผลผลิตของคุณ [2]
ข้อผิดพลาด: การยึดติดกับทศนิยมสุดท้าย หากห่วงโซ่อุปทานของคุณมีความซับซ้อน การถกเถียงระหว่างความคลาดเคลื่อน 7.3 และ 7.4 เปอร์เซ็นต์นั้นไร้สาระ ควรเน้นที่เกณฑ์การตัดสินใจมากกว่า
ความเชื่อผิดๆ: ความเป็นเหตุเป็นผลจากความสัมพันธ์ การทดสอบ Granger ตรวจสอบประโยชน์ในการทำนาย ไม่ใช่ความจริงเชิงปรัชญา ใช้เป็นแนวทาง ไม่ใช่หลักคำสอน [4]

รายการตรวจสอบการดำเนินการที่คุณสามารถคัดลอกและวางได้ 📋

กำหนดขอบเขตเวลา ระดับการรวมข้อมูล และการตัดสินใจที่คุณจะขับเคลื่อน
สร้างดัชนีเวลาที่สะอาด เติมหรือทำเครื่องหมายช่องว่าง และจัดเรียงข้อมูลภายนอกให้ตรงกัน
ความหน่วงในการสร้างไอเทม สถิติที่เปลี่ยนแปลงตลอดเวลา ธงประจำฤดูกาล และฟีเจอร์โดเมนบางอย่างที่คุณไว้วางใจ
เริ่มต้นด้วยพื้นฐานที่แข็งแกร่ง จากนั้นค่อยปรับปรุงไปสู่โมเดลที่ซับซ้อนขึ้นหากจำเป็น
ใช้การทดสอบย้อนหลังแบบ rolling-origin กับเมตริกที่ตรงกับธุรกิจของคุณ [2][3]
เพิ่มช่วงเวลาการคาดการณ์ - ไม่สามารถละเว้นได้
เรือ ตรวจสอบการลอยตัว และฝึกใหม่ตามกำหนดเวลาและตามการแจ้งเตือน [5]

ยาวเกินไป ฉันอ่านไม่จบ - ข้อคิดเห็นสุดท้าย 💬

ความจริงง่ายๆ เกี่ยวกับวิธีการที่ AI ทำนายแนวโน้มคือ มันไม่ได้เกี่ยวกับอัลกอริทึมมหัศจรรย์มากนัก แต่เป็นเรื่องของการออกแบบที่มีระเบียบวินัยและคำนึงถึงเวลา ต้องได้ข้อมูลและคุณสมบัติที่ถูกต้อง ประเมินอย่างตรงไปตรงมา อธิบายอย่างง่ายๆ และปรับตัวตามการเปลี่ยนแปลงของความเป็นจริง มันเหมือนกับการปรับคลื่นวิทยุที่มีปุ่มหมุนที่เลอะเล็กน้อย – อาจจะยุ่งยากเล็กน้อย บางครั้งก็มีเสียงรบกวน แต่เมื่อรับสัญญาณได้แล้ว เสียงก็จะชัดเจนอย่างน่าประหลาดใจ

ถ้าคุณจะจำอะไรสักอย่างไว้ก็คือ จงเคารพเวลา ตรวจสอบอย่างมีวิจารณญาณ และคอยติดตามอย่างต่อเนื่อง ส่วนที่เหลือก็เป็นเพียงเรื่องของเครื่องมือและรสนิยมเท่านั้น

เอกสารอ้างอิง

สำนักงานสำมะโนประชากรแห่งสหรัฐอเมริกา - โครงการปรับฤดูกาล X-13ARIMA- SEATS ลิงก์
Hyndman & Athanasopoulos - การพยากรณ์: หลักการและการปฏิบัติ (FPP3), §5.10 การตรวจสอบความถูกต้องแบบไขว้ของอนุกรม เวลา ลิงก์
Amazon Web Services - การประเมินความแม่นยำของตัวพยากรณ์ (Amazon Forecast). ลิงก์
มหาวิทยาลัยฮูสตัน - ความสัมพันธ์เชิงสาเหตุแบบแกรนเจอร์ (บันทึกการบรรยาย). ลิงก์
Gama et al. - การสำรวจเกี่ยวกับการปรับตัวต่อการเปลี่ยนแปลงแนวคิด (ฉบับเปิด) ลิงก์

ค้นหา AI รุ่นล่าสุดได้ที่ร้านค้าผู้ช่วย AI อย่างเป็นทางการ

เกี่ยวกับเรา

กลับไปที่บล็อก