วิศวกร AI ทำอะไรบ้าง?

เคยสงสัยไหมว่าอะไรซ่อนอยู่เบื้องหลังคำว่า “วิศวกร AI” ที่ดูทันสมัย? ผมเองก็สงสัยเหมือนกัน ภายนอกฟังดูดี แต่ในความเป็นจริงแล้วมันคือการผสมผสานระหว่างงานออกแบบ การจัดการกับข้อมูลที่ยุ่งเหยิง การเชื่อมต่อระบบเข้าด้วยกัน และการตรวจสอบอย่างละเอียดถี่ถ้วนว่าทุกอย่างทำงานได้ตามที่ควรจะเป็นหรือไม่ ถ้าจะสรุปแบบสั้นๆ ก็คือ พวกเขาเปลี่ยนปัญหาที่คลุมเครือให้กลายเป็นระบบ AI ที่ใช้งานได้จริงและไม่ล่มสลายเมื่อผู้ใช้งานจริงเข้ามาใช้งาน ส่วนรายละเอียดที่ยาวกว่าและซับซ้อนกว่านั้น...ก็อยู่ด้านล่างแล้วครับ เตรียมกาแฟไว้ด้วยนะครับ ☕

บทความที่คุณอาจสนใจอ่านต่อหลังจากบทความนี้:

🔗 เครื่องมือ AI สำหรับวิศวกร: เพิ่มประสิทธิภาพและนวัตกรรม
ค้นพบเครื่องมือ AI อันทรงพลังที่จะช่วยเพิ่มผลผลิตและความคิดสร้างสรรค์ด้านวิศวกรรม.

🔗 วิศวกรซอฟต์แวร์จะถูกแทนที่ด้วย AI หรือไม่?
สำรวจอนาคตของวิศวกรรมซอฟต์แวร์ในยุคแห่งระบบอัตโนมัติ.

🔗 การประยุกต์ใช้ปัญญาประดิษฐ์ในงานวิศวกรรมกำลังพลิกโฉมอุตสาหกรรม
เรียนรู้ว่า AI กำลังเปลี่ยนแปลงกระบวนการทางอุตสาหกรรมและขับเคลื่อนนวัตกรรมอย่างไร.

🔗 วิธีการเป็นวิศวกร AI
คู่มือทีละขั้นตอนเพื่อเริ่มต้นเส้นทางสู่การเป็นวิศวกรด้านปัญญาประดิษฐ์.

สรุปสั้นๆ: วิศวกร AI ทำงานอะไร บ้าง 💡

ในระดับพื้นฐานที่สุด วิศวกร AI จะออกแบบ สร้าง จัดส่ง และบำรุงรักษาระบบ AI โดยงานประจำวันมักเกี่ยวข้องกับ:

แปลงความต้องการด้านผลิตภัณฑ์หรือธุรกิจที่ไม่ชัดเจนให้เป็นสิ่งที่โมเดลสามารถจัดการได้จริง.
การรวบรวม การติดฉลาก การทำความสะอาด และการตรวจสอบข้อมูลซ้ำอีกครั้งอย่างหลีกเลี่ยงไม่ได้ เมื่อข้อมูลเริ่มคลาดเคลื่อน.
การเลือกและฝึกฝนโมเดล การประเมินผลด้วยตัวชี้วัดที่เหมาะสม และการจดบันทึกจุดที่โมเดลจะล้มเหลว.
ห่อหุ้มกระบวนการทั้งหมดไว้ในไปป์ไลน์ MLOps เพื่อให้สามารถทดสอบ ปรับใช้ และตรวจสอบได้.
การสังเกตการณ์ในสถานการณ์จริง: ความแม่นยำ ความปลอดภัย ความยุติธรรม… และการปรับตัวก่อนที่มันจะผิดพลาด.

ถ้าคุณคิดว่า “มันก็คือวิศวกรรมซอฟต์แวร์ บวกกับวิทยาศาสตร์ข้อมูล และความคิดเชิงผลิตภัณฑ์นิดหน่อย” - ใช่แล้ว มันก็ประมาณนั้นแหละ.

อะไรคือสิ่งที่แยก วิศวกร AI ที่เก่ง ออกจากคนอื่นๆ ✅

คุณอาจรู้จักงานวิจัยด้านสถาปัตยกรรมทุกฉบับที่ตีพิมพ์ตั้งแต่ปี 2017 เป็นต้นมา แต่สิ่งก่อสร้างของคุณก็ยังคงเปราะบางและไม่แข็งแรงอยู่ดี คนที่ประสบความสำเร็จในบทบาทนี้มักจะเป็น:

คิดแบบเป็นระบบ พวกเขามองเห็นภาพรวมทั้งหมด: ข้อมูลเข้า การตัดสินใจออก ทุกอย่างตรวจสอบได้
อย่าไล่ตามเวทมนตร์ก่อน เริ่ม จากพื้นฐานและการตรวจสอบง่ายๆ ก่อนที่จะเพิ่มความซับซ้อน
ใส่ฟีดแบ็กเข้าไปในการออกแบบ การฝึกอบรมใหม่และการย้อนกลับไม่ใช่ส่วนเสริม แต่เป็นส่วนหนึ่งของการออกแบบ
จดบันทึกทุกอย่างไว้ ข้อแลกเปลี่ยน ข้อสมมติฐาน ข้อจำกัดต่างๆ - อาจดูน่าเบื่อ แต่จะมีค่าในภายหลัง
ควรให้ความสำคัญกับ AI ที่มีความรับผิดชอบ ความเสี่ยงจะไม่หายไปเพราะมองโลกในแง่ดี แต่จะถูกบันทึกและจัดการ

เรื่องสั้น: ทีมสนับสนุนทีมหนึ่งเริ่มต้นด้วยระบบพื้นฐานที่ใช้กฎและการดึงข้อมูลแบบง่ายๆ ซึ่งทำให้พวกเขามีการทดสอบการยอมรับที่ชัดเจน ดังนั้นเมื่อพวกเขาเปลี่ยนมาใช้โมเดลขนาดใหญ่ในภายหลัง พวกเขาก็สามารถเปรียบเทียบได้อย่างชัดเจน และมีวิธีแก้ไขที่ง่ายเมื่อเกิดปัญหาขึ้น

วงจรชีวิต: ความเป็นจริงที่ยุ่งเหยิงเทียบกับแผนภาพที่เรียบร้อย 🔁

กำหนดปัญหาให้ชัดเจน กำหนดเป้าหมาย งานที่ต้องทำ และความหมายของคำว่า "ดีพอ"
จัดการข้อมูลอย่างละเอียด ทำความสะอาด ติดป้ายกำกับ แยกประเภท กำหนดเวอร์ชัน ตรวจสอบความถูกต้องอย่างไม่หยุดยั้งเพื่อจับความคลาดเคลื่อนของโครงสร้างข้อมูล
การทดลองแบบจำลอง เริ่มต้นด้วยสิ่งง่ายๆ ทดสอบค่าพื้นฐาน ทำซ้ำ และบันทึกผล
ส่งออกไปเลย ไปป์ไลน์ CI/CD/CT, การปรับใช้ที่ปลอดภัย, การทดสอบแบบ Canary, การย้อนกลับ
คอยเฝ้าดู ตรวจสอบความถูกต้อง ความหน่วง การเบี่ยงเบน ความเป็นธรรม และผลลัพธ์ของผู้ใช้ จากนั้นจึงทำการฝึกอบรมใหม่

บนสไลด์มันดูเหมือนวงกลมที่เรียบร้อย แต่ในทางปฏิบัติมันเหมือนกับการโยนเส้นสปาเก็ตตี้ด้วยไม้กวาดมากกว่า.

AI ที่มีความรับผิดชอบเมื่อถึงเวลาใช้งานจริง 🧭

มันไม่ใช่เรื่องของสไลด์นำเสนอที่สวยงาม วิศวกรอาศัยกรอบการทำงานเพื่อทำให้ความเสี่ยงเป็นเรื่องจริง:

NIST AI RMF ให้โครงสร้างสำหรับการระบุ การวัด และการจัดการความเสี่ยงตั้งแต่การออกแบบจนถึงการใช้งาน [1]
หลักการของ OECD ทำ หน้าที่เหมือนเข็มทิศมากกว่า ซึ่งเป็นแนวทางกว้างๆ ที่องค์กรหลายแห่งปฏิบัติตาม [2]

หลายทีมยังสร้างรายการตรวจสอบของตนเอง (เช่น การตรวจสอบความเป็นส่วนตัว การตรวจสอบโดยมนุษย์) ที่เชื่อมโยงกับวงจรชีวิตเหล่านี้ด้วย.

เอกสารสำคัญที่ขาดไม่ได้: บัตรข้อมูลรุ่นและเอกสารข้อมูลจำเพาะ 📝

เอกสารสองชิ้นที่คุณจะขอบคุณตัวเองในภายหลัง:

การ์ดแบบจำลอง → ระบุการใช้งานที่ตั้งใจไว้ บริบทการประเมิน ข้อควรระวัง เขียนเพื่อให้บุคลากรด้านผลิตภัณฑ์/กฎหมายสามารถปฏิบัติตามได้เช่นกัน [3]
เอกสารข้อมูลสำหรับชุดข้อมูล → อธิบายว่าเหตุใดจึงมีข้อมูลอยู่ มีอะไรอยู่ในนั้น อคติที่เป็นไปได้ และการใช้งานที่ปลอดภัยและไม่ปลอดภัย [4]

ตัวคุณในอนาคต (และเพื่อนร่วมทีมในอนาคต) จะแอบปรบมือให้คุณเงียบๆ ที่คุณเขียนบทความเกี่ยวกับพวกเขา.

เจาะลึก: กระบวนการประมวลผลข้อมูล สัญญา และการกำหนดเวอร์ชัน 🧹📦

ข้อมูลมีปริมาณมากจนควบคุมยาก วิศวกร AI อัจฉริยะจะบังคับใช้ข้อตกลง ตรวจสอบความถูกต้อง และผูกเวอร์ชันเข้ากับโค้ด เพื่อให้คุณสามารถย้อนกลับไปใช้เวอร์ชันก่อนหน้าได้ในภายหลัง.

การตรวจสอบความถูกต้อง → กำหนดโครงสร้างข้อมูล ช่วงข้อมูล และความทันสมัยของข้อมูล สร้างเอกสารโดยอัตโนมัติ
การกำหนดเวอร์ชัน → จัดเรียงชุดข้อมูลและโมเดลให้สอดคล้องกับการคอมมิตของ Git เพื่อให้คุณมีบันทึกการเปลี่ยนแปลงที่เชื่อถือได้

ตัวอย่างเล็กๆ น้อยๆ: ร้านค้าปลีกแห่งหนึ่งได้แทรกการตรวจสอบ Schema เพื่อบล็อกข้อมูลจากซัพพลายเออร์ที่เต็มไปด้วยค่าว่าง กลไกตรวจสอบเพียงจุดเดียวนี้ช่วยหยุดการลดลงซ้ำๆ ของ recall@k ก่อนที่ลูกค้าจะสังเกตเห็น

เจาะลึก: การขนส่งและการขยายธุรกิจ 🚢

การทำให้โมเดลทำงานในสภาพแวดล้อมการผลิตได้นั้นไม่ใช่แค่ สั่ง model.fit()เครื่องมือที่จำเป็นประกอบด้วย:

Docker ช่วยให้การจัดแพ็กเกจเป็นไปอย่างสม่ำเสมอ
Kubernetes สำหรับการจัดการ การปรับขนาด และการเปิดตัวอย่างปลอดภัย
เฟรมเวิร์ก MLOps สำหรับการทดสอบ Canary, การแบ่งกลุ่มแบบ A/B และการตรวจจับค่าผิดปกติ

เบื้องหลังม่านนั้นคือการตรวจสอบสุขภาพ การติดตาม การจัดสรรทรัพยากร CPU และ GPU การปรับแต่งเวลาหมดอายุ ไม่ใช่เรื่องที่น่าดึงดูดใจ แต่จำเป็นอย่างยิ่ง.

เจาะลึก: ระบบ GenAI และ RAG 🧠📚

ระบบสร้างข้อมูลนำเสนออีกแง่มุมหนึ่ง นั่นคือ การเชื่อมโยงข้อมูลกับการเรียกคืน.

การฝังข้อมูลและการค้นหาเวกเตอร์ สำหรับการค้นหาความคล้ายคลึงกันอย่างรวดเร็ว
สำหรับการจัดการกระบวนการทำงาน เพื่อเชื่อมโยงการเรียกค้นข้อมูล การใช้งานเครื่องมือ และการประมวลผลภายหลัง

การเลือกวิธีการจัดกลุ่มข้อมูล การจัดอันดับใหม่ การประเมินผล – การตัดสินใจเล็กๆ น้อยๆ เหล่านี้จะเป็นตัวกำหนดว่าคุณจะได้แชทบอทที่ใช้งานยากหรือผู้ช่วยที่มีประโยชน์.

ทักษะและเครื่องมือ: จริงๆ แล้วมีอะไรอยู่ในชุดเครื่องมือนี้บ้าง 🧰

อุปกรณ์หลากหลายประเภท ทั้งอุปกรณ์แมชชีนเลิร์นนิงแบบคลาสสิกและอุปกรณ์ดีพเลิร์นนิง:

เฟรมเวิร์ก: PyTorch, TensorFlow, scikit-learn
ท่อส่งข้อมูล: การไหลของอากาศ ฯลฯ สำหรับงานที่กำหนดไว้ล่วงหน้า
การใช้งานจริง: Docker, Kubernetes, เฟรมเวิร์กสำหรับการให้บริการเซิร์ฟเวอร์
ความสามารถในการสังเกตการณ์: ตัวตรวจสอบความคลาดเคลื่อน, ตัวติดตามความหน่วง, การตรวจสอบความเป็นธรรม

ไม่มีใครใช้ ทุกอย่างหรอก เคล็ดลับอยู่ที่การมีความรู้เพียงพอตลอดวงจรชีวิตของผลิตภัณฑ์ เพื่อที่จะตัดสินใจได้อย่างมีเหตุผล

ตารางเครื่องมือ: สิ่งที่วิศวกรหยิบใช้จริง ๆ 🧪

เครื่องมือ	ผู้ชม	ราคา	เหตุผลที่มันมีประโยชน์
ไพทอร์ช	นักวิจัย วิศวกร	โอเพนซอร์ส	ยืดหยุ่น, ออกแบบตามหลัก Python, มีชุมชนขนาดใหญ่, สามารถสร้างโครงข่ายประสาทเทียมแบบกำหนดเองได้.
เทนเซอร์โฟลว์	ทีมที่เน้นผลิตภัณฑ์	โอเพนซอร์ส	ความลึกของระบบนิเวศ, TF Serving & Lite สำหรับการปรับใช้.
scikit-learn	ผู้ใช้ ML คลาสสิก	โอเพนซอร์ส	เกณฑ์พื้นฐานดีเยี่ยม API ใช้งานง่าย และมีการประมวลผลล่วงหน้าในตัว.
MLflow	ทีมที่มีการทดลองมากมาย	โอเพนซอร์ส	ช่วยจัดระเบียบการทดลอง โมเดล และสิ่งประดิษฐ์ต่างๆ.
การไหลเวียนของอากาศ	คนทำงานด้านท่อส่ง	โอเพนซอร์ส	DAGs, การจัดตารางเวลา, การตรวจสอบการทำงาน ถือว่าดีพอแล้ว.
ด็อกเกอร์	โดยพื้นฐานแล้วทุกคน	แกนอิสระ	สภาพแวดล้อมเหมือนเดิม (ส่วนใหญ่) ปัญหาทะเลาะกันเรื่อง "ใช้ได้เฉพาะกับแล็ปท็อปของฉันเท่านั้น" น้อยลง.
คูเบอร์เน็ตส์	ทีมที่มีโครงสร้างพื้นฐานขนาดใหญ่	โอเพนซอร์ส	การปรับขนาดอัตโนมัติ การเปิดตัวใช้งาน และประสิทธิภาพระดับองค์กร.
โมเดลที่ให้บริการบน K8s	ผู้ใช้โมเดล K8s	โอเพนซอร์ส	การเสิร์ฟแบบมาตรฐาน, ตะขอเกี่ยวแบบลอย, ปรับขนาดได้.
ไลบรารีการค้นหาเวกเตอร์	ผู้สร้าง RAG	โอเพนซอร์ส	เปรียบเทียบได้อย่างรวดเร็ว เหมาะกับการใช้งาน GPU.
จัดการคลังเวกเตอร์	ทีม RAG ระดับองค์กร	ระดับการชำระเงิน	การสร้างดัชนีแบบไร้เซิร์ฟเวอร์ การกรองข้อมูล และความน่าเชื่อถือในระดับขนาดใหญ่.

ใช่แล้ว การใช้ถ้อยคำดูไม่สม่ำเสมอ การเลือกใช้เครื่องมือก็มักจะเป็นแบบนั้นอยู่แล้ว.

วัดความสำเร็จโดยไม่ต้องจมอยู่กับตัวเลข 📏

ตัวชี้วัดที่สำคัญนั้นขึ้นอยู่กับบริบท แต่โดยทั่วไปแล้วจะเป็นส่วนผสมของ:

คุณภาพการทำนาย: ความแม่นยำ (precision), การเรียกคืน (recall), ค่า F1, การสอบเทียบ (calibration)
ระบบ + ผู้ใช้: ความหน่วง, p95/p99, อัตราการเพิ่มประสิทธิภาพการแปลง, อัตราความสำเร็จ
ตัวชี้วัดความยุติธรรม: ความเท่าเทียมกัน ผลกระทบที่ไม่เท่าเทียมกัน - ใช้อย่างระมัดระวัง [1][2]

ตัวชี้วัดมีไว้เพื่อแสดงให้เห็นถึงข้อแลกเปลี่ยน หากไม่มีข้อแลกเปลี่ยน ก็ควรสลับตัวชี้วัดเหล่านั้น.

รูปแบบการทำงานร่วมกัน: นี่คือกีฬาประเภททีม 🧑🤝🧑

วิศวกร AI มักจะทำงานอยู่ตรงจุดตัดระหว่าง:

ผู้เชี่ยวชาญด้านผลิตภัณฑ์และโดเมน (กำหนดความสำเร็จและขอบเขตความรับผิดชอบ)
วิศวกรข้อมูล (แหล่งข้อมูล โครงสร้างข้อมูล ข้อตกลงระดับบริการ)
ความปลอดภัย/กฎหมาย (ความเป็นส่วนตัว การปฏิบัติตามกฎหมาย)
การออกแบบ/การวิจัย (การทดสอบผู้ใช้ โดยเฉพาะสำหรับ GenAI)
ฝ่ายปฏิบัติการ/ฝ่ายความปลอดภัยระบบ (การรักษาความพร้อมใช้งานและการฝึกซ้อมรับมือเหตุฉุกเฉิน)

คาดหวังได้เลยว่าจะเห็นกระดานไวท์บอร์ดเต็มไปด้วยรอยขีดเขียน และการถกเถียงเรื่องหน่วยวัดอย่างดุเดือดเป็นครั้งคราว – นั่นเป็นเรื่องที่ดี.

กับดัก: บึงหนี้ทางเทคนิค 🧨

ระบบ ML ดึงดูดหนี้ที่ซ่อนอยู่: การกำหนดค่าที่ยุ่งเหยิง การพึ่งพาที่เปราะบาง สคริปต์การเชื่อมต่อที่ถูกลืม ผู้เชี่ยวชาญจะตั้งค่าการป้องกัน - การทดสอบข้อมูล การกำหนดค่าประเภท การย้อนกลับ - ก่อนที่ปัญหาจะลุกลาม [5]

แนวทางการรักษาสุขภาพจิต: แนวปฏิบัติที่ช่วย 📚

เริ่มจากสิ่งเล็กๆ ก่อน พิสูจน์ให้เห็นว่าระบบทำงานได้ก่อนที่จะขยายโมเดลให้ซับซ้อนขึ้น
ไปป์ไลน์ MLOps: CI สำหรับข้อมูล/โมเดล, CD สำหรับบริการ, CT สำหรับการฝึกอบรมใหม่
รายการตรวจสอบ AI ที่มีความรับผิดชอบ จัดทำแผนที่ให้เข้ากับองค์กรของคุณ พร้อมเอกสารต่างๆ เช่น Model Cards และ Datasheets [1][3][4]

ปรับปรุงคำถามที่พบบ่อย (FAQ) อย่างรวดเร็ว: ตอบเพียงประโยคเดียว 🥡

วิศวกร AI สร้างระบบแบบครบวงจรที่ใช้งานได้จริง ทดสอบได้ นำไปใช้งานได้ และมีความปลอดภัยในระดับหนึ่ง โดยระบุข้อแลกเปลี่ยนอย่างชัดเจน เพื่อไม่ให้ใครไม่รู้เรื่อง.

สรุปสั้นๆ 🎯

พวกเขานำปัญหาที่ไม่ชัดเจนมาสร้างเป็นระบบ AI ที่เชื่อถือได้ผ่านการประมวลผลข้อมูล การสร้างแบบจำลอง MLOps และการตรวจสอบ.
วิธีที่ดีที่สุดคือการเริ่มต้นด้วยสิ่งที่ง่ายที่สุด วัดผลอย่างไม่หยุดยั้ง และบันทึกข้อสมมติฐานต่างๆ.
AI ในการผลิต = กระบวนการทำงาน + หลักการ (CI/CD/CT, ความเป็นธรรมเมื่อจำเป็น, การคิดเชิงบริหารความเสี่ยง).
เครื่องมือก็เป็นเพียงเครื่องมือ ใช้ให้น้อยที่สุดเท่าที่จะพาคุณไปถึงขั้นตอนต่างๆ ได้ ตั้งแต่การฝึกรถไฟ → รางรถไฟ → การให้บริการ → การสังเกตการณ์.

ลิงก์อ้างอิง

NIST AI RMF (1.0) ลิงก์
หลักการ AI ของ OECD ลิงก์
การ์ดตัวอย่าง (มิทเชลและคณะ, 2019) ลิงก์
เอกสารข้อมูลสำหรับชุดข้อมูล (Gebru et al., 2018/2021) ลิงก์
หนี้ทางเทคนิคที่ซ่อนอยู่ (Sculley et al., 2015) ลิงก์

ค้นหา AI รุ่นล่าสุดได้ที่ร้านค้าผู้ช่วย AI อย่างเป็นทางการ

เกี่ยวกับเรา

กลับไปที่บล็อก