Scott Wu จาก Cognition กล่าวว่า AI ที่ใช้ในการเขียนโค้ดไม่ควรเข้ามาแทนที่มนุษย์ ↗
Scott Wu จาก Cognition โต้แย้งความคิดที่ว่า Devin ถูกสร้างมาเพื่อทดแทนโปรแกรมเมอร์โดยสิ้นเชิง ซึ่งเป็นท่าทีที่ค่อนข้างน่าอึดอัดใจ เนื่องจากบริษัทเองก็กล่าวว่า Devin มีส่วนร่วมในการเขียนโค้ดของตนเองเป็นจำนวนมาก.
การนำเสนอของเขาดูเหมือนจะเน้นไปที่ "เพื่อนร่วมงานเขียนโค้ด AI" มากกว่า "งานของคุณถูกปีศาจแล็ปท็อปแย่งไปแล้ว" อย่างไรก็ตาม ความตึงเครียดนั้นยากที่จะมองข้ามไปได้ นั่นคือ ตัวแทนที่ดีขึ้น ข้ออ้างน้อยลงสำหรับทีมวิศวกรรมที่ใหญ่เกินไป... หรืออย่างน้อยก็เป็นข้อโต้แย้งเช่นนั้น.
บริษัทสตาร์ทอัพด้าน AI แห่งนี้จะทำความสะอาดบ้านของคุณฟรี เพื่อฝึกฝนหุ่นยนต์รุ่นใหม่ในอนาคต ↗
Shift เสนอบริการทำความสะอาดบ้านฟรี โดยมีข้อแม้ที่ทั้งสะดวกและน่ากังวลเล็กน้อย นั่นคือ พนักงานทำความสะอาดต้องสวม "หมวกวิเศษ" ที่มีกล้องติดอยู่ เพื่อให้บริษัทสามารถรวบรวมข้อมูลสำหรับการฝึกหุ่นยนต์ได้.
ข้อเสนอเรียบง่าย – คุณจะได้ห้องพักที่สะอาด และพวกเขาจะได้วิดีโอเกี่ยวกับการทำงานบ้าน อาจเป็นข้อเสนอที่คุ้มค่าก็ได้.
Shift ระบุว่าแอปจะเบลอรายละเอียดที่ละเอียดอ่อนและปกปิดตัวตนของผู้ดูภาพ แต่คำถามที่สำคัญกว่านั้นยังคงค้างคาอยู่เหมือนถุงเท้าใต้โซฟา นั่นคือ ผู้คนยอมแลกความเป็นส่วนตัวในบ้านกับความสะดวกสบายมากแค่ไหน?
Anthropic เปิดตัว Claude Opus 4.8 ↗
Anthropic เปิดตัว Claude Opus 4.8 พร้อมการอัปเกรดในด้านการเขียนโค้ด เวิร์กโฟลว์ของเอเจนต์ การให้เหตุผล และการทำงานระดับมืออาชีพ จุดเด่นสำคัญคือความน่าเชื่อถือ – การเรียกร้องที่ไม่ได้รับการสนับสนุนลดลง การใช้งานเครื่องมือดีขึ้น และการตรวจสอบตนเองมากขึ้น.
นอกจากนี้ Claude Code ยังมีเวิร์กโฟลว์แบบไดนามิกที่ช่วยให้โมเดลวางแผน สร้างตัวแทนย่อยแบบขนาน ตรวจสอบผลลัพธ์ และรายงานผลกลับมา ฟังดูน่าเบื่อจนกว่าคุณจะรู้ว่ามันก็คือการบริหารจัดการโครงการในรูปแบบที่คล่องตัวนั่นเอง.
ราคาจะแบ่งออกเป็นโหมดมาตรฐานและโหมดเร็ว โดย Anthropic เน้นการควบคุมความพยายามมากขึ้น เพื่อให้ผู้ใช้สามารถแลกเปลี่ยนระหว่างความเร็ว คุณภาพ และการใช้โทเค็นได้.
ประธานบริษัท Foxconn กล่าวว่า บริษัทมีความมั่นใจอย่างมากในโมเมนตัมการเติบโตที่เกิดจากปัญญาประดิษฐ์ (AI) ↗
ประธานบริษัทฟ็อกซ์คอนน์กล่าวว่า ความต้องการชิ้นส่วนปัญญาประดิษฐ์ (AI) กำลังเปลี่ยนแปลงจังหวะตามฤดูกาลปกติของบริษัท ภาวะซบเซาของซัพพลายเออร์ในช่วงกลางปีแบบเดิม ๆ ดูเหมือนจะไม่เป็นไปตามปกติอีกต่อไปแล้ว.
สาเหตุมาจากบริษัทยักษ์ใหญ่ด้านคลาวด์ที่ทุ่มงบมหาศาลไปกับการพัฒนา AI ซึ่ง Foxconn มองว่าเป็นโอกาสทางการตลาดของตนเอง นี่คือด้านฮาร์ดแวร์ของกระแส AI ที่อาจดูไม่หวือหวาเท่าแชทบอท แต่เป็นส่วนที่มีเงินทุนไหลเข้ามาอย่างมหาศาล.
Foxconn เป็นผู้ผลิตเซิร์ฟเวอร์รายใหญ่ของ Nvidia อยู่แล้ว ดังนั้นการมองโลกในแง่ดีของบริษัทจึงเป็นเหมือนการตรวจสอบสถานการณ์การแข่งขันด้านโครงสร้างพื้นฐาน AI นั่นเอง.
คู่มือปฏิบัติร่วมกันสำหรับการประเมินโดยบุคคลที่สามที่น่าเชื่อถือ ↗
OpenAI ได้เผยแพร่คำแนะนำเกี่ยวกับการประเมิน AI โดยบุคคลที่สาม โดยให้เหตุผลว่าการทดสอบจำเป็นต้องมีรายละเอียดที่ชัดเจนยิ่งขึ้นเกี่ยวกับสิ่งที่ได้รับการประเมิน วิธีการทดสอบ และผลลัพธ์สามารถพิสูจน์อะไรได้บ้าง.
ประเด็นสำคัญนั้นกลับเป็นเรื่องที่นำไปใช้ได้จริงอย่างน่าประหลาดใจ: การประเมิน AI ระดับแนวหน้าไม่สามารถเป็นเพียงการคาดเดาตามอันดับในตารางคะแนนได้ ผู้ประเมินจำเป็นต้องอธิบายระบบที่ทดสอบ คำถามกระตุ้น การป้องกัน การตรวจสอบความถูกต้อง และขอบเขตของการกล่าวอ้างต่างๆ.
เรื่องนี้สำคัญ เพราะเมื่อแบบจำลองมีความซับซ้อนมากขึ้น การทดสอบแบบผิวเผินอาจทำให้ระบบดูปลอดภัยหรือแข็งแกร่งกว่าที่เป็นจริง การใช้พลังงานในการทำเอกสารเพียงเล็กน้อย อาจส่งผลกระทบใหญ่หลวงได้.
คำถามที่พบบ่อย
ปัญญาประดิษฐ์ (AI) อย่างเช่น Devin มีจุดประสงค์เพื่อทดแทนโปรแกรมเมอร์หรือไม่?
Scott Wu มองว่า AI ที่ทำหน้าที่เขียนโค้ดนั้นเป็นเหมือนหุ้นส่วนในการเขียนโค้ดมากกว่าที่จะมาทดแทนโปรแกรมเมอร์ที่เป็นมนุษย์อย่างสมบูรณ์ บทความนี้ชี้ให้เห็นถึงความขัดแย้งอยู่บ้างเช่นกัน กล่าวคือ Devin ก็มีส่วนร่วมในการเขียนโค้ดส่วนใหญ่ของ Cognition ด้วยเช่นกัน ในทางปฏิบัติแล้ว สิ่งที่ได้เรียนรู้ก็คือ เครื่องมือเหล่านี้อาจช่วยลดงานด้านวิศวกรรมบางอย่างที่เป็นงานประจำลงได้ แต่ก็ยังคงต้องพึ่งพาการตัดสินใจ การกำหนดทิศทาง และความรับผิดชอบจากมนุษย์อยู่ดี.
เหตุใด Shift จึงเสนอบริการทำความสะอาดบ้านฟรีเพื่อใช้เป็นข้อมูลฝึกฝน AI?
บริษัท Shift เสนอบริการทำความสะอาดบ้านฟรี เพราะต้องการข้อมูลวิดีโอจากโลกแห่งความเป็นจริงเกี่ยวกับการทำงานบ้าน เพื่อใช้ฝึกฝนหุ่นยนต์ในอนาคต พนักงานทำความสะอาดจะสวม "หมวกวิเศษ" ที่มีกล้องขณะทำงาน ซึ่งจะบันทึกภาพที่ช่วยให้ระบบ AI เข้าใจงานบ้านได้ดียิ่งขึ้น การแลกเปลี่ยนนั้นชัดเจน คือ ลูกค้าได้บ้านที่สะอาด ในขณะที่บริษัทได้รับข้อมูลจากพื้นที่อยู่อาศัยส่วนตัว.
Shift จัดการเรื่องความเป็นส่วนตัวอย่างไรเมื่อบันทึกภาพการทำความสะอาดบ้าน?
บทความระบุว่า Shift อ้างว่าแอปพลิเคชันของพวกเขามีการเบลอรายละเอียดที่ละเอียดอ่อนและทำให้ภาพวิดีโอเป็นนิรนาม ซึ่งอาจช่วยลดความเสี่ยงด้านความเป็นส่วนตัวได้บ้าง แต่ก็ไม่ได้ขจัดความกังวลในวงกว้างเกี่ยวกับการบันทึกภาพภายในบ้านของผู้คน สำหรับผู้ใช้แล้ว คำถามสำคัญคือ ความสะดวกสบายของการทำความสะอาดฟรีนั้นคุ้มค่ากับการเก็บรวบรวมข้อมูลในระดับนั้นหรือไม่.
มีอะไรใหม่ใน Claude Opus 4.8 บ้าง?
Claude Opus 4.8 ได้รับการอธิบายว่าเป็นการปรับปรุงการเขียนโค้ด เวิร์กโฟลว์ของเอเจนต์ การให้เหตุผล และการทำงานอย่างมืออาชีพ การอัปเดตนี้เน้นที่ความน่าเชื่อถือ รวมถึงการลดจำนวนการอ้างสิทธิ์ที่ไม่ได้รับการสนับสนุน การใช้งานเครื่องมือที่แข็งแกร่งขึ้น และการตรวจสอบตนเองที่มากขึ้น นอกจากนี้ Claude Code ยังได้รับเวิร์กโฟลว์แบบไดนามิก ซึ่งโมเดลสามารถวางแผน เรียกใช้ตัวแทนย่อยแบบขนาน ตรวจสอบเอาต์พุต และรายงานผลลัพธ์ได้.
เหตุใดการมองโลกในแง่ดีของ Foxconn เกี่ยวกับการเติบโตของ AI จึงมีความสำคัญ?
ความมั่นใจของ Foxconn มีความสำคัญ เพราะสะท้อนให้เห็นถึงด้านฮาร์ดแวร์ของกระแสความบูมด้าน AI ประธานบริษัทกล่าวว่า ความต้องการ AI กำลังเปลี่ยนแปลงรูปแบบตามฤดูกาลปกติ โดยการใช้จ่ายด้านโครงสร้างพื้นฐานของบริษัทยักษ์ใหญ่ด้านคลาวด์กำลังสร้างโอกาสทางการตลาดที่สำคัญ เนื่องจาก Foxconn เป็นผู้ผลิตเซิร์ฟเวอร์ Nvidia รายใหญ่ ความเห็นของบริษัทจึงเป็นสัญญาณที่ชัดเจนถึงความต้องการโครงสร้างพื้นฐานด้าน AI.
OpenAI กล่าวว่าอะไรทำให้การประเมิน AI จากบุคคลที่สามน่าเชื่อถือ?
OpenAI โต้แย้งว่า การประเมิน AI จำเป็นต้องมีคำอธิบายที่ชัดเจนยิ่งขึ้นเกี่ยวกับระบบที่ได้รับการทดสอบ วิธีการทดสอบ และผลลัพธ์ที่แสดงให้เห็นอย่างแท้จริง ซึ่งรวมถึงรายละเอียดเกี่ยวกับคำสั่งกระตุ้น การป้องกัน การตรวจสอบความถูกต้อง และข้อจำกัดของข้อกล่าวอ้างใดๆ ประเด็นนี้มีความสำคัญอย่างยิ่งสำหรับแบบจำลองที่มีลักษณะเป็นเอเจนต์มากขึ้น ซึ่งการทดสอบที่ไม่ละเอียดอาจทำให้ระบบดูปลอดภัยหรือมีความสามารถมากกว่าที่เป็นจริง.