โอเพนเอไอ (OpenAI) ประกาศเปิดตัว Agent mode สำหรับ ChatGPT เมื่อวันพฤหัสบดี (17 ก.ค.) ซึ่งเป็นการยกระดับความสามารถของแชตบอตให้สามารถ "คิด" และ "ลงมือทำ" แทนผู้ใช้งานได้ นับเป็นความก้าวหน้าครั้งสำคัญในวงการปัญญาประดิษฐ์ (AI) ในขณะที่บรรดาบริษัทเทคโนโลยียักษ์ใหญ่ต่างกำลังมุ่งพัฒนา AI agent ให้สามารถจัดการงานต่าง ๆ ได้อย่างครบวงจร โดยที่วันหนึ่งผู้ใช้อาจไม่ต้องสลับแอปพลิเคชันเพื่อทำงานหรือค้นหาข้อมูลด้วยตนเองอีกต่อไป
- ความสามารถและตัวอย่างการใช้งาน
ฟีเจอร์ใหม่นี้เป็นการผสานรวมความสามารถของเครื่องมือที่มีอยู่เดิมอย่าง Operator ซึ่งใช้สำหรับท่องเว็บ และ Deep Research ที่สามารถวิเคราะห์ข้อมูลออนไลน์ ทำให้ ChatGPT สามารถจัดการกับคำสั่งที่ซับซ้อนและลงมือทำได้ ตัวอย่างเช่น "ตรวจสอบปฏิทินและสรุปการประชุมลูกค้าจากข่าวล่าสุด" หรือ "วางแผนและซื้อส่วนผสมสำหรับทำอาหารเช้าแบบญี่ปุ่นสำหรับสี่คน"
ChatGPT Agent สามารถทำงานเหล่านี้ได้ด้วยคอมพิวเตอร์เสมือนที่มีเครื่องมือสำหรับโต้ตอบกับเว็บ และยังสามารถเชื่อมต่อกับแอปพลิเคชันต่าง ๆ เช่น Gmail และ GitHub เพื่อค้นหาข้อมูลที่เกี่ยวข้องกับคำสั่งของผู้ใช้ รวมถึงควบคุมเว็บเบราว์เซอร์ ไฟล์คอมพิวเตอร์ และซอฟต์แวร์อย่างสเปรดชีตและสไลด์ได้ด้วย
ในวิดีโอสาธิตการใช้งาน พนักงานของโอเพนเอไอได้ทดลองให้ Agent ช่วยงานในสถานการณ์ต่าง ๆ เช่น ช่วยเตรียมงานแต่งงาน โดยหาชุดที่เข้ากับเดรสโค้ดและเสนอตัวเลือกห้าแบบ รวมถึงหาโรงแรมที่สามารถรองรับแขกช่วงก่อนและหลังงาน นอกจากนี้ยังสามารถขอให้จองร้านอาหารตามเงื่อนไขที่กำหนด เช่น ร้านอาหารอิตาเลียน ซูชิ หรือเกาหลี ที่มีคะแนนรีวิวตั้งแต่ 4.3 ดาวขึ้นไป หรือแม้แต่ค้นหาเวลาว่างใน Google Calendar รวมถึงการร่างแผนการเดินทาง โดยงานเหล่านี้ใช้เวลาประมาณ 10-15 นาที ผู้ใช้สามารถขัดจังหวะและให้คำแนะนำเพิ่มเติมกับ AI Agent ได้ตลอดเวลา ในทางกลับกัน Agent ก็สามารถขอคำแนะนำที่ชัดเจนขึ้นจากผู้ใช้ได้
ทั้งนี้ ฟีเจอร์ Agent mode เริ่มทยอยเปิดให้ใช้งานสำหรับผู้ที่สมัครสมาชิกแพ็กเกจ Pro, Plus, และ Team ของ ChatGPT ตั้งแต่วันพฤหัสบดีเป็นต้นไป
- ความเสี่ยงและมาตรการป้องกัน
การอัปเดตครั้งนี้เป็นความพยายามของโอเพนเอไอที่จะทำให้ ChatGPT เป็นผู้ช่วยที่มีความสามารถครอบคลุมมากขึ้น แต่ขณะเดียวกันก็ยอมรับว่า "โมเดลนี้มีความเสี่ยงมากกว่าโมเดลก่อน ๆ" โดยโมเดลใหม่ยังมีแนวโน้มที่จะเกิดอาการหลอน (hallucinations) ความมีอคติ และการทำงานในลักษณะที่คาดเดาไม่ได้
นอกจากนี้ ความเสี่ยงที่สำคัญอีกประการหนึ่งคือ Agent อาจตกเป็นเหยื่อของการโจมตีด้วยคำสั่งที่เป็นอันตราย (malicious prompts) ซึ่งอาจซ่อนอยู่บนเว็บไซต์ที่เข้าชม และอาจนำไปสู่การขโมยข้อมูลผู้ใช้
แซม อัลต์แมน ซีอีโอของโอเพนเอไอ โพสต์ข้อความผ่านบัญชีเอ็กซ์ (X) ว่า ฟีเจอร์ใหม่นี้ถือเป็นเทคโนโลยีล้ำสมัยที่ยังอยู่ในช่วงทดลอง โดยระบุว่านี่เป็นโอกาสที่จะได้ลองใช้เทคโนโลยีแห่งอนาคต แต่ "ไม่ใช่สิ่งที่ควรใช้สำหรับงานที่มีความเสี่ยงสูง หรือมีข้อมูลส่วนบุคคลจำนวนมาก"
ทั้งนี้ บริษัทมีมาตรการป้องกันด้วยการจำกัดการเข้าถึงข้อมูล และกำหนดให้งานสำคัญ เช่น การส่งอีเมล ต้องได้รับการอนุมัติจากผู้ใช้ โมเดลยังได้รับการฝึกฝนให้ปฏิเสธงานที่มีความเสี่ยงสูง เช่น การโอนเงิน และต้องยืนยันกับผู้ใช้ก่อนที่จะดำเนินการใด ๆ ที่อาจก่อให้เกิดความเสียหายหรือแก้ไขไม่ได้
โอเพนเอไอระบุบนบล็อกว่า "คุณควบคุมได้เสมอ ChatGPT จะขออนุญาตก่อนที่จะดำเนินการที่มีผลกระทบ และคุณสามารถขัดจังหวะ ควบคุมเบราว์เซอร์ หรือหยุดงานได้ตลอดเวลา"
- การแข่งขันและการสร้างรายได้
การเปิดตัว Agent mode ตอกย้ำการแข่งขันที่ดุเดือดในตลาด AI โดยกูเกิล (Google) และแอปเปิ้ล (Apple) ต่างก็กำลังพัฒนา AI agent ที่มีความสามารถคล้ายคลึงกันเพื่อช่วงชิงความได้เปรียบในสมรภูมินี้
แม้โอเพนเอไอระบุว่า Agent จะไม่แนะนำผลิตภัณฑ์ และยังไม่มีแผนที่จะเปลี่ยนแปลงนโยบายนี้ แต่ก็มีการคาดการณ์ถึงความเป็นไปได้ในการสร้างรายได้จากฟีเจอร์ Agent นี้ โดย แซม อัลต์แมน เองก็เคยกล่าวถึงความเป็นไปได้ในการเก็บค่าธรรมเนียม 2% จากยอดขายที่เกิดขึ้นผ่านซอฟต์แวร์ "deep research"
ไนแอมห์ เบิร์น นักวิเคราะห์อาวุโสจาก Enders Analysis ตั้งข้อสังเกตว่า แม้ระบบจะขอการอนุมัติก่อนทำการซื้อ แต่ยังคงมีคำถามว่าจะมีข้อตกลงทางการค้าที่แบรนด์จ่ายเงินเพื่อให้ผู้ช่วย AI นำเสนอสินค้าของตนเองหรือไม่ เนื่องจากบริษัท AI เหล่านี้อยู่ภายใต้แรงกดดันที่เพิ่มขึ้นในการสร้างรายได้จากผลิตภัณฑ์ ดังนั้นการมีสปอนเซอร์หรือโฆษณาแฝงในบางรูปแบบจึงอาจเป็นสิ่งที่หลีกเลี่ยงไม่ได้