Machine Learning Tag - Big Data Institute

ข่าวและบทความที่เกี่ยวข้อง

บทความ

AI ทำนายทายทัก: การประยุกต์ใช้ Big Data และปัญญาประดิษฐ์ (AI) ในการพยากรณ์อนาคต

การพยากรณ์อนาคตหรือการดูดวง ถือเป็นกิจกรรมที่อยู่คู่กับมนุษยชาติมาอย่างยาวนาน ตั้งแต่ยุคโบราณที่มนุษย์เริ่มสังเกตดวงดาว การเคลื่อนที่ของดวงอาทิตย์ ดวงจันทร์ และดาวเคราะห์ เพื่อนำมาทำนายฤดูกาล การเกษตร ตลอดจนเหตุการณ์สำคัญในชีวิต เช่น การเกิด การแต่งงาน หรือการตัดสินใจทางการเมือง หลักฐานทางโบราณคดีในหลายอารยธรรม เช่น บาบิโลน อียิปต์ อินเดีย และจีน แสดงให้เห็นว่ามนุษย์มีความพยายามหาความหมายจากสิ่งเหนือธรรมชาติและปรากฏการณ์ทางจักรวาลมาโดยตลอด และในสังคมไทยเอง การดูดวงก็มีทั้งในรูปแบบโหราศาสตร์ไทย ไพ่ยิปซี พรหมญาณ ตลอดจนศาสตร์การทำนายที่ผสมผสานกับความเชื่อทางพุทธศาสนา การดูดวงจึงไม่เพียงเป็นกิจกรรมทางจิตวิทยาที่ช่วยสร้างความมั่นใจ แต่ยังเป็นส่วนหนึ่งของผู้คนที่สืบทอดกันมาหลายชั่วอายุคน และในยุคดิจิทัลปัจจุบัน เทคโนโลยีได้เข้ามามีบทบาทในทุกมิติของชีวิตมนุษย์ แม้กระทั่งการดูดวงเองก็ไม่อาจแยกออกจากการพัฒนาของ ข้อมูลขนาดใหญ่ (Big Data) และ ปัญญาประดิษฐ์ (Artificial Intelligence: AI) การประมวลผลข้อมูลมหาศาลร่วมกับอัลกอริทึมการเรียนรู้ของเครื่อง (Machine Learning) ช่วยให้การทำนายดวงมีความหลากหลายและมีความเป็นส่วนตัวมากขึ้น ผู้ใช้สามารถเข้าถึงบริการได้ผ่านแอปพลิเคชัน เว็บไซต์ และแชตบอตตลอด 24 ชั่วโมง การผสมผสานศาสตร์โบราณกับเทคโนโลยีสมัยใหม่ จึงเป็นเรื่องที่น่าสนใจ เพราะนอกจากจะสะท้อนถึงพลวัตของสังคมมนุษย์แล้ว ยังชี้ให้เห็นถึงศักยภาพของ Big Data และ AI ในการนำมาใช้กับศาสตร์ที่เกี่ยวข้องกับความเชื่อส่วนบุคคล ซึ่งแต่เดิมอาจถูกมองว่าเป็นนามธรรมและยากต่อการพิสูจน์ ปัจจุบันมีหลายแพลตฟอร์มที่ให้การพยากรณ์ดูดวง เช่น เว็บไซต์ myhora.com หนึ่งในผู้ให้บริการดูดวงออนไลน์ที่ได้รับความนิยมในประเทศไทย โดยให้บริการโหราศาสตร์ไทย การคำนวณดวงชะตาจากวันเดือนปีเกิด การผูกดวง และการพยากรณ์เหตุการณ์สำคัญ ข้อได้เปรียบของแพลตฟอร์มนี้ คือ การนำ ฐานข้อมูลวันเกิด ดวงดาว และหลักโหราศาสตร์ไทย มาวิเคราะห์แบบอัตโนมัติ ทำให้ผู้ใช้ได้รับผลการทำนายที่เฉพาะเจาะจงตามข้อมูลส่วนบุคคล หรือแพลตฟอร์ม ChatGPT แม้ ChatGPT ไม่ได้ถูกออกแบบมาเพื่อการดูดวงโดยตรง แต่ผู้ใช้นิยมนำมาเป็น “ผู้ช่วยดูดวง” ด้วยการพิมพ์คำถาม เช่น การทำนายความรัก การงาน หรือโชคลาภ ด้วยเทคนิคการ ประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) ทำให้ AI สามารถตอบสนองต่อคำถามในลักษณะการสนทนาได้อย่างสมจริง นอกจากนี้ ChatGPT ยังสามารถสร้างสรรค์คำทำนายใหม่ ๆ ที่ผสมผสานระหว่างข้อมูลดั้งเดิมกับการประยุกต์ในเชิงจินตนาการ สะท้อนถึงแนวโน้มของการใช้ AI เป็นเครื่องมือสนับสนุนด้านจิตวิทยาและความเชื่อ รวมไปถึงแอปพลิเคชันโหราศาสตร์ต่างประเทศ เช่น Co-Star และ The Pattern ซึ่งอาศัยฐานข้อมูลตำแหน่งดาวเคราะห์จากองค์การนาซา (NASA) และใช้ Machine Learning วิเคราะห์ความสัมพันธ์ของดวงดาวกับบุคลิกภาพผู้ใช้ แอปเหล่านี้ยังสามารถเชื่อมต่อกับโซเชียลมีเดียเพื่อทำนายความเข้ากันได้ระหว่างเพื่อนหรือคู่รัก แสดงให้เห็นถึงการผสมผสานระหว่าง Big Data และ AI กับศาสตร์ดั้งเดิมอย่างลึกซึ้ง การนำ Big Data และ AI มาประยุกต์ใช้กับการดูดวง สามารถอธิบายได้เป็นลำดับขั้นโดยสังเขป ดังนี้ 1. การเก็บรวบรวมข้อมูล (Data Collection) ได้ว่าจะเป็น ข้อมูลเชิงดาราศาสตร์ ตำแหน่งของดวงดาว ดาวเคราะห์ และปรากฏการณ์ทางจักรวาลจากฐานข้อมูลวิทยาศาสตร์ ข้อมูลผู้ใช้ วันเดือนปีเกิด เวลาเกิด สถานที่เกิด ตลอดจนข้อมูลส่วนบุคคล เช่น เพศ ความสนใจ หรือพฤติกรรมออนไลน์ และข้อมูลจากแหล่งสังคมออนไลน์ (Social Media Data) การโพสต์ ความรู้สึก หรือการแสดงความคิดเห็นของผู้ใช้ ซึ่งสามารถสะท้อนถึงอารมณ์และบุคลิกภาพ 2. การจัดเก็บและประมวลผลข้อมูล (Data Processing & Storage) เมื่อได้ข้อมูลจำนวนมหาศาลแล้ว จำเป็นต้องอาศัยเทคโนโลยี Big Data เช่น Hadoop, Spark หรือฐานข้อมูลเชิงสัมพันธ์และไม่เชิงสัมพันธ์ (SQL/NoSQL) เพื่อจัดเก็บข้อมูลและเตรียมพร้อมสำหรับการวิเคราะห์ 3. การวิเคราะห์ข้อมูลด้วย AI ซึ่งมีตัวอย่างที่น่าสนใจมีการนำวิเคราะห์ข้อมูล เช่น ที่มาภาพ: https://blogs.sas.com/content/subconsciousmusings/2020/12/09/machine-learning-algorithm-use/ ที่มาภาพ: https://www.datasciencecentral.com/top-nlp-algorithms-amp-concepts/ ที่มาภาพ: https://www.geeksforgeeks.org/artificial-intelligence/artificial-neural-networks-and-its-applications/ 4. การนำเสนอผลลัพธ์ (Result Presentation) ผลการวิเคราะห์จะถูกนำเสนอผ่านแอป เว็บไซต์ หรือแชตบอต โดยมักปรับแต่งให้เหมาะสมกับผู้ใช้แต่ละราย เพื่อสร้างประสบการณ์ที่เป็นส่วนตัว (Personalized Experience) 5. การเรียนรู้และปรับปรุงต่อเนื่อง (Feedback & Continuous Learning) ระบบ AI จะเก็บข้อมูลปฏิกิริยาของผู้ใช้ เช่น ความพึงพอใจ การแชร์ หรือการใช้บริการซ้ำ นำไปปรับปรุงแบบจำลองการทำนายให้มีความแม่นยำและสอดคล้องกับพฤติกรรมมนุษย์มากขึ้น การประยุกต์ใช้ Big Data และ AI ในการดูดวงเป็นปรากฏการณ์ที่สะท้อนให้เห็นถึงการผสมผสานระหว่างศาสตร์โบราณกับเทคโนโลยีสมัยใหม่อย่างลงตัว แม้คำทำนายจะยังไม่สามารถพิสูจน์ทางวิทยาศาสตร์ได้ แต่การนำ AI มาวิเคราะห์ข้อมูลจำนวนมหาศาลได้สร้างความน่าสนใจและเพิ่มคุณค่าเชิงประสบการณ์ให้แก่ผู้ใช้ในอนาคต ซึ่งมีผลกระทบต่อมนุษย์และสังคม ไม่ว่าจะเป็นการเข้าถึงที่ง่ายและรวดเร็ว ผู้ใช้สามารถดูดวงได้ทุกที่ทุกเวลา มีการปรับแต่งเฉพาะบุคคลโดย AI วิเคราะห์ข้อมูลเชิงลึก ทำให้คำทำนายมีความเฉพาะเจาะจงมากขึ้น อีกทั้งเป็นการผสมผสานความบันเทิงและจิตวิทยา บริการดูดวงช่วยบรรเทาความวิตกกังวล และสร้างความมั่นใจ ทำให้มีการพัฒนาเชิงเศรษฐกิจ อุตสาหกรรมดูดวงออนไลน์สร้างรายได้และเปิดโอกาสใหม่ในการพัฒนาธุรกิจดิจิทัล แต่อย่างไรก็ตาม ผลกระทบที่ควรต้องพึงระวัง คือ ปัญหาความถูกต้อง เนื่องจากคำทำนายที่ได้จาก AI เป็นเพียงความน่าจะเป็นไปได้ตามฐานคำนายที่มี และความเป็นส่วนตัวของข้อมูล การเก็บข้อมูลส่วนบุคคลจำนวนมากอาจนำไปสู่ความเสี่ยงด้านการรั่วไหลได้ อีกทั้งการพึ่งพามากเกินไป ผู้ใช้บางรายอาจหลงเชื่อคำทำนายจนส่งผลต่อการตัดสินใจที่สำคัญในชีวิต รวมไปถึงข้อถกเถียงทางจริยธรรม การใช้ AI ในการเสริมสร้างความเชื่อที่ไม่สามารถพิสูจน์ได้ จึงทำให้เราควรตระหนักและให้ความสำคัญในการพัฒนามาตรฐานด้านความปลอดภัยข้อมูล เพื่อปกป้องความเป็นส่วนตัวของผู้ใช้ และการสร้างความรู้เท่าทันดิจิทัล (Digital Literacy) ให้ผู้ใช้เข้าใจว่าคำทำนายจาก AI มีข้อจำกัด รวมทั้งการวิจัยและพัฒนา ในการผสมผสานข้อมูลวิทยาศาสตร์จิตวิทยาเข้ากับการดูดวง เพื่อเพิ่มคุณค่าเชิงวิชาการ และการใช้ประโยชน์ทางเศรษฐกิจและสังคม เช่น การสร้างแพลตฟอร์มที่ผสมผสานความบันเทิง การศึกษา และการเสริมกำลังใจให้ผู้คน เอกสารอ้างอิง https://www.tandfonline.com/doi/full/10.1080/1369118X.2012.678878 https://bernardmarr.com/wp-content/uploads/2022/05/Big-Data-Esampler-1.pdf http://lib.ysu.am/disciplines_bk/efdd4d1d4c2087fe1cbe03d9ced67f34.pdf

6 October 2025

บทความ

Movements

Big Data และ AI พลิกโฉมความรักและความสัมพันธ์ในยุคดิจิทัล

ในยุคดิจิทัล ปฏิสัมพันธ์ทางสังคมได้เปลี่ยนแปลงไปอย่างสิ้นเชิงจากเดิมที่มนุษย์ต้องอาศัยการพบปะกันโดยตรง สู่การใช้เทคโนโลยีเป็นสื่อกลาง โดยเฉพาะแอปพลิเคชันหาคู่ (Dating Applications) ที่ได้รับความนิยมทั่วโลก ไม่ว่าจะเป็น Tinder, Bumble, OKCupid หรือ Coffee Meets Bagel การแพร่หลายของแพลตฟอร์มเหล่านี้สะท้อนถึงความต้องการของมนุษย์ในการแสวงหาความสัมพันธ์และการเชื่อมต่อใหม่ ๆ อย่างไรก็ตาม การจับคู่ที่แม่นยำและประสบการณ์การใช้งานที่ดี จำเป็นต้องอาศัยการประมวลผลข้อมูลจำนวนมหาศาล (Big Data) และเทคโนโลยีปัญญาประดิษฐ์ (Artificial Intelligence: AI) ซึ่งการใช้ Big Data และ AI ไม่ได้จำกัดอยู่เพียงแค่การคำนวณคะแนนความเข้ากันได้ระหว่างผู้ใช้ แต่ยังครอบคลุมถึงการวิเคราะห์พฤติกรรม การตรวจสอบความปลอดภัย การลดความเสี่ยงจากโปรไฟล์ปลอม ตลอดจนการสร้างบทสนทนาอัตโนมัติที่เอื้อต่อการเริ่มต้นความสัมพันธ์ Big Data และ AI ถือเป็นกลไกที่อยู่เบื้องหลังแอปหาคู่ การทำงานของแอปพลิเคชันหาคู่ มีการรวบรวมและประมวลผลข้อมูลในระดับที่กว้างและลึกกว่าที่ผู้ใช้ทั่วไปนึกถึง นั่นคือ Big Data หมายถึง ชุดข้อมูลขนาดใหญ่ที่มีปริมาณ (Volume) ความหลากหลาย (Variety) และความรวดเร็ว (Velocity) โดยในแอปหาคู่ ข้อมูลเหล่านี้ได้มาจาก ข้อมูลโปรไฟล์ เช่น อายุ เพศ สถานที่ทำงาน ความสนใจ พฤติกรรมการใช้งาน เวลาที่เปิดแอป ความถี่ในการปัดซ้าย/ขวา (swipe) ระยะเวลาที่ใช้ในการดูโปรไฟล์ ข้อมูลเชิงพื้นที่ (Location Data) ใช้เพื่อหาคู่ที่อยู่ใกล้เคียง รวมถึงการสื่อสาร ข้อความสนทนา คำที่ใช้บ่อย และโทนการสื่อสาร การเก็บข้อมูลเหล่านี้เปิดโอกาสให้ผู้พัฒนาแอปสามารถสร้างแบบจำลองพฤติกรรมและวิเคราะห์รูปแบบความชอบของผู้ใช้ได้อย่างละเอียด ส่วนปัญญาประดิษฐ์ หรือ AI ทำหน้าที่สำคัญในการประมวลผลข้อมูลขนาดใหญ่ (Big Data) เพื่อสร้างระบบการจับคู่ (Matching System) ที่มีความแม่นยำและมีประสิทธิภาพมากยิ่งขึ้น โดยการทำงานอาศัยเทคนิคและเครื่องมือเฉพาะทางหลายด้าน ได้แก่ Machine Learning (ML) เป็นหัวใจหลักในการเรียนรู้จากข้อมูลพฤติกรรมของผู้ใช้ เช่น ประวัติการกดถูกใจ (like) การปัดซ้ายหรือขวาในแอปพลิเคชันหาคู่ รวมไปถึงรูปแบบการสื่อสารกับคู่สนทนา ML จะสร้างแบบจำลอง (Model) ที่สามารถทำนายความเข้ากันได้ หรือ Compatibility Score ของผู้ใช้แต่ละคู่ โดยใช้ปัจจัยทั้งด้านบุคลิกภาพ ความสนใจ และรูปแบบการปฏิสัมพันธ์ ทำให้การแนะนำคู่มีโอกาสประสบความสำเร็จสูงกว่าเพียงการสุ่ม Natural Language Processing (NLP) ใช้สำหรับวิเคราะห์ข้อมูลที่อยู่ในรูปแบบข้อความ เช่น ข้อมูลโปรไฟล์ คำบรรยายตัวตน ความสนใจ รวมถึงบทสนทนาที่เกิดขึ้นระหว่างผู้ใช้ ระบบสามารถตีความความหมายในเชิงลึก เช่น การตรวจจับโทนภาษา ความสนใจร่วมกัน หรือค่านิยมที่สอดคล้องกัน ซึ่งช่วยให้การจับคู่ไม่เพียงอิงจากข้อมูลพื้นฐาน แต่ยังสะท้อนความเข้ากันได้ทางความคิดและการสื่อสารอีกด้วย Computer Vision ประยุกต์ใช้อัลกอริทึมจดจำใบหน้า (Facial Recognition) และการประมวลผลภาพถ่าย เพื่อยืนยันความถูกต้องของโปรไฟล์ว่ามีตัวตนจริง ลดความเสี่ยงจากการปลอมแปลง (Catfishing) นอกจากนี้ยังสามารถวิเคราะห์สไตล์ภาพที่ผู้ใช้ชื่นชอบ เช่น โทนสี การจัดองค์ประกอบ หรือบรรยากาศของภาพ เพื่อใช้เป็นข้อมูลเพิ่มเติมในการแนะนำคู่ที่มีความใกล้เคียงกับรสนิยมด้านความสวยงามและภาพลักษณ์ Recommendation System ระบบแนะนำคู่ที่พัฒนาขึ้นจากการรวบรวมข้อมูลของผู้ใช้นับล้านคน แล้วนำมาวิเคราะห์ความสัมพันธ์ของข้อมูลในเชิงสถิติและเชิงพฤติกรรม อัลกอริทึมนี้จะค้นหารูปแบบที่ซ่อนอยู่ เช่น ผู้ที่มีคุณลักษณะหรือความสนใจแบบใดมักตอบรับหรือสานสัมพันธ์กับผู้ใช้ลักษณะใด จากนั้นจึงนำมาประมวลผลเป็นการแนะนำคู่ที่มีแนวโน้มสูงสุด ซึ่งไม่เพียงช่วยเพิ่มโอกาสในการจับคู่สำเร็จ แต่ยังทำให้ผู้ใช้ประหยัดเวลาและได้รับประสบการณ์ที่น่าพึงพอใจมากขึ้นตัวอย่างแอปพลิเคชันการหาคู่ OKCupid เคยเปิดเผยในบล็อกของตนว่า การใช้ ML ในการวิเคราะห์คำตอบแบบสอบถามช่วยเพิ่มโอกาสจับคู่ที่ประสบความสำเร็จได้สูงกว่า 30% ในขณะที่ Tinder ใช้การผสมผสาน Location Data และ AI เพื่อแนะนำคู่ที่อยู่ใกล้และตรงกับพฤติกรรมการปัด (swiping behavior) จากการผสมผสาน Big Data เข้ากับ AI ผ่านเทคนิคเหล่านี้ ทำให้การหาคู่ในยุคดิจิทัลไม่ใช่เพียงการพึ่งพาโชคหรือความบังเอิญอีกต่อไป แต่เป็นกระบวนการที่มีการวิเคราะห์อย่างเป็นระบบ แม่นยำ ครอบคลุมมิติต่าง ๆ ดังนี้ การจับคู่เชิงลึกที่ปรับให้เหมาะกับผู้ใช้แต่ละคน (Personalized Matching) โดยพิจารณาจากพฤติกรรมจริงมากกว่าการตั้งค่าความสนใจเพียงอย่างเดียว เช่น ผู้ใช้ที่มักจะเลือกโปรไฟล์ที่มีภาพถ่ายกลางแจ้ง อาจได้รับการแนะนำคู่ที่ชอบกิจกรรมกลางแจ้งเช่นกัน ผู้ช่วยหาคู่ AI (AI Dating Assistant) บางแพลตฟอร์มเริ่มทดลองใช้ Chatbot ที่ช่วยเสนอแนวทางการเปิดบทสนทนา เช่น แนะนำคำถามที่อาจทำให้คู่สนใจมากขึ้น ซึ่งช่วยลดความกดดันในการเริ่มต้นการพูดคุย ความปลอดภัยและความน่าเชื่อถือ (Safety & Trust) AI ถูกใช้ในการตรวจจับโปรไฟล์ปลอม (fake profiles) การใช้ภาพซ้ำจากอินเทอร์เน็ต (reverse image search) หรือการใช้ NLP เพื่อตรวจหาคำพูดที่ไม่เหมาะสม เช่น การล่วงละเมิดหรือการหลอกลวง การวิเคราะห์พฤติกรรม (Behavioral Analytics) แอปหาคู่สามารถเรียนรู้ได้ว่า ผู้ใช้จริง ๆ แล้วชอบคนแบบไหน โดยวิเคราะห์พฤติกรรมที่เกิดขึ้นจริง แทนที่จะอ้างอิงจากสิ่งที่ผู้ใช้กรอกไว้ในโปรไฟล์เพียงอย่างเดียว แม้ว่า Big Data และ AI จะเพิ่มประสิทธิภาพของการจับคู่ แต่ก็มีประเด็นทางสังคมและจริยธรรมที่ควรพิจารณาทั้งเชิงบวก เช่น เพิ่มโอกาสการพบคู่แท้ ผู้ใช้สามารถเจอคนที่มีความสนใจใกล้เคียงได้ง่ายขึ้น ลดอคติในการเลือกคู่ ระบบสามารถช่วยให้ผู้ใช้เปิดกว้างต่อความสัมพันธ์ที่อาจไม่เคยนึกถึง และความสะดวก ไม่ต้องเสียเวลาพบปะจำนวนมากเพื่อหาคนที่เหมาะสม และเชิงลบ ในแง่อคติจากอัลกอริทึม (Algorithmic Bias AI) อาจสร้างอคติจากข้อมูลที่ไม่สมดุล เช่น ให้ความสำคัญกับรูปลักษณ์มากเกินไป ความเป็นส่วนตัว การเก็บข้อมูลพฤติกรรมอย่างละเอียดอาจนำไปสู่การละเมิดความเป็นส่วนตัว หรือความสัมพันธ์ผิวเผิน บางครั้งระบบแนะนำอาจเน้น การจับคู่ที่รวดเร็ว มากกว่าความเข้ากันได้เชิงลึก รวมถึงประเด็นด้านจริยธรรม การใช้ข้อมูลส่วนบุคคล เช่น ข้อมูลตำแหน่งและประวัติการสนทนา จำเป็นต้องมีกฎหมายและมาตรการคุ้มครอง เช่น GDPR ของสหภาพยุโรป และ PDPA ของประเทศไทย หากไม่มีการจัดการที่เหมาะสม อาจนำไปสู่การรั่วไหลของข้อมูลที่ส่งผลกระทบต่อผู้ใช้โดยตรง ดังนั้น การประยุกต์ใช้ Big Data และ AI ในแอปพลิเคชันหาคู่ มีบทบาทสำคัญต่อการพัฒนาแพลตฟอร์มให้ตอบสนองความต้องการของผู้ใช้ได้ดียิ่งขึ้น ตั้งแต่การจับคู่ที่มีประสิทธิภาพ การสร้างความปลอดภัย ไปจนถึงการสนับสนุนการสื่อสาร อย่างไรก็ตาม ความท้าทายด้านความเป็นส่วนตัว อคติของอัลกอริทึม และจริยธรรมทางข้อมูลเป็นประเด็นที่ต้องได้รับความใส่ใจอย่างจริงจัง จึงทำให้ผู้พัฒนาแอปพลิเคชันควรตระหนักจริยธรรมปัญญาประดิษฐ์ (Ethical AI) และธรรมาภิบาลข้อมูล (Data Governance) ที่โปร่งใส รวมถึงการให้ผู้ใช้สามารถควบคุมข้อมูลของตนเองได้มากขึ้น นอกจากนี้ ควรมีการวิจัยเชิงลึกเกี่ยวกับผลกระทบระยะยาวของการใช้เทคโนโลยีเหล่านี้ต่อความสัมพันธ์ เพื่อพัฒนาแนวทางที่สมดุลระหว่างประสิทธิภาพทางเทคโนโลยีและคุณค่าทางมนุษย์ เอกสารอ้างอิง (References) https://dl.acm.org/doi/10.1145/1864708.1864770 https://cacm.acm.org/research/a-snapshot-of-the-frontiers-of-fairness-in-machine-learning https://gwern.net/doc/psychology/okcupid/weexperimentonhumanbeings.html https://www.researchgate.net/publication/349327291_Online_Dating_Meets_Artificial_Intelligence_How_the_Perception_of_Algorithmically_Generated_Profile_Text_Impacts_Attractiveness_and_Trust https://ojs.aaai.org/aimagazine/index.php/aimagazine/article/view/2741

29 August 2025

บทความ

Big Data 101

Meta Prompting: ใช้ AI ช่วยสร้างคำสั่งให้ AI ทำงานเก่งขึ้น

ทุกวันนี้ เราใช้ AI อย่าง ChatGPT, Claude, หรือ DeepSeek ช่วยทำงานได้หลายอย่าง ไม่ว่าจะเขียนบทความ ตอบคำถาม หรือช่วยคิดวิเคราะห์ข้อมูลต่าง ๆ แต่การจะ “สั่ง” Artificial Inteligence (AI) ให้ทำงานได้ตรงใจนั้นไม่ใช่เรื่องง่าย เพราะบางที AI ก็ให้คำตอบที่ไม่ตรงตามความต้องการ ทำให้เราต้องเสียเวลาแก้คำสั่งซ้ำไปซ้ำมา ซึ่งบทความนี้ผู้เขียนจะแนะนำเทคนิค “เมตาพรอมต์ติ้ง” หรือ Meta Prompting ที่จะให้ AI มาช่วยเราสร้างและปรับปรุง “คำสั่ง” ให้ดีขึ้นไปอีก Meta Prompting คืออะไร? Meta Prompting เป็นเทคนิคหนึ่งในการออกแบบคำสั่ง (Prompt Engineering) โดยเราจะใช้ AI มาช่วยสร้างหรือปรับปรุงชุดคำสั่ง แทนที่เราจะต้องคิดคำสั่งเองทั้งหมด เราก็ให้ AI ช่วยคิดโครงสร้าง เนื้อหา หรือแม้แต่ปรับปรุงคำสั่งเดิม ทำให้เราทำงานที่ซับซ้อน ได้ง่ายขึ้น และปรับตัวตามสถานการณ์ต่างๆ ได้ดีขึ้นด้วย ทำไมต้องใช้ Meta Prompting? วิธีการของ Meta Prompting บทความนี้จะแนะนำตัวอย่างการทำ Meta Prompting 3 วิธี ดังนี้ 1. Meta-Prompting รูปที่ 1 รูปแบบการทำงานของ Meta-Prompting [1] หลักการการทำงาน คือ การสร้าง “คำสั่งหลัก” ที่ทำหน้าที่เหมือน “ผู้จัดการโครงการ” โดยคอยแบ่งงานย่อย ๆ ให้ “คำสั่งย่อย” ที่ทำหน้าที่เหมือน “ผู้เชี่ยวชาญ” ในแต่ละด้าน เช่น “ผู้เชี่ยวชาญด้านการตลาด”, “ผู้เชี่ยวชาญด้านการเขียนโปรแกรม” แล้วค่อยรวบรวมผลลัพธ์ สามารถอ่านรายละเอียดเพิ่มเติมได้ที่ https://arxiv.org/pdf/2401.12954 ขั้นตอนการทำงาน: ตัวอย่างการใช้งาน: “` คุณคือ Meta-Expert ผู้เชี่ยวชาญด้านการวางแผนงานอีเวนต์ สามารถทำงานร่วมกับผู้เชี่ยวชาญอื่น ๆ ได้ เพื่อจัดงานเลี้ยงบริษัทให้สมบูรณ์แบบ คุณสามารถเรียกใช้ผู้เชี่ยวชาญด้านต่าง ๆ ได้แก่ “เชฟมืออาชีพ”, “นักตกแต่งสถานที่”, และ “นักวางแผนกิจกรรม” ในการเรียกผู้เชี่ยวชาญ ให้พิมพ์ชื่อตามด้วย “:” เช่น: เชฟมืออาชีพ: แนะนำเมนูอาหารสำหรับงานเลี้ยงบริษัท 100 คน เน้นอาหารไทย มีตัวเลือกสำหรับคนทานมังสวิรัติ และคนแพ้อาหารทะเล นักตกแต่งสถานที่: ออกแบบการตกแต่งสำหรับงานเลี้ยงบริษัทในธีม “รื่นเริงริมทะเล” ใช้งบประมาณไม่เกิน 50,000 บาท นักวางแผนกิจกรรม: จัดกิจกรรมสันทนาการ 3 กิจกรรมสำหรับพนักงานบริษัท เน้นกิจกรรมที่ส่งเสริมความสามัคคี และสนุกสนาน “` 2. Learning from Contrastive Prompts หลักการการทำงาน คือ การให้ AI เปรียบเทียบ “คำสั่งที่ดี” (ที่สามารถให้ผลลัพธ์ตรงตามความต้องการ) กับ “คำสั่งที่ไม่ดี” เพื่อเรียนรู้ว่าอะไรใช้ได้ผลและอะไรใช้ไม่ได้ผล แล้วสามารถสร้างคำสั่งใหม่ที่ดีกว่าเดิม สามารถอ่านรายละเอียดเพิ่มเติมได้ที่ https://arxiv.org/pdf/2409.15199 ขั้นตอนการทำงาน: รูปแบบการใช้งาน “` โจทย์: {{ Question }} กำหนดอินพุต: {{ Input }} และเอาต์พุตที่คาดหวัง: {{ Output }} อธิบายเหตุผลว่าเหตุใดอินพุตจึงสอดคล้องกับเอาต์พุตที่คาดหวัง จากนั้นใช้เหตุผลดังกล่าวสร้างพรอมต์เพื่อให้ได้เอาต์พุตที่คาดหวังจากอินพุตใดๆ ทั้งหมด 5 พรอมต์ ทำการอธิบายว่าพรอมต์ใดทำงานตามโจทย์ได้ดีที่สุด และสรุปเป็นพรอมต์ใหม่ ที่ดีขึ้นกว่าเดิม “` ตัวอย่างการใช้งาน “` โจทย์: จำแนกความรู้สึกของข้อความต่อไปนี้ว่าเป็น “บวก” หรือ “ลบ” ข้อมูล: “หนังเรื่องนี้สนุกมาก!“ คำตอบที่ถูกต้อง: บวก ข้อมูล: “ฉันไม่ชอบอาหารร้านนี้เลย” คำตอบที่ถูกต้อง: ลบ อธิบายเหตุผลว่าเหตุใดอินพุตจึงสอดคล้องกับเอาต์พุตที่คาดหวัง จากนั้นใช้เหตุผลดังกล่าวสร้างพรอมต์เพื่อให้ได้เอาต์พุตที่คาดหวังจากอินพุตใดๆ ทั้งหมด 5 พรอมต์ ทำการอธิบายว่าพรอมต์ใดทำงานตาม โจทย์ได้ดีที่สุด และสรุปเป็นพรอมต์ใหม่ ที่ดีขึ้นกว่าเดิม “` 3. Declarative Self-improving Python (DSPy) รูปที่ 2 ตัวอย่างการทำงานขอ DSPy [6] หลักการการทำงาน: เป็นหนึ่งใน Python Library ที่มี Framework ที่ช่วยในการคอยปรับแต่งและพัฒนาคำสั่งให้ดีขึ้นโดยอัตโนมัติ สามารถอ่านรายละเอียดเพิ่มเติมได้ที่ https://arxiv.org/pdf/2310.03714 ขั้นตอนการทำงาน: ตัวอย่างการใช้งาน “` import dspy # กำหนด LLM ที่จะใช้ (ในตัวอย่างนี้ขอสมมติเป็น OpenAI) lm = lm = dspy.LM(‘openai/gpt-4o-mini', api_key='YOUR_OPENAI_API_KEY') dspy.settings.configure(lm=lm) # กำหนด signature บอกว่า input คืออะไร (text) และ output คืออะไร (sentiment) class SentimentAnalysis(dspy.Signature): text = dspy.InputField(desc=”The text to analyze”) sentiment = dspy.OutputField(desc=”Either ‘positive' or ‘negative'”) # สร้าง module ที่ใช้ signature นี้ และมี dspy.Predict เพื่อเรียกใช้ LLM class AnalyzeSentiment(dspy.Module): def __init__(self): super().__init__() self.classify = dspy.Predict(SentimentAnalysis) def forward(self, text): pred = self.classify(text=text) return pred # สร้างตัวอย่างข้อมูล (input, output) trainset...

17 March 2025

บทความ

Big Data 101

ปฏิวัติวงการ NLP: ทำไมการถ่ายทอดการเรียนรู้ (Transfer learning) จึงเป็นก้าวสำคัญของการประมวลผลภาษา

“การถ่ายทอดการเรียนรู้ (Transfer learning)” หลายคนอาจเคยได้ยินมาบ้างเกี่ยวกับการถ่ายทอดการเรียนรู้ในคอมพิวเตอร์กับงานด้านภาพหรือวิดีโอ แต่รู้หรือไม่ว่า การถ่ายทอดการเรียนรู้ก็สามารถประยุกต์ใช้กับงานด้านภาษาได้เช่นกัน ในช่วงหลายปีที่ผ่านมา มนุษย์มีความสามารถในการคาดการณ์สิ่งต่าง ๆ ได้ดียิ่งขึ้นโดยอาศัยเทคโนโลยีที่เรียกว่า การเรียนรู้ของเครื่อง (Machine learning) หลักการทำงานของเทคโนโลยีดังกล่าวคือการเรียนรู้และทำความเข้าใจข้อมูลที่ได้รับ และสร้างเป็นแบบจำลองที่มีประสิทธิภาพ การเรียนรู้ของแบบจำลองในปัจจุบันส่วนใหญ่เป็นงานเฉพาะด้าน เช่น การเรียนรู้เพื่อสร้างแบบจำลองสำหรับการจัดประเภทรูปภาพ การเรียนรู้เพื่อสร้างแบบจำลองสำหรับการคาดการณ์ล่วงหน้า ซึ่งแบบจำลองที่ถูกสร้างสำหรับงานเฉพาะด้านจะมีประสิทธิภาพที่สูงกับงานนั้น ๆ แต่ในทางกลับกัน แบบจำลองเหล่านั้น อาจเกิดข้อผิดพลาดได้ง่ายกับเงื่อนไข หรือข้อมูลที่ไม่เคยพบมาก่อน ในความเป็นจริง ข้อมูลที่ถูกนำมาให้แบบจำลองเรียนรู้อาจไม่สมบูรณ์ หรือไม่สามารถใช้งานได้ทันทีเหมือนแบบฝึกหัดที่ครูสอนในห้องเรียน ข้อมูลจริงมีโอกาสเกิดทั้ง ความผิดพลาด ความซับซ้อน และมีจำนวนที่น้อย ยกตัวอย่างเช่น ข้อมูลภาพถ่ายความร้อนในห้องน้ำสำหรับแบบจำลองการตรวจจับการล้ม[1] ซึ่งภาพถ่ายความร้อนในห้องน้ำสำหรับการตรวจจับการล้มนั้นเป็นข้อมูลที่เก็บได้ยาก เนื่องจากการล้มในห้องน้ำไม่ได้เกิดขึ้นบ่อย จึงทำให้ข้อมูลที่เก็บได้มีจำนวนน้อย อาจส่งผลให้แบบจำลองที่ถูกเรียนรู้จากข้อมูลดังกล่าวไม่สามารถคาดการณ์สิ่งต่าง ๆ ได้ดีพอ การถ่ายทอดการเรียนรู้จึงถูกนำมาใช้เพื่อแก้ไขปัญหาดังกล่าว โดยมีหลักการทำงานคือ การถ่ายทอดการเรียนรู้จากแบบจำลองหนึ่งไปยังอีกแบบจำลองหนึ่งดังภาพที่ 1 การถ่ายทอดการเรียนรู้ นิยมนำไปประยุกต์ใช้กับงานทางด้าน คอมพิวเตอร์วิทัศน์ (Computer Vision) เช่น การประมวลผลภาพ หรือวิดีโอ เพื่อให้คอมพิวเตอร์สามารถเข้าใจทัศนียภาพ หรือจำแนกวัตถุต่าง ๆ เนื่องจากแบบจำลองสำหรับงานด้านนี้มีพารามิเตอร์เป็นจำนวนมาก ซึ่งจำเป็นต้องใช้ชุดข้อมูลขนาดใหญ่ในการเรียนรู้ของแบบจำลอง โดยอาจใช้เวลาหลายวัน หรือหลายสัปดาห์ในการเรียนรู้ เพื่อให้แบบจำลองสามารถคาดการณ์สิ่งต่าง ๆ ออกมาได้ดียิ่งขึ้น ซึ่งการเรียนรู้แบบจำลองนั้นเป็นความท้าทายอย่างหนึ่งของผู้ที่สนใจในด้านนี้ จึงมีการจัดการแข่งขันที่มากมายในแต่ละปีเพื่อสร้างแบบจำลองที่ดีที่สุด ตัวอย่างเช่น การแข่งขัน ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ที่จัดขึ้นเป็นประจำทุกปี เพื่อเชิญชวนให้นักวิจัยจากทุกมุมโลกมาเข้าร่วม และแข่งกันกันแสดงศักยภาพแบบจำลองของตนเอง ซึ่งทีม Visual Geometry Group (VGG) ได้รับรางวัลรองชนะเลิศอันดับ 1 ในปี ค.ศ. 2014 และมีชื่อเสียงมากในวงการนี้ แบบจำลองที่น่าสนใจของ VGG มีชื่อว่า VGG-16 ซึ่งมีการใช้ Convolution network เป็นโครงสร้างหลัก แบบจำลองดังกล่าวสามารถตรวจจับองค์ประกอบของรูปภาพได้ (ขอบ รูปแบบ สไตล์ และอื่นๆ) สถาปัตยกรรมของแบบจำลอง VGG-16 ค่อนข้างซับซ้อน มีเลเยอร์ที่หลากหลายและพารามิเตอร์จำนวนมาก ซึ่งผลลัพธ์ที่ได้แสดงให้เห็นว่า ชั้นประมวลผลที่ซ่อนอยู่ (Hidden layers) ของแบบจำลองสามารถตรวจจับองค์ประกอบในงานแต่ละงานได้ดี แนวคิดการถ่ายทอดการเรียนรู้ กล่าวคือ เลเยอร์ระหว่างกลางภายในแบบจำลองถือเป็นความรู้ทั่วไปที่แบบจำลองได้รับการฝึกอบรม ถ้ามองในมุมของแบบจำลอง VGG-16 ความรู้นั้นคือองค์ประกอบที่เกี่ยวกับภาพ เราสามารถใช้มันเป็นเครื่องมือสร้างแบบจำลองที่มีประสิทธิภาพ ซึ่งสามารถทำได้โดยการนำแบบจำลองที่ผ่านการเรียนรู้แล้ว มาประยุกต์ใช้กับแบบจำลองใหม่ โดยเปลี่ยนเป้าหมายหรือวัตถุประสงค์ของแบบจำลองตามที่ต้องการ ข้อมูลที่นำมาใช้สำหรับการเรียนรู้แบบจำลองใหม่จะมีลักษณะที่แตกต่างออกไปจากแบบจำลองเดิม จึงจำเป็นต้องเรียนรู้ใหม่อีกครั้ง โดยการเรียนรู้ของแบบจำลองครั้งนี้จะใช้ระยะเวลาที่สั้นขึ้น นอกเหนือจากการเรียนรู้แบบจำลองที่เร็วขึ้นแล้ว การถ่ายทอดการเรียนรู้ยังเป็นสิ่งที่น่าสนใจเป็นพิเศษเช่นกัน การถ่ายทอดการเรียนรู้ทำให้ใช้ข้อมูลที่มีการกำกับ (Label) น้อยลง เมื่อเทียบกับชุดข้อมูลขนาดใหญ่ที่ถูกใช้ในการเรียนรู้แบบจำลองตั้งต้น ซึ่งข้อมูลที่มีการกำกับเป็นข้อมูลที่หายากและมีมูลค่าสูง ดังนั้นการถ่ายทอดการเรียนรู้เพื่อสร้างแบบจำลองที่มีคุณภาพโดยไม่ต้องใช้ข้อมูลขนาดใหญ่จึงเป็นที่นิยม การถ่ายทอดการเรียนรู้ในงานด้านภาษา (Transfer Learning in Natural Language Processing, NLP) ความก้าวหน้าในการเรียนรู้เชิงลึกสำหรับ NLP นั้นเติบโตน้อยกว่างานในด้าน Computer vision เนื่องจากคอมพิวเตอร์สามารถเรียนรู้ ขอบภาพ วงกลม สี่เหลี่ยม รูปร่างที่ปรากฏ ว่ามีลักษณะเป็นอย่างไร แล้วนำความรู้นี้ไปทำสิ่งต่าง ๆ แต่ในงานด้านภาษาไม่ได้ตรงไปตรงมาเหมือนงานด้านรูปภาพ ความพยายามแรกเริ่มที่ได้รับความนิยมในการถ่ายทอดการเรียนรู้ของ NLP คือการทำแบบจำลอง word embedding ตัวอย่างเช่น Word2Vec [2] และ Glove [3] ที่นิยมใช้กันอย่างแพร่หลาย การแปลงคำให้เป็นตัวเลขหรือเวกเตอร์นี้ อาศัยบริบทแวดล้อมของคำนั้นๆ เพื่อสร้างการแทนค่าเชิงตัวเลข โดยคำที่มีความหมายใกล้เคียงกันจะมีค่าเวกเตอร์ที่ใกล้เคียงกันด้วย จากบทความ Word2Vec [2] แสดงให้เห็นว่าแบบจำลองสามารถเรียนรู้ความสัมพันธ์ระหว่างชื่อประเทศกับชื่อเมืองหลวงของประเทศได้อย่างแม่นยำ สิ่งนี้ทำให้ Word2Vec ได้รับการยอมรับอย่างกว้างขวางในวงการ NLP นอกจากนี้ ยังเปิดทางให้มีการพัฒนาวิธีการแทนค่า (representation) ของคำ ตัวอักษร และเอกสารที่มีประสิทธิภาพมากขึ้นต่อไป การถ่ายทอดการเรียนรู้ใน NLP นั้นมีข้อจำกัด คือการจัดการกับภาษาที่ต่างกัน เช่น แบบจำลองที่ได้รับการเรียนรู้ด้วยภาษาอังกฤษ จะไม่สามารถที่จะนำไปใช้กับภาษาอื่น ๆ เนื่องจากรูปแบบไวยากรณ์ของแต่ละภาษามีความแตกต่างกัน เมื่อปี 2018 Howard และ Ruder ได้นำเสนอแบบจำลอง Universal Language Model Fine-tuning (ULMFiT) [4] เพื่อเป็นแนวทางในการถ่ายทอดการเรียนรู้สำหรับ NLP แนวคิดหลักของแบบจำลองนี้มาจากแบบจำลองภาษา ซึ่งเป็นแบบจำลองที่สามารถคาดการณ์คำถัดไปโดยพิจารณาจากคำที่มีอยู่ เปรียบเสมือนการใช้โทรศัพท์มือถือรุ่นใหม่ ๆ ที่มีการคาดการณ์คำถัดไปให้ผู้ใช้งานในขณะที่ผู้ใช้งานกำลังพิมพ์ข้อความ ถ้าผลลัพธ์ที่ได้จาการคาดการณ์คำถัดไปของแบบจำลอง NLP ถูกต้อง นั่นหมายความว่า แบบจำลองได้เรียนรู้ และทำความเข้าใจเกี่ยวกับโครงสร้างภาษาเป็นอย่างดี ดังนั้นความรู้ดังกล่าวจึงเป็นจุดเริ่มต้น ในการเรียนรู้แบบจำลองงานอื่น ๆ ที่กำหนดขึ้นเอง ULMFiT ได้ถูกพัฒนาโดยใช้โครงสร้าง ASGD Weight-Dropped LSTM (AWD-LSTM) [5] ซึ่งเป็นหนึ่งในแบบจำลองภาษาที่ได้รับความนิยม และถูกใช้อ้างอิงในเอกสารต่าง ๆ อีกมาก อีกทั้งยังเป็น LSTM ที่ดีที่สุดสำหรับการสร้างแบบจำลองภาษาในปัจจุบัน เมื่อแบบจำลองได้เรียนรู้รูปแบบภาษา มันสามารถนำไปประยุกต์ใช้กับงานอื่น ๆ ได้ แต่การนำไปใช้จริงยังคงต้องการปรับแต่งแบบจำลองเพื่อให้เหมาะสมกับงาน โดยเริ่มจากการฝึกอบรมรูปแบบภาษาสำหรับงานที่ใช้ หลังจากนั้นจึงฝึกอบรมสำหรับการทำงานจริง เช่น การฝึกอบรมให้แบบจำลองการจำแนกประเภท จากภาพที่ 4 การทำงานของ ULMFiT แบ่งออกเป็น 3 ขั้นตอนหลัก ได้แก่ LM pre-training คือการฝึกอบรม ULMFiT สำหรับรูปแบบภาษาทั่วไป ผลลัพธ์ที่ได้ คือแบบจำลองได้รับการเรียนรู้คุณสมบัติทั่วไปของภาษานั้น นอกจากนั้น การ pre-training จะมีประสิทธิภาพยิ่งขึ้นโดยเฉพาะข้อมูลที่มีขนาดเล็ก หรือกลาง LM fine-tuning นั้น เป็น การฝึกอบรม ULMFiT สำหรับรูปแบบภาษาเฉพาะ ผลลัพธ์ที่ได้ คือแบบจำลองที่มีรูปแบบที่เหมาะสม เพื่อใช้กับงานที่มีเป้าหมายแบบเฉพาะเจาะจง Classifier Fine-Tuning จะเป็นการฝึกอบรม ULMFiT สำหรับงานนั้น จากการทดสอบประสิทธิภาพในบทความ ULMFiT [4] พบว่าการใช้รูปแบบภาษาที่ได้รับการฝึกอบรมมาก่อน ทำให้การสร้างแบบจำลองจำแนกประเภทใช้ข้อมูลน้อยลง เช่น ผลลัพธ์จากการวิเคราะห์ IMDb ด้วยข้อมูลเพียง 100 ข้อมูล (เส้นสีเขียว) สามารถลดอัตราการผิดพลาดของแบบจำลองได้เทียบเท่ากับแบบจำลองที่ได้รับการฝึกอบรมด้วยข้อมูล 20,000 ข้อมูล (เส้นสีน้ำเงิน) ดังแสดงในรูปภาพที่ 5 และทั้งหมดนี้คือภาพรวมของการถ่ายทอดการเรียนรู้ที่สามารถนำไปใช้ในด้านการประมวลผลภาษา ความก้าวหน้าที่ได้รับจาก ULMFiT ได้ส่งเสริมการวิจัยในการถ่ายทอดการเรียนรู้สำหรับ...

8 August 2024

บทความ

Big Data 101

จาก Log สู่ข้อมูลเชิงลึก: พลังของ Log Parser ขจัดปัญหา Log ยุ่งเหยิง วิเคราะห์ข้อมูลรวดเร็ว

Log เป็นข้อมูลที่ได้มาจากระบบคอมพิวเตอร์ ซึ่งทำหน้าที่ในการบันทึกรายละเอียดข้อมูลการทำงานต่าง ๆ ของระบบ ช่วยให้ผู้พัฒนาและผู้ดูแลระบบสามารถเข้าใจการทำงานของระบบ วิเคราะห์พฤติกรรมที่ผิดปกติและสามารถแก้ไขได้อย่างทันท่วงที ในระบบที่มีขนาดใหญ่ขึ้นทำให้ปริมาณของ Log นั้นเพิ่มตามไปด้วย การอ่านข้อมูล Log ทั้งหมดด้วยตนเองจึงทำได้ยาก Log parser จึงเข้ามาช่วยแก้ปัญหาตรงนี้ โดย Log parser นั้นจะทำให้ข้อมูล Log ที่ไม่มีโครงสร้างชัดเจน กลายเป็น Log template ที่มีโครงสร้างมากขึ้นกว่าเดิมได้ การสร้าง Log จากในระบบคอมพิวเตอร์นั้น จำเป็นต้องมี Template ที่มนุษย์เขียนให้ เช่น “Sending <*> quality objects” จะเห็นได้ว่า Template ดังกล่าวมีช่องว่าง (Placeholder) ที่ด้วยสัญลักษณ์ “<*>” ให้คอมพิวเตอร์สามารถเติมค่าต่าง ๆ ที่เรียกกว่า Parameter ลงไปได้ ซึ่งจาก Template ดังกล่าวสามารถสร้างเป็น Log ได้หลายรูปแบบดังนี้ จะเห็นได้ว่าจาก Template เพียงอันเดียว สามารถสร้าง Log ที่แตกต่างกันได้จำนวนนับไม่ถ้วน การทำงานของ Log parser นั้นเสมือนกันการทำย้อนกลับจากสิ่งที่กล่าวไปข้างต้น Log parser จะทำหน้าที่แยก Parameter และ Template ออกจากกัน ทำให้การวิเคราะห์ Template ที่มีจำนวนไม่มากนักนั้นทำได้ง่ายกว่า Log parser approaches การทำ Log parser นั้นสามารถทำได้หลายวิธี ซึ่งสามารถแบ่งได้ตามยุคสมัยดังนี้ Rule-based pattern matching เนื่องจากในบางครั้ง Parameter ของ Log มักจะมีลักษณะที่ตายตัว เช่น IP, Email, ตัวเลข, เวลา เป็นต้น ทำให้เราสามารถเขียนเป็นกฏในการแยก Paremeter ในแต่ละรูปแบบออกมาได้ โดยการใช้ Regular Expressions (Regex) เช่น ข้อดี ข้อเสีย Heuristic-based ในกรณีที่ข้อมูล Log เริ่มมีขนาดใหญ่ขึ้น การทำ Rule-based pattern matching จึงเริ่มทำได้ยาก แต่อย่างไรก็ตามข้อมูล Log ที่มาจาก Template เดียวกันนั้น ถ้านำมาเปรียบเทียบกันในระดับคำต่อคำนั้น จะพบว่าในบางส่วนจะมีตัวอักษรที่เหมือนกัน 100% ซึ่งส่วนนั้นจะมาจาก Template ที่เรากำหนดไว้ตั้งแต่ต้น และอีกส่วนที่ไม่เหมือนกันจะเป็น Parameter ที่ถูกใส่เข้าไปใน Template เพื่อใช้สร้าง Log ด้วยแนวคิด Heurictic นี้ถ้าเราสามารถแยกได้ว่า Log ใดอยู่ Template เดียวกันได้อย่างแม่นยำ จะได้สามารถแยกส่วนที่เป็น Template กับ Parameter ออกจากกันได้อย่างง่ายดาย ทำให้มี Algorithm จำนวนมากถูกสร้างขึ้นมาโดยมีพื้นฐานจากแนวคิดดังกล่าว เช่น Drain, Prefix-graph Drain Drain (He et al., 2017) เป็น Algorithm ในการ Parse log โดยใช้ต้นไม้ความลึกคงที่ (Fixed depth tree) ซึ่งโครงสร้างของต้นไม้จะใช้เพื่อค่อยแยกแต่ละ Template ออกจากกัน จากที่แสดงในรูปที่ 1 จะเห็นว่า Template ของ Log จะถูกเก็บอยู่ที่ใบ (Leaf node) ของต้นไม้ แม้ว่าในแต่ละใบอาจจะมีมากกว่าหนึ่ง Template แต่การใช้โครงสร้างดังกล่าวเป็นการลดจำนวน Template ที่จำเป็นต้องคำนึงในแต่ละรอบการวิเคราะห์ Log ได้ การ Parse log โดยใช้ Drain นั้นจะเริ่มที่ราก (Root node) ของต้นไม้ จากนั้นเดินทางตามทิศทางของกิ่งต้นไม้ที่ตรงตามเงื่อนไขของ Log ที่มีไปเรื่อยๆ จนกว่าจะถึงใบ หลังจากนั้นจะเป็นการค้นหาต่อว่า Log ใหม่ที่ถูกใส่เข้ามานั้นมีความคล้ายกับ Template ใดที่อยู่ในใบนั้นมากที่สุด ซึ่งสามารถแบ่งเป็น 2 กรณี ข้อดี ข้อเสีย Machine-learning-based ในบางกรณีการใช้กฏทั่วไปอาจจะไม่ครอบคลุมข้อมูล Log ที่เกิดขึ้น และวิธีแบบ Heuristic อาจจะยังไม่ได้รับมือกับ Log ที่มีความซับซ้อนสูงได้ การใช้โมเดลที่ผ่านการเรียนรู้จากข้อมูล Log จำนวนมากจึงเป็นอีกแนวทางหนึ่งที่ทำได้ ข้อสังเกตของการใช้ Machine learning คือ จำเป็นต้องมีชุดข้อมูลสำหรับสอนโมเดล ในกรณี Log นั้นอาจจะมีจำนวนข้อมูลมากก็จริง แต่ก็ไม่มีการกำกับข้อมูลว่า Log นั้นอยู่ใน Template ใด และด้วยจำนวนข้อมูลที่มหาศาลทำให้การสร้างชุดข้อมูลนั้นอาจทำได้ยาก ดังนั้นวิธีการใช้ Machine learning ที่จะกล่าวต่อไปนี้ทั้งหมดจะเป็นวิธีที่ไม่จำเป็นต้องใช้ชุดข้อมูลที่มีการกำกับแล้ว หรือใช้เพียงเล็กน้อยเท่านั้น LogStamp LogStamp (Tao et al. 2022) เป็นโมเดลที่สามารถเรียนรู้ได้เองโดยไม่จำเป็นต้องกำกับข้อมูล ซึ่งการทำงานของ LogStamp นั้นเป็นไปดังรูปที่ 2 เริ่มจาก Historical logs หรือคือข้อมูล Log ที่มีอยู่ โดยไม่มีการกำกับข้อมูล ข้อมูลดังกล่าวจะถูกนำไปหา Sentence embedding และ Word embedding ผ่านการใช้ Bidirectional Encoder Representations from Transformers (BERT) ซึ่งเป็นโมเดลทางภาษาที่ใช้กันอย่างแพร่หลายมากในช่วงปี 2018 ซึ่งการหา Embedding นั้นเหมือนเป็นการวิเคราะห์ความหมายของ Log โดยใช้โมเดลทางภาษา ผลลัพธ์ที่ได้จะเป็น Vector ที่สามารถนำมาคำนวนทางคณิตศาสตร์ได้ ซึ่ง Sentence embedding ที่ได้ออกมานั้นจะเป็นความหมายถึง Log ในระดับประโยค ซึ่งจะถูกนำไปใช้ในการจับกลุ่ม (Clustering) กลุ่มที่ได้นั้นจะถูกตีความว่าเป็น Template ของ Log ดังกล่าวทันที ซึ่ง Log ที่อยู่ในกลุ่มเดียวกัน ก็คือเกิดมาจาก Template...

25 March 2024

บทความ

Big Data 101

การปรับค่าความน่าจะเป็นเพื่อความเชื่อถือในการทำนาย Probability Calibration

ในบางครั้งการสร้างโมเดลทำนาย เราไม่ได้สนใจเพียงแค่ว่าสิ่งทีทำนายออกมาจะเป็น class อะไร แต่สนใจไปถึงโอกาสหรือความน่าจะเป็นของผลการทำนายเพื่อจะเอาไปคำนวณ risk หรือ expected value อื่น ๆ ต่อไป เชื่อว่าชาว data sci หลาย ๆ คน ถ้าอยากได้ผลการทำนายเป็น probability จะต้องเคยใช้ method .predict_proba ของ scikit learn อย่างแน่นอน แต่รู้หรือไม่ว่าจริง ๆ แล้ว prob ที่ได้จาก model บางประเภทนั้น มันไม่ตรงกับความเป็นจริง เช่น random forest ที่ใช้ probability เป็นสัดส่วนของจำนวน tree ที่ทำนาย class นั้น ๆ ออกมาต่อจำนวน tree ทั้งหมด ซึ่งจะแตกต่างจากโมเดลที่พยายามเรียนรู้และปรับค่า prob โดยตรงจากข้อมูลอย่าง neural network หรือ logistic regression หรือที่ปัญหาที่เรากำลังทำอยู่อาจจะ imbalance และซึ่งเราอาจะมีการ under, upsampling ระหว่างทำก็อาจจะทำให้โมเดลให้ค่า prob ได้ไม่ตรงกับความเป็นจริงเช่นเดียวกัน Reliability Curve แล้วที่บอกว่า prob มันไม่ตรง มันดูยังไง ก่อนอื่นเลย เราจะแนะนำให้ทุกท่านรู้จักกับกราฟนึงที่ชื่อว่า reliability curve (หรือ calibration curve) ซึ่งถ้าเอาโดยย่อมันคือการเทียบเลยว่า prob ที่โมเดลทำนายกับ prob ที่เกิดจริงใน test set ตรงกันรึเปล่า โดยที่ reliability curve วิธีทำมันก็ง่าย ๆ ดังแสดงในขั้นตอนด้านล่าง หรือที่จริงถ้าใช้ sklearn ก็เรียก function sklearn.calibration.calibration_curve ได้เลย โดยที่ถ้าหาก probability ที่โมเดลเราทำนายออกมามันตรงกับความจริง กราฟควรจะเป็นเส้นตรงตามแนวเส้นทแยงมุม แต่ถ้าโมเดลมันให้ prob ไม่ตรงเส้นมันก็จะไม่ค่อยอยู่ตรงเส้นทแยงมุมเท่าไหร่ ตัวอย่างดังรูปด้านล่าง โดยสรุปก็คือโมเดลที่สร้างเส้นนี้มักจะทายค่าแบบกลาง ๆ เช่น ระหว่าง 0.4-0.6 แต่จะไม่ค่อยมั่นใจแบบทาย prob ที่ 0 หรือ 1 เลย How to Measure The Preciseness of Probability โดยวิธีการวัดว่าโมเดลเราให้ prob ได้เพี้ยนมากน้อยเท่าไหร่สามารถวัดได้ด้วย Brier score ดังสูตรด้านล่าง ซึ่งมันก็เป็นแค่การลบ โดยถ้าหาก Brier score มีค่ามากแสดงว่าโมเดลเราเพี้ยนเยอะ โดยตัวแปร Calibration Method โดยที่เราสามารถปรับ probability ให้ตรงกับความเป็นจริงได้ด้วยการทำ probability calibration นั่นเอง โดยการทำ probability calibration นั้นจะนับว่าเป็นการทำ post processing หรือเป็นกระบวนการที่เกิดขึ้นหลังจากเรา train AI model เรียบร้อยแล้ว ซึ่งการทำ probability calibration นั้นควรจะทำบน validation set เนื่องจากว่าบน training set นั้นมีโอกาสที่ model เราจะ overconfidence อยู่แล้ว เพราะมันเคยเห็นคำตอบมาก่อนหน้าแล้ว โดยที่การทำ probability calibration นั้นจะมี algorithm อยู่หลายอันด้วยกัน แต่ในบทความนี้จะยกตัวอย่างสองวิธี ได้แก่ platt scaling และ isonotic regression Platt Scaling ใช้เมื่อกราฟ reliability curve ของโมเดลหน้าตาเหมือน sigmoid function (เส้นสี xxx ในภาพที่ xxx ด้านบน) ซึ่งโดยตั้งต้นแล้วตัวมันเองก็ถูกคิดค้นขึ้นมาเพื่อ map ระหว่างผลลัพธ์ของโมเดล SVM (ที่มีค่าระหว่าง -inf ไปถึง +inf) ไปเป็น probability (ที่มีค่าระหว่าง 0 ถึง 1) ซึ่งถ้าเราคุ้นเคยกับการใช้งานแบบนี้มาก่อนจะนึกได้ว่าที่จริงมันคือ sigmoid function เลยนี่นา ซึ่งถ้าพูดให้ถูกตัว Platt scaling มันเหมือน sigmoid function ที่เป็นสามารถเรียนรู้จากข้อมูลได้ โดยจะเห็นได้ว่าสมการของมันจะมีหน้าตาที่คล้าย sigmoid function พอสมควร โดยจากสมการนั้น โดยข้อดีของ Platt Scaling นั้นคือมันใช้ข้อมูลที่น้อย (น้อยกว่า isotonic regression ที่จะกล่าวถึงต่อไป) ก็สามารถให้ผลลัพธ์การ calibrate ที่ดีได้ แต่ข้อเสียคือไม่ค่อย flexible กล่าวคือจะทำงานได้ดีกับโมเดลที่ให้ probability บน reliability curve แบบ sigmoid เท่านั้น Isotonic Regression ในส่วนของ Isotonic Regression นั้นค่อนข้างจะ flexible กว่าตัวของ Platt Scaling ตรงที่สามารถทำงานบน reliability curve แบบใดก็ได้ แต่ก็ต้องแลกมาด้วยการใช้ข้อมูลจำนวนที่มากกว่าในการ fit ตัวมัน (มี dataset สำหรับ calibrate probability มากกว่า 1,000 จุด) โดยตัวมันเองจะมี function เหมือนขั้นบันได ที่จะค่อย ๆ ปรับความยาวแต่ละขั้น และไล่ขึ้นไปให้ map ค่า prob ที่ไม่ตรงกับความเป็นจริงให้ใกล้ความเป็นจริงมากที่สุด (ใกล้เส้นทแยงมุมมากที่สุด) จากภาพอาจจะพอทำให้เห็นภาพได้ว่าทำไมเราจึงต้องการข้อมูลจำนวนมากเพื่อ fit isotonic regression จะเห็นได้ว่าถ้าหากมีจำนวนข้อมูลน้อยเราอาจจะแบ่งออกมาสร้างได้ไม่กี่ bin ตัวบันไดเราก็จะมีไม่กี่ขั้นแล้วก็ไม่ค่อย smooth นั่นเอง บทความโดย ธรรมสรณ์ หาญผดุงกิจตรวจทานและปรับปรุงโดย นววิทย์ พงศ์อนันต์ ศึกษาเพิ่มเติมได้ที่...

21 March 2024

บทความ

Movements

ความตื่นตัวของหุ่นยนต์ที่ปรึกษาด้านการเงิน

ใครที่อยากลงทุน แต่ไม่รู้จะเริ่มยังไง ไม่ต้องกังวลอีกต่อไปเพราะตอนนี้เรามี Robo-Advisor หรือ A.I. ที่จะมาทำหน้าที่เป็นที่ปรึกษาด้านการลงทุน

13 October 2023

บทความ

Data for Business

Richemont ใช้เทคโนโลยี AI อย่างไรเพื่อยกระดับการบริการลูกค้าให้ดีขึ้น

ลองมาดูว่าบริษัทแบรนด์หรูสัญชาติสวิสที่ใหญ่ที่สุดอย่าง Richemont นำเทคโนโลยี AI เข้ามาช่วยดูแลลูกค้าอย่างไร

3 March 2023

บทความ

Movements

Quantitative Hedge Fund สร้างผลตอบแทนเหนือตลาด จากข้อมูลมหาศาลได้อย่างไร?

หลาย ๆ ท่านที่สนใจด้านการลงทุน คงจะรู้จักหลักการลงทุนอย่าง Value Investing (VI) ซึ่งเป็นหลักการลงทุนที่นักลงทุนที่ประสบความสำเร็จระดับโลก อย่าง Warren Buffet, Peter Lynch, Charlie Munger และอื่น ๆ อีกหลายท่าน ยึดถือ ปฏิบัติ และ เผยแพร่ต่อสาธารณะชน มาเป็นระยะเวลายาวนานหลายสิบปี หลักการลงทุนที่ดูแสนเรียบง่ายนี้ มักจะเน้นไปที่การศึกษา ทำความเข้าใจ และประเมินมูลค่าธุรกิจ (หุ้น) ผ่านการประเมินปัจจัยเชิงคุณภาพต่าง ๆ เช่น ความได้เปรียบในการแข่งขัน การเข้ามาของคู่แข่งรายใหม่ อำนาจต่อรองของบริษัท พฤติกรรมของผู้บริโภค ประกอบกับการประเมินปัจจัยเชิงปริมาณ เช่น รายได้ และกำไรในอนาคตของกิจการ ซึ่งจะสะท้อนการเติบโตของกำไรในอนาคต เพื่อนำมาใช้ประกอบการตัดสินใจในการลงทุน ซึ่งล้วนต้องอาศัยการศึกษาวิจัย วิเคราะห์ข้อมูลปริมาณมาก เพื่อทำความเข้าใจสินทรัพย์นั้น ๆ รายตัวอย่างละเอียด Quant Fund ใช้กลยุทธ์อะไร วิธีการดังกล่าวนี้ แตกต่างอย่างสิ้นเชิงกับกับที่ Quant Fund (Quantitative Hedge Fund) อย่าง Renaissance Technologies, Citadel, Two Sigma และอื่น ๆ เลือกใช้ ซึ่งจะเน้นไปที่การสร้าง และใช้อัลกอริทึม เพื่อทำการตัดสินใจ ซื้อขาย หลักทรัพย์ต่าง ๆ โดยอัตโนมัติ ตามกลยุทธ์ต่าง ๆ ยกตัวอย่างเช่น จากตัวอย่างทั้งสามวิธีข้างต้น จะเห็นได้ว่า หลักการในการลงทุน และตัดสินใจซื้อขายหลักทรัพย์ ของ Quant Fund นั้นล้วนต้องเริ่มต้นจากข้อมูลปริมาณมหาศาล ไม่ว่าจะเป็นข้อมูลทั่ว ๆ ไปเกี่ยวกับ ราคาหลักทรัพย์ และปริมาณการซื้อ ขาย ย้อนหลังหลายสิบปี, ข้อมูลปัจจัยพื้นฐานของบริษัท และกลุ่มธุรกิจ อุตสาหกรรมต่าง ๆ , ข้อมูลตัวเลขดัชนีชี้วัดเศรษฐกิจมหภาค เช่น GDP, อัตราเงินเฟ้อ, อัตราดอกเบี้ย เป็นต้น รวมทั้งยังใช้ ข้อมูลอื่น ๆ ที่กองทุนทั่วไป มักไม่ได้ให้ความสำคัญ เช่น ข้อมูลภาพถ่ายจากดาวเทียม/ภาพถ่ายทางอากาศ ซึ่งจะถูกนำมาประมวลผล เพื่อตรวจเช็ค และติดตามการเคลื่อนไหวของกิจกรรมทางเศรษฐกิจ เช่น การดำเนินงานของบริษัท ห้างร้าน หรือการเพาะปลูก เก็บเกี่ยว สินค้าโภคภัณฑ์ ต่าง ๆ หรือ ข้อมูลการสัญจรทางถนน เพื่อวัดระดับกิจกรรมทางเศรษฐกิจ และการขนส่ง เป็นต้น Quantitative Trading มีวิธีการอย่างไร ข้อมูลมหาศาลเหล่านี้ จำเป็นต้องถูกจัดการด้วยเทคนิคทางวิทยาศาสตร์ข้อมูล เช่น การทำความสะอาด หรือ การจัดการข้อมูลที่ผิดปกติ ซึ่งหากไม่ได้รับการจัดการ อาจส่งผลต่อประสิทธิภาพของโมเดล จากนั้นจึงทำการเตรียมความพร้อมข้อมูลก่อนที่จะนำข้อมูลเหล่านี้ ไปใช้ประกอบกลยุทธ์ต่าง ๆ เพื่อสร้างโมเดลหาสัญญาณซื้อ ขาย จากชุดข้อมูลที่มี และสร้างระบบอัลกอริทึมซื้อขายหลักทรัพย์ ซึ่งจะต้องผ่านการ Backtesting หรือการทดสอบระบบซื้อขาย ด้วยชุดข้อมูลในอดีตย้อนหลังหลายปี เพื่อตรวจสอบประสิทธิภาพของกลยุทธ์ที่ใช้ ด้วยตัวชี้วัดต่าง ๆ เช่น Quant Fund ประยุกต์ใช้วิทยาศาสตร์ข้อมูลอย่างไร เช่นเดียวกับหลักการในวิทยาศาสตร์ข้อมูล เราจำเป็นต้องแบ่งชุดข้อมูลที่ใช้สร้างโมเดลการซื้อขาย ออกเป็น training set, validation set, และ test set โดยจะทำการสอนโมเดลด้วย training set หลังจากนั้นจึงทำ hyper-parameter tuning และทำการคัดเลือกโมเดลโดยใช้ validation set สุดท้ายจึงทำการทดสอบโมเดลด้วย test set ซึ่งเป็นข้อมูลที่โมเดลไม่เคยเจอมาก่อน หลังจากได้โมเดลที่ยอดเยี่ยมแล้ว จะเป็นการนำโมเดลที่ได้มาสร้างโปรแกรมซื้อขายหลักทรัพย์ โดยขั้นตอนนี้ เรื่องของความเร็วของการประมวลผลโปรแกรม และความเร็วในการเชื่อมต่อ และดำเนินการซื้อขาย จะมีผลอย่างมาก หลังจากนั้นจะเป็นเรื่องของการติดตามการทำงานของโมเดล และเพิ่มประสิทธิภาพการทำงานของโมเดล ให้มีผลตอบแทนที่สูงขึ้น และลดความเสี่ยงจากปัจจัยต่าง ๆ ไม่ว่าจะมาจากตัวกลยุทธ์ที่ใช้ จากวิกฤตในตลาด หรือจากตัวโปรแกรมซื้อขายที่สร้างขึ้นมา บทส่งท้าย จะเห็นได้ว่าหลักการในวิทยาศาสตร์ข้อมูล นอกจากจะสามารถนำมาประยุกต์ใช้ในธุรกิจต่าง ๆ เพื่อสร้างความเข้าใจเชิงลึก หรือสร้างโมเดลที่ตอบโจทย์มากมายได้แล้ว เมื่อนำมาประยุกต์ใช้ในโลกของการลงทุน สามารถสร้างผลตอบแทนเหนือตลาด ได้เป็นระยะเวลายาวนาน โดยตัวอย่างที่โด่งดังที่สุด คงหนีไม่พ้น The Medallion Fund ซึ่งบริหารโดย Renaissance Technologies ที่สามารถสร้างผลตอบแทนทบต้นต่อปี สูงถึง 71.8% (ก่อนหักค่าบริหารกองทุน) ระหว่างปี 1994 ถึงปี 2014 โดยความน่าสนใจของ Renaissance Technologies คือเป็น Hedge Fund ที่ประกอบไปด้วย นักคณิตศาสตร์ และนักวิทยาศาสตร์จำนวนมาก โดยที่พนักงานส่วนใหญ่ ไม่ได้มีพื้นฐานมาจากสายการเงิน เหมือนกองทุนทั่ว ๆ ไป บทความโดย ปิ่นพงศ์ สุขแก้วตรวจทานและปรับปรุงโดย ดวงใจ จิตคงชื่น

6 February 2023

รู้จัก BDI

Organization

Policy and Plan

Personnel

Operations