Data Analysis

Data Analysis

ข่าวและบทความที่เกี่ยวข้อง

Related news and articles

PostType Filter En

บทความ

รมว.ดีอีเอส ติดตามความคืบหน้าการพัฒนาแพลตฟอร์มข้อมูลอัจฉริยะ Travel Link
ชูความสำเร็จของการใช้ประโยชน์จากข้อมูลขนาดใหญ่ เพิ่มมูลค่าการท่องเที่ยวไทย 28 มิถุนายน 2566, กรุงเทพมหานคร – รัฐมนตรีว่าการกระทรวงดิจิทัลฯ ติดตามความคืบหน้าและผลสำเร็จการพัฒนาแพลตฟอร์มข้อมูลอัจฉริยะ “Travel Link: เชื่อม (ข้อมูล) ท่องเที่ยวให้ถึงกัน” โดย สถาบันส่งเสริมการวิเคราะห์และบริหารข้อมูลขนาดใหญ่ภาครัฐ (GBDi) หรือ สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) (BDI) ในปัจจุบัน ชูความสำเร็จของการเชื่อมโยงความร่วมมือจากมากกว่า 20 หน่วยงาน รวบรวมชุดข้อมูลอ้างอิงมากกว่า 100 ชุด มีข้อมูลแหล่งท่องเที่ยวไทยมากกว่า 14,000 แหล่ง พร้อมขยายผลสู่การบริการด้านข้อมูลขนาดใหญ่เพื่อยกระดับอุตสาหกรรมการท่องเที่ยวของประเทศ นายชัยวุฒิ ธนาคมานุสรณ์ รัฐมนตรีว่าการกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม (ดีอีเอส) พร้อมคณะร่วมติดตามความคืบหน้าและผลสำเร็จภายใต้การพัฒนาแพลตฟอร์มข้อมูลอัจฉริยะ “Travel Link: เชื่อม (ข้อมูล) ท่องเที่ยวให้ถึงกัน” โดยมี รศ.ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI คณะทำงานโครงการ Travel Link นายอนุกูล จันทร์จรัส ผู้อำนวยการศูนย์เทคโนโลยีสารสนเทศและการสื่อสาร สำนักงานปลัดกระทรวงการท่องเที่ยวและกีฬา พร้อมทีมงาน และ นายภูมิกิตติ์ รักแต่งาม ประธานที่ปรึกษาสมาคมธุรกิจการท่องเที่ยวจังหวัดภูเก็ต ร่วมให้การต้อนรับและรายงานผลการดำเนินงาน นายชัยวุฒิ เปิดเผยว่า กระทรวงดิจิทัลฯ ให้ความสำคัญกับการขับเคลื่อนให้เกิดการใช้ประโยชน์อย่างสูงสุดจากข้อมูลขนาดใหญ่ (Big Data) โดยความคืบหน้าการดำเนินงานของแพลตฟอร์มข้อมูลอัจฉริยะ “Travel Link: เชื่อม (ข้อมูล) ท่องเที่ยวให้ถึงกัน” แสดงให้เห็นความสำเร็จอีกขั้นในการบูรณาการการทำงานระหว่างรัฐและเอกชน ผสานเข้ากับเทคโนโลยีเพื่อการจัดการข้อมูลก่อนเชื่อมโยงไปสู่การใช้งานจริง โดยอาศัยความรู้ความสามารถของคนรุ่นใหม่ในการพัฒนาแพลตฟอร์มดังกล่าวขึ้น ทำให้เชื่อมั่นได้ว่า ประเทศไทยจะสามารถใช้ประโยชน์จากข้อมูลขนาดใหญ่ในการเพิ่มมูลค่าให้กับภาคอุตสาหกรรมต่าง ๆ ได้มากขึ้น อีกทั้งเป็นการกระตุ้นเศรษฐกิจและสังคมของประเทศอย่างต่อเนื่อง ทั้งนี้ เมื่อวันที่ 2 มิถุนายนที่ผ่านมา ราชกิจจานุเบกษาเผยแพร่ พระราชกฤษฎีกาจัดตั้งสถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) พ.ศ. 2566 โดยมีวัตถุประสงค์เพื่อให้เกิดการใช้ข้อมูลขนาดใหญ่ทั้งภาครัฐและภาคเอกชนเป็นกลไกสำคัญในการพัฒนาระบบเศรษฐกิจและสังคมของประเทศเกิดการบูรณาการข้อมูลขนาดใหญ่ของหน่วยงานของรัฐและเอกชนสำหรับการแก้ไขปัญหา การเพิ่มประสิทธิภาพการดำเนินงาน และการให้บริการการตัดสินใจในการกำหนดนโยบายเพื่อเศรษฐกิจและสังคม ซึ่งนับเป็นการเตรียมความพร้อมการขับเคลื่อนประเทศอย่างมั่นคงในอีกขั้น ด้าน รศ.ดร.ธีรณี กล่าวว่า แพลตฟอร์มข้อมูลอัจฉริยะ “Travel Link: เชื่อม (ข้อมูล) ท่องเที่ยวให้ถึงกัน” เป็นหนึ่งในโครงการที่ GBDi เริ่มต้นพัฒนาขึ้น โดยความร่วมมือกับ กระทรวงการท่องเที่ยวและกีฬา เพื่อขับเคลื่อนอุตสาหกรรมการท่องเที่ยวของประเทศไทย ปัจจุบันมีการบูรณาการข้อมูลและแลกเปลี่ยนข้อมูลด้านการท่องเที่ยวจากทุกภาคส่วนที่เกี่ยวข้องมากกว่า 20 หน่วยงาน อาทิ ข้อมูลสถานที่ท่องเที่ยว โรงแรม อัตราการเข้าพัก ฯลฯ เกิดชุดข้อมูลอ้างอิง (Data Catalog) มากกว่า 100 ชุด มีข้อมูลแหล่งท่องเที่ยวไทยมากกว่า 14,000 แหล่ง เพื่อเป็นฐานข้อมูลกลางในการให้บริการ นอกจากนี้ยังมีการสำรวจเพื่อให้เข้าใจความต้องการของผู้ใช้ ไม่ว่าจะเป็นกลุ่มผู้ประกอบการหรือนักท่องเที่ยว ว่ามีข้อมูลใดบ้างที่ให้ความสนใจ เช่น จำนวนและพฤติกรรม เป็นต้น โดยวิธีการศึกษาจะเป็นการศึกษาเชิงคุณภาพ มีการสัมภาษณ์เชิงลึก มุ่งทำความเข้าใจพฤติกรรมในบริบทและมุมมองที่หลากหลาย โดยผู้ประกอบการด้านการท่องเที่ยว หน่วยงานต่าง ๆ รวมถึงประชาชนที่สนใจสามารถเข้าถึงชุดข้อมูลได้ผ่าน https://www.travellink.go.th/ ซึ่งถือเป็นอีกหนึ่งความสำเร็จของ BDI ในการขับเคลื่อนการใช้ประโยชน์จากข้อมูลขนาดใหญ่ที่เกิดจากการทำงานของกลุ่มคนรุ่นใหม่ “BDI มีความพร้อมอย่างยิ่งในการเป็นกลไกสำคัญที่จะขับเคลื่อนให้เกิดการใช้ประโยชน์จากข้อมูลขนาดใหญ่ด้วยความสามารถของบุคลากรคนรุ่นใหม่ที่มีความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลและปัญญาประดิษฐ์ เข้าใจเทคโนโลยีอุบัติใหม่ รวมถึง Business Domain ต่าง ๆ ของรัฐ และมีประสบการณ์ด้านข้อมูลเพื่อการวางแผนของภาครัฐพัฒนาเป็นแพลตฟอร์มสำคัญด้านการท่องเที่ยวของไทย โดย BDI จะเป็นแรงขับเคลื่อนสำคัญในการยกระดับเศรษฐกิจและสังคมของประเทศให้เข้มแข็งยิ่งขึ้น” ผู้อำนวยการ BDI กล่าว พร้อมกันนี้ นายชัยวุฒิ ยังได้ร่วมพูดคุยถึงการดำเนินงานด้านข้อมูลขนาดใหญ่ในโครงการต่าง ๆ โดยนอกเหนือจากแพลตฟอร์มข้อมูลอัจฉริยะ Travel Link แล้ว BDI ยังได้บูรณาการการทำงานไปแล้วกว่า 100 โครงการกับ 67 หน่วยงาน รวมถึงการพัฒนาแพลตฟอร์มเชื่อมโยงข้อมูลสุขภาพ (Health Link) ระบบเชื่อมโยงข้อมูลเด็กและเยาวชน (Youth Link) และระบบเชื่อมโยงข้อมูลเพื่อการบริหารสถานการณ์การแพร่ระบาดของโรคติดเชื้อไวรัสโควิด-19 (CO-Link) #depaThailand #BDI #BigDataInstitute #TravelLink #GBDi #BigData #MDES #PhuketTouristAssociation #PTA #สมาคมธุรกิจการท่องเที่ยวจังหวัดภูเก็ต
29 June 2023

บทความ

Computational Psychology ศาสตร์ใหม่เรียนรู้ใจจากข้อมูล
Computational Psychology คืออะไร คำว่า Computational Psychology ถึงแม้ว่าราชบัณฑิตจะบัญญัติภาษาไทยไว้ว่า จิตวิทยาคอมพิวเตอร์ [1] แต่ผู้เขียนคิดว่าความหมายที่สื่อความได้ดีกว่าน่าจะเป็น จิตวิทยาเชิงคำนวณ คือ การศึกษาจิตวิทยาด้วยกระบวนวิธีการคำนวณและวิเคราะห์จากข้อมูลจำนวนมากต่าง ๆ ที่ผ่านมา การศึกษาด้านจิตวิทยาจะใช้การเก็บข้อมูลจากแบบสอบถามหรือบันทึกจากการทดลอง แล้วนำสถิติมาใช้ในการแปลผลข้อมูลเหล่านั้น ด้วยความที่การแจกแบบสอบถามและการทดลองใช้เวลามาก ต้นทุนสูง ข้อมูลที่เก็บได้จึงมีจำนวนไม่มากนัก อีกทั้งส่วนใหญ่ผู้ถูกศึกษายังจำกัดอยู่ในประชากรกลุ่มเล็ก บ่อยครั้งผลการศึกษาที่ได้มานั้นมักปรับใช้ได้กับบางบริบทเท่านั้น ในวงการวิชาการมีคำกล่าวว่างานวิจัยด้านจิตวิทยาในยุคก่อนนั้นมีความ WEIRD ซึ่งย่อมาจาก Western-Educated-Industrialized-Rich-Democratic เรียกอีกอย่างว่าเป็นงานวิจัยที่ทำกับ ทำโดยและทำเพื่อชาวตะวันตกในประเทศอุตสาหกรรมที่ร่ำรวยและอยู่ในสังคมประชาธิปไตย ทำให้เกิดคำถามว่าผลการศึกษาเหล่านั้นสามารถปรับใช้กับคนได้ทั่วโลกจริงหรือ ทว่าในปัจจุบัน ด้วยเทคโนโลยีอินเทอร์เน็ต และความก้าวหน้าด้าน Big Data และ ปัญญาประดิษฐ์ AI ต่าง ๆ (ในบทความนี้ขอกล่าวรวม Machine Learning เป็นส่วนหนึ่งของ AI) ทำให้เราสามารถเก็บข้อมูลได้ง่ายขึ้น ไม่ว่าจะผ่านแบบสอบถามออนไลน์ ผ่านเครื่องมือ Crowdsourcing ทำให้เข้าถึงกลุ่มเป้าหมายได้หลากหลาย หรือจะเป็นการเก็บข้อมูลจากพฤติกรรมดิจิทัลที่สามารถบันทึกได้โดยอัตโนมัติ ไม่ต้องสิ้นเปลืองเวลาของอาสาสมัครวิจัย อีกทั้งยังสามารถวิเคราะห์ผลจากข้อมูลจำนวนมาก ด้วยกรรมวิธีการที่ซับซ้อนกว่าเดิมจึงทำให้เกิดความเข้าใจเชิงลึกซึ่งไม่สามารถทำได้ในสมัยก่อน ตัวอย่างงานวิจัยและการประยุกต์ใช้ Computational Psychology สุดปัง เล่ามาถึงตรงนี้แล้ว หลายคนอาจจะยังนึกภาพไม่ออกว่าวิทยาการทางคณิตศาสตร์ คอมพิวเตอร์ หรือวิศวกรรมต่าง ๆ จะเอามาใช้ศึกษาจิตใจคนได้อย่างไร จึงขอยกตัวอย่างการใช้ศาสตร์แขนงนี้ทั้งในงานวิจัยและที่อาจพบเจอในชีวิตประจำวัน งานวิจัยที่ผู้เขียนคิดว่าพลาดไม่ได้เลย และเป็นงานวิจัยชิ้นที่ทำให้ผู้เขียนพาตัวเองเข้าสู่วงการนี้ คือการที่ข้อมูลเพจ Facebook ที่เราไปกดถูกใจ (Facebook Likes) สามารถบ่งบอกลักษณะต่าง ๆ เกี่ยวกับตัวเราได้ ไม่ว่าจะเป็นเพศสภาพ เชื้อชาติ ศาสนา ความเห็นทางการเมือง รวมไปถึงลักษณะบุคลิกภาพใหญ่ทั้งห้า (Big Five Personality Traits) สถานะโสดหรือมีแฟน รวมถึงพฤติกรรมทางด้านอื่น ๆ เช่น การสูบบุหรี่ การดื่มเครื่องดื่มแอลกอฮอล์ และการใช้ยาเสพติด เป็นต้น [2] โดยจากผลการวิเคราะห์ของกราฟในด้านบนแสดงให้เห็นว่า ความแม่นยำในด้านเชื้อชาติมีความแม่นยำมากที่สุด มากถึง 95% ซึ่งเป็นการวิเคราะห์ระหว่างคอเคเชียน (คนผิวขาว) และแอฟริกันอเมริกัน [2] นอกจากนี้อัลกอริทึม AI ยังสามารถใช้ข้อมูล Facebook Likes ของเราประเมินบุคลิกภาพของตัวเราได้ดีกว่าคนรู้จัก เพื่อนสนิท หรือแม้กระทั่งคู่สมรสด้วยซ้ำ [3] แสดงให้เห็นว่า พฤติกรรมของเราในโลกดิจิทัล โดยเฉพาะในโลกโซเชียล เมื่อนำมารวมกับเทคโนโลยีการคำนวณสมัยใหม่สามารถทำให้เรารู้จักตัวเราเองได้ดีกว่าการใช้มนุษย์เป็นผู้ประเมินเสียอีก อย่างกราฟด้านล่างนี้ก็เป็นผลลัพธ์จาก [3]  ซึ่งเป็นการแสดงผลการวิเคราะห์ที่เทียบความแม่นยำในการตัดสินบุคลิกภาพโดยใช้คอมพิวเตอร์ และจำนวน Facebook Likes  โดยเส้นสีแดงที่มีความหนากว่าเส้นอื่น ๆ นั้น แสดงถึงความแม่นยำเฉลี่ยของลักษณะบุคลิกภาพทั้งห้าที่ถูกวิเคราะห์ด้วยระบบคอมพิวเตอร์ การทราบลักษณะบุคลิกภาพเฉย ๆ อาจเป็นเพียงเกร็ดความรู้ที่น่าสนใจ และมีประโยชน์ต่อรายบุคคลเท่านั้น แต่ว่างานวิจัยที่ใช้ AI ในการวิเคราะห์ข้อมูลจากโซเชียลนี้ สามารถทำให้เกิดประโยชน์ในด้านการแพทย์ได้ เช่น การวิเคราะห์โรคซึมเศร้าจากรูปโปรไฟล์และการใช้ภาษาบนสเตตัสโซเชียลต่าง ๆ [4–6] ในประเทศไทยเองก็มีแอปพลิเคชันคัดกรองผู้มีภาวะซึมเศร้าโดยใช้ AI สามารถเข้าใช้ได้จากแอปพลิเคชันหมอพร้อม เป็นเครื่องมือที่ช่วยแบ่งเบาภาระของจิตแพทย์และนักจิตวิทยา และทำให้ผู้ที่มีความเสี่ยงหรือมีปัญหานี้เข้าถึงความช่วยเหลือได้ง่ายขึ้นมาก [7] นอกจากนี้ ในภาคธุรกิจยังใช้การวิเคราะห์อารมณ์จากการใช้ภาษาหรือใบหน้า มาช่วยในกลยุทธ์ทางการตลาดและการรับสมัครงาน เช่น การวิเคราะห์ความประทับใจของลูกค้าจากรีวิว [8] หรือการวิเคราะห์อารมณ์และคุณสมบัติต่าง ๆ ของผู้สมัครงานจากการแสดงออกทางใบหน้าในช่วงที่สัมภาษณ์งาน [9] เป็นต้น หรือแม้กระทั่งงานวิทยานิพนธ์ของผู้เขียนเองที่ศึกษาว่าคนแต่งงานกันหน้าเหมือนกันมากขึ้นหรือไม่ โดยใช้ AI เป็นตัววิเคราะห์ความเหมือนของใบหน้า ก็เป็นงานวิจัยน่ารัก ใส ๆ อีกงานหนึ่งที่ใช้ประโยชน์จากศาสตร์นี้ ฟัง ๆ แล้วทำไมดูน่ากลัวจัง การที่ AI และ Big Data สามารถรู้จักตัวเราได้ดีทั้ง ๆ ที่เราไม่ได้ต้องการบอกอะไรเลยเป็นเรื่องที่น่ากลัว ลองคิดดูหากผู้ไม่ประสงค์ดีได้ข้อมูลเหล่านี้ไปแล้วออกแบบเครื่องมือที่จะใช้ประโยชน์จากสภาพจิตใจของเรา เช่น การหลอกหาประโยชน์ หรือการโน้มน้าวใจให้เข้ากับกลุ่มใดกลุ่มหนึ่ง (เช่นกลุ่มทางการเมือง ศาสนา ลัทธิ) ในปี 2018 มีงานวิจัยออกมาว่า AI สามารถบ่งบอกเพศสภาพของเราได้ดีกว่ามนุษย์คนอื่น [10] ซึ่งก่อให้เกิดความกังวลเกี่ยวกับบุคคลที่มีความหลากหลายทางเพศมาก และเกิดความขัดแย้งในวงการศาสนาหัวรุนแรง เพราะความสามารถนี้หมายความว่า องค์กรใด ๆ ที่ไม่ประสงค์ดี หรือไม่ตระหนักรู้สามารถใช้เทคโนโลยีนี้สร้างความไม่เป็นธรรมต่อเพศสภาพบางกลุ่มได้ หรือแม้กระทั่งเรื่องฉาวโฉ่ของบริษัท Cambridge Analytica ที่ถูกเปิดเผยในปี 2018 เช่นกัน ว่าได้ใช้ข้อมูลจาก Facebook ไปทำการวิเคราะห์ที่ไม่โปร่งใสหลายรายการ เช่น การช่วยเหลือการหาเสียงเลือกตั้งประธานาธิบดีของสหรัฐอเมริกา และการรณรงค์โหวตออกจากสหภาพยุโรป (Brexit) ของสหราชอาณาจักรในปี 2016 [11] จะเห็นได้ว่า เหรียญย่อมมีสองด้าน ความก้าวหน้าของเทคโนโลยีย่อมมากับภัยมืดเสมอ ขึ้นกับผู้ใช้เทคโนโลยีว่ามีสติสัมปชัญญะและจริยธรรมมากแค่ไหน แต่ต้องขอบคุณข่าวฉาวเหล่านี้ ที่ทำให้บริษัทเทคโนโลยีและโซเชียลยักษ์ใหญ่รวมถึงสังคมในวงกว้างให้ความสำคัญกับความเป็นส่วนตัวของข้อมูลมากขึ้นมาก ๆ ปัจจุบันการจะนำข้อมูลจากโซเชียลไปใช้มีความรัดกุมมากขึ้น (สร้างความลำบากให้นักวิจัยผู้หวังดีมากขึ้นเช่นกัน) รวมไปถึงกฎหมายอย่าง พ.ร.บ. คุ้มครองข้อมูลส่วนบุคคล พ.ศ. 2562 (PDPA) ในไทย หรือ กฎหมายคุ้มครองข้อมูลส่วนบุคคลของสหภาพยุโรป (GDPR) ก็กระตุ้นให้ผู้คนตื่นตัวในการรักษาข้อมูลของตนเองไม่ให้มิจฉาชีพนำไปใช้ให้เกิดโทษ หรือแม้แต่คำถามที่ผู้เขียนมักได้รับเวลาเล่างานที่ทำให้ผู้คนฟัง ว่า “อ้าว นี่คือการดูโหงวเฮ้งเองนี่” แล้วต่อไปเราจะไม่ตัดสินคนจากหน้าตาเพียงอย่างเดียวหรือ ผู้เขียนไม่ปฏิเสธว่าจริง ๆ แล้วการประเมินบุคลิกภาพจากใบหน้านั้นถ้าจะเรียกให้ง่ายก็สามารถเรียกว่าการดูโหงวเฮ้งได้เหมือนกัน แต่ว่าความแม่นยำนั้นไม่ได้สูงมาก นั่นคือ เราไม่สามารถใช้ AI ตัดสินลักษณะนิสัยของผู้อื่นได้จากใบหน้าได้นั่นเอง รู้เท่าทันและใช้ให้เกิดประโยชน์ [ต่อส่วนรวม] ในเมื่อศาสตร์แห่ง Computational_Psychology ได้แสดงทั้งความน่าอัศจรรย์และความน่าสะพรึงกลัวต่อมนุษยชาติออกมาแล้ว คำถามคือ แล้วเราในฐานะผู้ใช้ หรือผู้ถูกใช้ จะทำตัวอย่างไรต่อไป ผู้เขียนมองว่า ภัยร้ายที่มาพร้อมกับความก้าวหน้าของเทคโนโลยีเป็นเรื่องที่หลีกเลี่ยงไม่ได้ หากเป็นหน้าที่ของเราที่ต้องรู้ว่า ข้อมูลส่วนบุคคลต่าง ๆ สามารถบอกอะไรเกี่ยวกับตัวเราและตัวผู้อื่นได้บ้าง เพื่อป้องกันไม่ให้ผู้ไม่หวังดีนำข้อมูลเหล่านี้ไปใช้ในทางที่ผิด นอกจากนี้การที่เรารู้ถึงสิ่งร้าย ๆ ที่อาจจะเกิดขึ้นทำให้ตัวเราและสังคมตื่นตัวในการระมัดระวังและปกป้องตนเองและผู้อื่น ย่อมดีกว่าการใช้ชีวิตสวยงามไปเรื่อย ๆ ภายใต้ความเขลาอันแสนสุข (Blissful Ignorance) แต่สิ่งที่ผู้เขียนมองว่าเป็นเรื่องดีมากเรื่องหนึ่งของศาสตร์แขนงนี้ คือการที่เรารู้ว่าข้อมูลพื้น ๆ เหล่านี้สามารถทำให้เกิดทิฐิและอคติได้ จะเป็นเครื่องเตือนสติไม่ให้เราปฏิบัติกับผู้อื่นอย่างไม่เป็นธรรม ซึ่งดีกว่าการปล่อยผ่านให้เราตัดสินใจด้วยกลไกทางความคิดที่เราไม่รู้ตัว นอกจาก Computational_Psychology แล้ว ยังมีศาสตร์ที่ใกล้เคียงกันอื่น ๆ ที่ใช้คอมพิวเตอร์และการคำนวณศึกษามนุษย์และสังคม เรียกรวมกันว่า Computational_Social Science หรือสังคมศาสตร์เชิงคำนวณนั่นเอง เป็นสาขาวิชาที่มาแรงในทศวรรษนี้ ทว่า ผู้เขียนคงฝากไว้เท่านี้ให้ผู้อ่านหาความรู้เพิ่มเติมด้วยตนเองจากแหล่งอื่น ๆ ต่อไป แหล่งอ้างอิง เนื้อหาโดย ดร. พิณนรี ธีร์มกรตรวจทานและปรับปรุงโดย ดวงใจ จิตคงชื่น
5 November 2022

บทความ

รถ Formula 1 เครื่องผลิตข้อมูลที่วิ่งได้กว่า 300 กิโลเมตร/ชั่วโมง
การแข่งรถ Formula 1 หรือ F1 ซึ่งเป็นการแข่งขันความเร็วของรถยนต์ที่แต่ละค่ายบริษัทรถยนต์พัฒนาขึ้น ถือเป็นหนึ่งในกีฬาที่มีความนิยมสูงที่สุดในโลก อย่างไรก็ดีการตัดสินผู้ชนะในกีฬา F1 มีหลากหลายปัจจัย ไม่ใช่แค่ว่าทีมที่มีรถยนต์ที่เร็วที่สุดในสนามจะเป็นผู้ชนะเสมอไป ดังนั้นการนำข้อมูลมาใช้ให้เกิดประโยชน์สูงสุดเลยเป็นสิ่งจำเป็น พวกเขาข้อมูลกันแบบไหนสามารถติดตามได้ในบทความนี้ครับ
20 October 2022

บทความ

เตรียมข้อมูลอย่างไรให้โมเดล Linear Regression ดีขึ้น
เราจะเตรียมข้อมูลด้วยการตรวจสอบทั้ง 4 วิธี ได้แก่ ความเป็นเชิงเส้น,การแจกแจง,ความแปรปรวน และความเป็นอิสระต่อกัน
10 October 2022

บทความ

เครื่องมือธุรกิจอัจฉริยะที่นิยมในปัจจุบัน (BI Tools)
Gartner’s Magic Quadrant คือ ชื่อรายงานการวิจัยทางการตลาด (Market Research Reports) ซึ่งจะมีการจัดทำขึ้นทุกๆ 1 – 2 ปี จัดทำโดยบริษัท Garner Inc. ซึ่งเป็นบริษัทเพื่อการวิจัยและให้คำปรึกษาของประเทศสหรัฐอเมริกา มีจุดประสงค์เพื่อทำการวิเคราะห์เชิงคุณภาพของผลิตภัณฑ์ในตลาด รวมทั้งทิศทาง, พัฒนาการของเทคโนโลยี และผู้มีส่วนร่วมกับผลิตภัณฑ์นั้น ๆ รายงานการวิจัยดังกล่าวจึงเป็นประโยชน์อย่างมากต่อบริษัทหรือองค์กรที่กำลังมองหาผลิตภัณฑ์ที่ตรงกับความต้องการและธุรกิจของตนเอง รวมไปถึงรายงานการวิจัยยังมีการบ่งบอกถึงจุดแข็งและข้อควรระวังเปรียบเทียบกันระหว่างผลิตภัณฑ์ ซึ่งในรูปด้านล่าง Gartner ได้แสดงจุดแข็งและข้อควรระวังในผลิตภัณฑ์ Business Intelligence Tools (BI Tools) โดย Vendor ต่าง ๆ จากรูปที่แสดงด้านบน ยิ่งตำแหน่งของผลิตภัณฑ์อยู่ด้านขวาของกราฟมาก แสดงว่าผู้พัฒนาซอฟต์แวร์มีวิสัยทัศน์ในการพัฒนาซอฟต์แวร์ของตนเองให้ตอบโจทย์ความต้องการการใช้งานในตลาดผู้ใช้ปัจจุบัน และยิ่งอยู่ตำแหน่งของกราฟที่สูงมาก บ่งบอกถึง จำนวนผู้ใช้งานหรือส่วนแบ่งการตลาดที่สูงเช่นกัน โดยกราฟจะถูกแบ่งออกเป็น 4 ส่วน เพื่อแสดงความสามารถของแต่ละซอฟต์แวร์ ได้แก่ จากรายงานการวิจัยทางการตลาดของ Garner Inc. จะเห็นได้ว่า ถึงแม้ในปัจจุบันจะมีเครื่องมือธุรกิจอัจฉริยะมากมายจากหลากหลายผู้พัฒนา แต่ที่ได้รับความนิยมอย่างแพร่หลายนั้นมี 3 เครื่องมือ นั่นคือ Power BI จาก Microsoft, Tableau จาก Salesforce และ Google Data Studio จาก Google ซึ่งต่างมีความสามารถในการดึงข้อมูลจากหลายแหล่งเพื่อสร้าง Dashboard โดยที่ผู้ใช้งานไม่จำเป็นต้องมีทักษะการเขียนโปรแกรม อย่างไรก็ตาม แต่ละเครื่องมือมีความโดดเด่นและข้อจำกัดที่แตกต่างกันดังนี้ เนื่องจากแต่ละเครื่องมือธุรกิจอัจฉริยะล้วนแต่มีจุดเด่นและข้อจำกัดที่ไม่เหมือนกัน การเลือกใช้เครื่องมือที่เหมาะสมจำเป็นต้องพิจารณาถึงความเหมาะสมในการใช้งานสำหรับแต่ละองค์กร ทั้งในมิติของราคา ค่าใช้จ่าย ที่องค์กรพร้อมลงทุน และความเหมาะสมนำไปประยุกต์ใช้กับเทคโนโลยีอื่นที่องค์กรใช้งานอยู่แล้วเดิม เพื่อให้เครื่องมือธุรกิจอัจฉริยะสามารถเชื่อมต่อกับข้อมูลที่องค์กรเก็บรวบรวมไว้อยู่เดิม และสามารถนำมาเสนอในรูปแบบแดชบอร์ดที่เหมาะสมกับการใช้งานจริงขององค์กร  เปรียบเทียบเครื่องมือธุรกิจอัจฉริยะ (BI Tools)   Power BI Desktop Tableau Google Data Studio จุดเด่น สามารถนำข้อมูลมากกว่าหนึ่งแหล่งและหลากหลายรูปแบบ เพื่อมาใช้วิเคราะห์ร่วมกันได้ ยกตัวอย่างเช่นการนำข้อมูลจากใน Excel มาวิเคราะห์คู่กับข้อมูลในฐานข้อมูล   ออกแบบเรียบง่ายสำหรับการใช้งาน ผู้ใช้ไม่จำเป็นต้องมีความรู้เชิงเทคนิคในการสร้างแดชบอร์ดที่ซับซ้อน   กรณีที่หน่วยงานมีการใช้ Microsoft office 365 อยู่แล้ว บุคลากรภายในองค์กรสามารถใช้ตัว PowerBI และเผยแพร่ต่อสาธารณชนผ่าน URL ได้เลย มีฟังก์ชันที่สามารถจัดการข้อมูลที่ซับซ้อนได้ ทำให้ขั้นตอนการทำความสะอาดข้อมูลมีประสิทธิภาพมากยิ่งขึ้น   มีซอฟต์แวร์เสริมส่วนที่ชื่อว่า Tableau Prep ที่สามารถใช้ออกแบบ data pipeline เพื่อไปแสดงผลไปยังแดชบอร์ด   มีประเภทกราฟให้เลือกหลากหลาย และสามารถปรับแต่งแต่ละกราฟได้อย่างละเอียด   สามารถเชื่อมต่อกับข้อมูลจากระบบต่าง ๆ ของ Google ได้ยกตัวอย่างเช่น Google Analytics, Adword, BigQuery   เน้นระบบคลาวด์ ที่สามารถใช้งานได้รวดเร็ว ในกรณีที่ทำงานกันกับซอฟต์แวร์อื่นของ Google   มีฟังก์ชันในการแชร์ตัวงานให้กับทีม เพื่อร่วมกันพัฒนาตัวแดชบอร์ดได้ กลุ่มผู้ใช้งาน เหมาะสำหรับผู้ที่มีความคุ้นชินการใช้งานของ Microsoft Excel  และเหมาะกับองค์กรที่ใช้ Microsoft Office 365 อยู่แล้ว เหมาะสำหรับผู้ที่ต้องการวิเคราะห์ข้อมูลซับซ้อน ปรับสร้างกราฟแบบละเอียด เหมาะสำหรับผู้เริ่มต้นอยากลองใช้ Business Intelligence Tool เริ่มเปิด ใช้งานครั้งแรก 2015 2004 2016 ราคา $9.99/คน/เดือน (Power Bi Pro) $70/คน/เดือน(Tableau Creator) ฟรี รองรับการสร้าง/ปรับแต่ง Desktop Desktop Desktop และ Mobile ระบบปฏิบัติการ Windows เท่านั้น   Windows/macOS   ใช้งาน Online ผ่าน Web Browser ความเห็นของจากมุมมองผู้พัฒนาแดชบอร์ด   Power BI Desktop Tableau Google Data Studio ข้อได้เปรียบ ใช้งานง่าย สำหรับผู้ที่ไม่เคยใช้   สำหรับผู้ที่คุ้นชินการใช้งาน Microsoft Excel จะสามารถเรียนรู้การใช้งาน Power BI ได้เร็ว   ตัวเลือกกราฟหลากหลาย   สามารถแสดงข้อมูลเชิงแผนที่ได้พอใช้   Interaction บนกราฟค่อนข้างเร็ว ใช้งานง่าย สำหรับผู้ที่ไม่เคยใช้   ตัวเลือกกราฟหลากหลาย   สามารถแสดงข้อมูลเชิงแผนที่ได้ดี   Interaction บนกราฟรวดเร็ว ใช้งานได้ฟรี ข้อเสียเปรียบ มีค่าใช้จ่าย แต่มีเวอร์ชันทดลองใช้ที่สามารถใช้งานได้ฟรี ราคาค่อนข้างสูง การจัดการข้อมูลมีข้อจำกัดมาก   ตัวเลือกกราฟมีจำกัด   Interaction บนกราฟค่อนข้างช้า อ้างอิง เปรียบเทียบเครื่องมือธุรกิจอัจฉริยะ บทความเกี่ยวกับ Tableau Software บน Wikipedia เนื้อหาโดย พรรษพัชร์ บำรุงวงศ์ ตรวจทานและปรับปรุงโดย ปพจน์​ ธรรมเจริญพร
6 October 2022

บทความ

4 เหตุผลที่จะทำให้คุณตกหลุมรัก Box Plot
ในบทความนี้ ผมจะมาพาผู้อ่านทุกท่านทำความรู้จักกับ Box Plot แผนภาพอันทรงพลังที่ใช้ในการวิเคราะห์การกระจายตัวของข้อมูล บอกได้เลยว่าสามารถใช้วิเคราะห์ได้ดีไม่แพ้ Histogram เลยครับ! การวิเคราะห์การกระจายตัวของข้อมูล คำถามที่เกี่ยวข้องกับการวิเคราะห์การกระจายตัวของข้อมูล มีอยู่ในชีวิตประจำวันของเราทุกคน ยกตัวอย่างเช่น ซึ่งหลาย ๆ คน จะคุ้นเคยกับการตอบคำถามด้านบนด้วย Histogram ซึ่งก็ถือว่าเป็นตัวเลือก “คลาสสิก” เพราะทุกคนจะเคยเรียนรู้สิ่งนี้มาก่อนในวิชาคณิตศาสตร์ โดย Histogram เป็นการนำข้อมูลเชิงปริมาณ (Numerical Data) มา “นับจำนวนครั้ง” ที่พบค่าของข้อมูล ตามช่วงข้อมูลหรืออันตรภาคชั้น (Bins) และเมื่อเราสร้าง Histogram แล้ว เราสามารถตอบคำถามด้านบนได้หลากหลาย เช่น บทความนี้จะขอนำเสนอ 4 เหตุผลที่จะทำให้ผู้อ่านตกหลุมรัก Box Plot โดยจะมีการอธิบายรายละเอียดวิธีการทำงานของ Box Plot ภายในเนื้อหาด้วย เริ่มต้นที่เหตุผลข้อที่หนึ่งในส่วนถัดไปกันเลยครับ ? เหตุผลข้อ 1: Box Plot ประหยัดพื้นที่ ในยุคดิจิทัลทุกวันนี้ Business Intelligence, Visual Analytics, และ Data Visualization ได้เข้ามามีบทบาทในองค์กรต่าง ๆ ทั้งเรื่องการบริหารจัดการ การดูสถานะ การวางแผน และการตัดสินใจ ทำให้พื้นที่บนหน้าจออุปกรณ์พกพาต่าง ๆ ของเรากลายเป็น Real Estate ยุคใหม่ แน่นอนว่า การนำเสนอข้อมูลอะไรที่ใช้เนื้อที่เยอะเกินไป ดูจะไม่ค่อยคุ้มเสียแล้ว ซึ่งในการแสดงข้อมูลชุดเดียวกัน Box Plot สามารถย่อส่วนพื้นที่ที่จำเป็นต่อการแสดงข้อมูลจากแผนภาพสองมิติ (2D) เหลือเพียงมิติเดียว (1D) ทำให้เป็นแผนภาพที่เหมาะกับยุคดิจิทัลที่พื้นที่บนหน้าจอของเรามีจำกัด แต่ Box Plot ที่ถูกย่อส่วนลงมาแล้ว จะยังตอบคำถามหลาย ๆ คำถามได้เหมือน Histogram หรือไม่? เรามาดูเหตุผลข้อถัดไปกันครับ เหตุผลข้อ 2: Box Plot อัดแน่นไปด้วยข้อมูล แผนภาพ Box Plot ได้ชดเชยขนาดที่เล็ก ด้วยหลักการวาดส่วนสำคัญต่าง ๆ ของกล่องด้วยปริมาณที่สำคัญทางสถิติ ทำให้ Box Plot ยังคงให้ข้อมูลและข้อสังเกตได้หลากหลายประการ แต่ก่อนอื่นเราลองมาทำความรู้จักกับส่วนประกอบต่าง ๆ ของ Box Plot กันก่อนครับ Box Plot ประกอบไปด้วยส่วนของ “กล่อง” (Box) กับส่วนของ “หนวด” (Whiskers) และมีจุด ๆ แสดงข้อมูลจริง​ โดยอาจอยู่ได้ทั้งในและนอกหนวด (บางครั้งเราจะเห็นบางเวอร์ชันของแผนภาพที่โชว์จุดข้อมูลนอก Whiskers อย่างเดียว ก็ยังนับเป็น Box Plot อยู่) ซึ่งตำแหน่งของ Box และ Whiskers ถูกสร้างขึ้นมาได้ โดยตัวเลขทางสถิติทั้งหมดถึง 5 ตัวด้วยกัน เรียกรวมกันว่า The Five-Number Summary ประกอบไปด้วย: เพื่อยกตัวอย่างให้เห็นภาพ สมมติว่าเรานำข้อมูลอายุขัยของประชากรเพศชาย (Life Expectancy for Males) มาวางเรียงกัน จากน้อยไปหามาก แล้วหาค่าตามหลัก The Five-Number Summary แล้วคำนวณได้ว่า ค่าเหล่านี้ถูกนำไปใช้ทำจุดสำคัญต่าง ๆ บน Box Plot เป็นกล่องและหนวดนั่นเอง ดังภาพด้านล่าง ซึ่งมีข้อสังเกตว่า หากเราลองมาใช้ตัวเลข 5 ตัวนี้ แปลผล Box Plot เบื้องต้นกัน เราจะได้ข้อสังเกตหลาย ๆ อย่างได้ไม่ด้อยไปกว่า (หรือในบางมิติ เหนือกว่า) Histogram เช่น ท่านที่ช่างสังเกตจะพบว่ามีตำแหน่งสำคัญที่ผมยังไม่ได้อธิบายใน Box Plot คือตัวเลข 44 บนหนวด Whisker ข้างซ้าย และสิ่งที่น่าสงสัยอีกประการหนึ่งคือ เหตุใดค่า 80 ที่เป็น Maximum จึงไปอยู่บนปลายหนวดข้างขวาพอดี? เป็นความบังเอิญหรือไม่? ข้อสังเกต เหล่านี้สามารถถูกอธิบายได้ว่า จริง ๆ แล้ว จาก Five-Number Summary เราจะต้องมีการคำนวณปริมาณทางสถิติเพิ่มบางประการ กล่าวคือ: เราเอาค่า IQR มาคำนวณค่า​ปลายหนวดทั้งสองข้าง ดังนี้: เสมือนว่าเป็นการ “ขยาย” ตัวกล่องออกไปด้านข้างด้วยความกว้าง 1.5 เท่าของกล่อง แต่ขยายไม่เกินข้อมูลสูงสุดหรือข้อมูลต่ำสุดที่มีอยู่จริง ซึ่งกฎ 1.5 * IQR ได้รับการยอมรับอย่างแพร่หลาย โดยนิยามข้อมูลที่อยู่นอกช่วง [Q1 – 1.5 * IQR, Q3 + 1.5 * IQR] ได้ว่าเป็น ค่าสุดโต่ง หรือ Outliers (คือค่าเหล่านี้ นับว่าหายากมาก ๆ) ยกตัวอย่างเช่น ถ้าข้อมูลมีการกระจายตัวแบบปกติ (Normal Distribution) ข้อมูลที่อยู่นอกช่วง Lower Whisker และ Upper Whisker จะมีเพียง 0.7% เท่านั้น จึงถูกจัดเป็น Outliers เราจะเห็นได้ว่าแผนภาพ Box Plot ถึงแม้จะมีขนาดเล็กมากเมื่อเทียบกับ Histogram แต่ให้ข้อมูลและข้อสังเกตได้น่าสนใจหลายประการ ไม่ว่าจะเป็นลักษณะการกระจายตัว เช่น ข้อมูลเบ้ซ้ายหรือเบ้ขวา, ค่ากลางของข้อมูล, ช่วงของข้อมูลส่วนใหญ่, ช่วงของข้อมูลเกือบทั้งหมด, และค่าสุดโต่ง ซึ่งข้อสังเกตหลายข้ออาจสังเกตได้ง่ายกว่า Histogram ไม่ว่าจะเป็นค่ากลางมัธยฐาน, ค่าสุดโต่ง, ช่วงของข้อมูลส่วนใหญ่ เพราะมีตำแหน่งสำคัญต่าง ๆ ที่ถูกคำนวณและถูกกำกับอยู่ในแผนภาพอย่างชัดเจน หากท่านผู้อ่านได้อ่านมาถึงจุดนี้แล้วเริ่มรู้สึกหลงรัก Box Plot ผมขอเสนอเหตุผลอีกสองข้อที่จะทำให้ Box Plot น่าใช้งานมากขึ้นไปอีก เรามาดูข้อถัดไปกันเลยครับ เหตุผลข้อ 3: Box Plot ยืดหยุ่นในการนำเสนอ เนื่องจาก Box Plot เป็นแผนภาพ 1D ทำให้มีความยืดหยุ่นและสามารถถูกนำเสนอในรูปแบบแนวนอนหรือแนวตั้งก็ได้ ผมได้แสดงตัวอย่าง Box Plot ในแนวนอนด้านบนแล้ว เรามาดูตัวอย่างการนำเสนอ Box Plot ในแนวตั้ง ซึ่งผมจะนำเสนอพร้อมกับเหตุผลข้อสุดท้ายครับ...
7 September 2022
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings