Nontawit Cheewaruangroj, PhD

Nontawit Cheewaruangroj, PhD

บทความของผู้เขียน

Articles

Author Category Post Filter
รู้จักกับ RFM Analysis เทคนิคการแบ่งกลุ่มลูกค้าเพื่อวางกลยุทธ์การตลาด พร้อมวิธีทำใน 3 ขั้นตอน
มาทำความรู้จักกับการวิเคราะห์ข้อมูลลูกค้าเพื่อจำแนกกลุ่มลูกค้า โดยวิธีการไม่ซับซ้อนที่เรียกกันว่า RFM Analysis
5 September 2023
การพัฒนา Business Intelligence ด้วยธรรมาภิบาลข้อมูล
ธรรมาภิบาลข้อมูล (Data Governance หรือ DG) จะช่วยให้แน่ใจว่าข้อมูลของบริษัทซึ่งเป็นสินทรัพย์ธุรกิจที่มีค่าที่สุดนั้น ( Business Intelligence ) ได้รับการเก็บรักษาและนำไปใช้ได้อย่างมีประสิทธิภาพและปลอดภัยที่สุด ดังนั้นธรรมาภิบาลข้อมูลจึงจำเป็นต้องมีนโยบายขององค์กร กระบวนการ เทคโนโลยี และพนักงานรับผิดชอบในการพัฒนากรอบงานที่นำไปปฏิบัติได้ ตั้งแต่โครงสร้างหลักไปจนถึงระยะเวลาการนำไปใช้ กรอบธรรมาภิบาลข้อมูลบริษัท เป็นกรอบงานแบบองค์รวมที่เกี่ยวข้องกับบุคลากรที่มีคุณสมบัติเหมาะสม รวมถึงนโยบายและกระบวนการที่วางแผนไว้เพื่อใช้งานเทคโนโลยีข้อมูลขั้นสูงให้เกิดประโยชน์สูงสุด อีกทั้งเพื่อให้แน่ใจว่าเป็นการเก็บรักษาและใช้งานข้อมูลในแบบที่มีประสิทธิภาพมากที่สุด เป้าหมายหลักของธรรมาภิบาลข้อมูลของธุรกิจคือการเพิ่มคุณภาพของข้อมูล ลดค่าใช้จ่ายในการบริหารจัดการข้อมูล และควบคุมการเข้าถึงข้อมูลของทุกคนอย่างเคร่งครัด โดยปกติแล้ว วิธีการที่ธุรกิจใช้เพื่อบรรลุเป้าหมาย DG ของตนได้คือโดยการจัดตั้งนโยบาย มาตรฐาน และมาตรวัดที่เข้มงวด เพื่อไปให้ได้ผลลัพธ์ของการขับเคลื่อนด้วยข้อมูลตามที่ต้องการ โดยนโยบาย DG ในระดับพื้นฐานนั้นคือการออกกฎสำหรับการเข้าถึงและบริหารจัดการชุดข้อมูลขณะที่ยังคงยึดตามข้อบังคับด้านความเป็นส่วนตัวและการรักษาความปลอดภัยที่เกี่ยวข้องทั้งหมด โรคระบาดเพิ่มมูลค่าของข้อมูลบริษัท ตามการศึกษาของ Teradata ที่ได้จัดทำขึ้นเมื่อตุลาคม 2020 ผู้ตอบแบบสำรวจ 91% เห็นด้วยว่าโรคระบาดทำให้มูลค่าของข้อมูลในองค์กรสูงขึ้น ยิ่งไปกว่านั้น ผู้บริหารที่ตอบแบบสำรวจ 94% เห็นด้วยว่า “ข้อมูลเป็นสินทรัพย์ที่สำคัญ” ในขณะที่ความสำคัญของข้อมูลเชิงลึกและการตัดสินใจโดยใช้ข้อมูลเพิ่มขึ้นเรื่อย ๆ มุมมองในอีกด้านคือ “garbage in, garbage out,” ซึ่งหมายถึงการตัดสินใจโดยใช้ข้อมูลเชิงลึกหรือข้อมูลดิบที่ไม่มีคุณภาพ ก็จะส่งผลให้ได้ผลลัพธ์ที่ไม่ดี ซึ่งข้อมูลดิบที่แย่นั้นก็จะส่งผลกระทบในระยะยาวสำหรับธุรกิจ เพราะสามารถทำลายความไว้วางใจที่ลูกค้าและผู้ที่เกี่ยวข้องคนอื่นๆ มีให้ได้อย่างถาวร! ตามรายงานของ Gartner “87% ของธุรกิจทั้งหมด ไม่มีเครื่องมือ Business Intelligence หรือ  BI หรือการวิเคราะห์ข้อมูลที่มีประสิทธิภาพ” ทำให้องค์กรเกือบทั้งหมดประสบปัญหากับการใช้งานสินทรัพย์ข้อมูลของตน Gartner ได้จัดกลุ่มองค์กรที่มี BI ต่ำว่าเป็นกลุ่ม “พื้นฐาน” หรือ “มีโอกาส”  Gartner กล่าวซ้ำว่าองค์กรในระดับพื้นฐานถูกจำกัดอยู่ในการวิเคราะห์แบบสเปรดชีต ขณะที่องค์กรในระดับที่มีโอกาสจะมีหน่วยธุรกิจที่ติดตามข้อมูลดิบที่สะสมไว้และงานการวิเคราะห์ต่าง ๆ โดยไม่มีการควบคุมที่เป็นศูนย์กลาง หนึ่งในสี่คำแนะนำของการศึกษาดังกล่าวคือการนำโปรแกรมธรรมาภิบาลข้อมูลไปใช้ในทุกองค์กรเพื่อเพิ่มความตระหนักถึงความสำคัญและผลประโยชน์ของ DG ในการบริหารจัดการข้อมูลและการวิเคราะห์ของบริษัท DG ในการวิเคราะห์เชิงธุรกิจหรือใน BI วิทยากรที่งาน Webinar เรื่องการกำกับดูแล BI ได้อธิบายว่า “การกำกับดูแล BI” และ “ธรรมาภิบาลข้อมูล” เป็นสองคำที่ใช้บ่อยในแวดวง BI นั้นค่อนข้างแตกต่างจากกัน Webinar นี้เจาะลึกเรื่องงานการกำกับดูแลที่เกี่ยวข้องกับ BI บริษัทและคงจะมีประโยชน์ไม่น้อยสำหรับคนที่สนใจในด้านนี้ องค์กรที่ขับเคลื่อนด้วยข้อมูลค่อย ๆ เลิกใช้โปรแกรมที่เฉพาะเจาะจงกับงาน ปัญหา Data Silos ค่อย ๆ หายไป ธุรกิจสมัยใหม่ต้อนรับ “Data Flows” ที่ต่อเนื่องในทุก ๆ แผนกและการทำงานที่หลากหลาย ด้วยความนิยมที่เพิ่มขึ้นของเทคโนโลยีรุ่นใหม่อย่างเช่น AI และการเรียนรู้ของเครื่องจักรกล (ML) ความสำคัญของคุณภาพของข้อมูลและธรรมาภิบาลข้อมูลก็เพิ่มขึ้นด้วย ตามการศึกษาเดียวกันของ Teradata ได้ระบุไว้ว่าผู้บริหารที่ตอบแบบสำรวจ 77% เชื่อว่าปัจจุบันนี้ “องค์กรมุ่งความสำคัญไปที่ความถูกต้องแม่นยำของข้อมูล” โดยปกติแล้วเมื่อข้อมูลทางธุรกิจถูกนำไปวิเคราะห์ต่อ เพื่อทำการเปรียบเทียบหรือเพื่อเป็นข้อมูลทางการแข่งขัน เราจะเรียกวิธีการนี้เรียกว่า Business Intelligence (BI) หรือการวิเคราะห์ข้อมูลในเชิงธุรกิจ ในกรณีของ BI โปรแกรมธรรมาภิบาลข้อมูลบ่งบอกถึง “ขั้นตอนของการนำไปปฏิบัติและบังคับใช้สิทธิอำนาจในการบริหารจัดการข้อมูลและแหล่งข้อมูลที่เกี่ยวข้อง” ด้วย BI ที่สามารถกำกับดูแลข้อมูลได้ บริษัทคาดหวังที่จะทำการตัดสินใจที่ดีขึ้น และในระยะเวลาที่สั้นลง  ตามที่ผู้เฝ้าสังเกตการณ์ธุรกิจเห็น เมื่อเวลาผ่านไป ศักยภาพของ BI ขั้นสูงจะง่ายขึ้นและใช้งานได้ฟรี การศึกษาของ Forbes ยืนยันว่าองค์กรที่ใช้งาน BI ที่มี DG เป็นหลักซึ่งมีประสิทธิภาพต่างรายงานถึง “ผลกำไรที่เพิ่มขึ้นอย่างมาก” จากการลงทุนใน BI ของพวกเขา Elizabeth Mixson (เอลิซาเบ็ธ มิกสัน) ผู้เขียน The Ultimate Guide to Data Governance ให้ความเห็นว่า “หัวใจของการวิเคราะห์ข้อมูลคือการกำกับดูแลข้อมูล แต่พระเอกตัวจริงที่ไม่ได้รับการพูดถึงคือณภาพของข้อมูล ความสามารถในการนำไปใช้งาน และการรักษาความปลอดภัย” วิธีที่จะกล่าวถึง เป็นวิธีการบางวิธีที่จะช่วยปรับปรุงการวิเคราะห์ข้อมูลขององค์กรและการใช่งาน BI: ธรรมาภิบาลข้อมูลสำหรับ BI แบบบริการตนเอง ในองค์กรส่วนใหญ่ เป้าหมายสำคัญของทีม DG คือการ “ลดความเสี่ยงของการใช้ข้อมูลอย่างไม่เหมาะสม” ตามคำพูดของนักเขียนที่ต้องการจะแบ่งปันเรื่องราวเบื้องหลังในการทำ DG สำหรับ Business Intelligence แบบบริการตนเองนั้น นักธุรกิจสายลุยมักจะใช้วิธีแก้ปัญหาที่สร้างสรรค์ของตนเพื่อหลีกเลี่ยงการลงโทษจาก “นโยบาย DG” ภายในองค์กรของพวกเขา ผู้กล้าเสี่ยงเหล่านี้ใช้ “ไฟล์ Excel และรายการ SharePoint ด้วยข้อมูลที่ป้อนเข้าไปเอง” เพื่อบรรลุเป้าหมายในวิธีของพวกเขาเอง วิธีประณีประนอมแบบคนละครึ่งทางก็คงจะเป็น BI แบบบริการตนเองที่มีการบริหารจัดการข้อมูลไว้แล้ว ทำให้นักธุรกิจเข้าถึงข้อมูลที่พวกเขาต้องการได้ง่ายขึ้น แต่อย่างไรก็ตามการเข้าถึงก็ยังคงอยู่ภายใต้ระบบและกระบวนการที่ทีม DG ตั้งไว้อย่างเคร่งครัด ซึ่งถ้าหากเป็นแบบนี้แล้วกลุ่ม DG และนักธุรกิจก็จะกลายเป็นพันธมิตรกัน โดยสามารถเข้าถึงข้อมูลได้ภายใต้เงื่อนไขที่เข้มงวด สิ่งที่ดีที่สุดที่ได้จากบทความในลิงก์ด้านบนสรุปได้ว่า DG และ BI แบบบริการตนเองเป็นพันธมิตรต่อกันและเราก็ควรมองเช่นนั้น โครงการ DG โดยปกติจะเริ่มจากแผน แต่แผนมักจะเปลี่ยนเมื่อกลยุทธ์ขององค์กรเปลี่ยน ซึ่งการสร้างความสมดุลที่พิเศษนี้เกิดขึ้นได้ในบริษัทระดับโลกด้วยความช่วยเหลือของ Power BI ถ้ามองในแง่ BI ช่วยปรับปรุงการใช้งาน DG โดยการฝังการวิเคราะห์อย่างฉลาดเข้าไปในระบบและกระบวนการขององค์กร เป้าหมายสูงสุดของการใช้งาน DG แบบมี BI คือการก้าวผ่านมาตรวัดคุณภาพไปและเริ่มสำรวจต้นเหตุของความผิดพลาดในระบบ เช่น การสืบหาแหล่งที่มาของข้อมูลดิบที่ไม่ดี เฝ้าสังเกตการณ์ความถี่ของความผิดพลาดที่เกิดขึ้นในระบบ หรือวิเคราะห์ว่าคุณภาพข้อมูลนั้นดีขึ้นหรือไม่เมื่อเวลาผ่านไป ซึ่งการใช้งาน DG ที่มีการวิเคราะห์ที่ซับซ้อนแบบนี้จะเกิดขึ้นได้ก็ต่อเมื่อมี BI ฝังอยู่ในระบบ ธรรมาภิบาลข้อมูลสำหรับ BI: ตัวอย่างและผลประโยชน์ นี่คือตัวอย่างกรณีการใช้ DG สำหรับ BI ในบริษัท: ผลประโยชน์ของ DG สำหรับ BI: ขณะที่ BI บ่งชี้ถึงวิธีการบริหารจัดการข้อมูลที่ขับเคลื่อนด้วยเทคโนโลยีอย่างสูง DG อิงถึงกลยุทธ์แบบองค์รวมหรือกรอบงานสำหรับการทำให้เป้าหมายธุรกิจโดยรวมสอดคล้องกับเป้าหมายเชิงวิเคราะห์ของบริษัท  DG เปลี่ยนข้อมูลดิบให้เป็นสินทรัพย์เชิงกลยุทธ์ บทความโดย Paramita (Guha) Ghoshเนื้อหาจากบทความของ Dataversityแปลและเรียบเรียงโดย ไอสวรรค์ ไชยชะนะตรวจทานและปรับปรุงโดย นนทวิทย์ ชีวเรืองโรจน์
3 September 2022
Data Tax เมื่อข้อมูลมีมูลค่าเหมือนสินทรัพย์ แล้วต่อไปจะโดนเก็บภาษีไหม?
เมื่อข้อมูลมีมูลค่ามหาศาลเฉกเช่นเดียวกับน้ำมันหรือทองคำ มาลองดูกันว่าจะมีการเก็บภาษี Data tax หรือไม่ และจะส่งผลกระทบอะไรกับเรา
30 June 2022
การออกแบบ Data Visualization ให้ Accessible
การทำให้ Data Visualization นั้น Accessible ช่วยให้ผู้รับสารทุกคนสามารถเข้าถึงสิ่งที่เราต้องการจะนำเสนอโดยไม่พลาดอะไรไปเพราะข้อจำกัดต่าง ๆ
22 June 2022
การออกแบบ Data Visualization ให้คนตาบอดสีสามารถเข้าใจได้ด้วย
รู้หรือไม่ว่า ประมาณ 8% ของประชากรชาย และ 0.5% ประชากรหญิงทั่วโลกนั้นมีอาการตาบอดสี แล้วเราจะมีวิธีการอย่างไรให้ Data Visualization ของเราสามารถเข้าใจได้โดยคนกลุ่มนี้? เรามาดูกันครับ
1 July 2021
เลือกแผนภาพอย่างไรสำหรับการทำ Data Visualization
หากเรามีข้อมูลมากมายไปหมด ก็คงจะเป็นเรื่องที่ยากลำบากในการหา Insight จากข้อมูล รวมถึงการใช้ข้อมูลเพื่ออธิบายให้ผู้อื่นเข้าใจสิ่งที่เราต้องการจะสื่อสาร วิธีการที่ง่ายที่สุดก็คือการทำ Data Visualization – สร้างกราฟหรือแผนภาพจากข้อมูล แต่หลาย ๆ คน อาจจะสงสัยว่าจะเลือกกราฟหรือแผนภาพอย่างไร ให้เหมาะสมกับข้อมูลที่มีและตอบโจทย์ที่เราต้องการ เลือกอย่างไร?             แผนภาพแต่ละประเภทนั้นมีวิธีการใช้ที่แตกต่างกัน เราจึงต้องตอบคำถามเหล่านี้ก่อน 1. Visualization นี้ตอบคำถามอะไร           การทำ Data Visualization ก็เปรียบเสมือนการเล่าเรื่อง (Story Telling) จากข้อมูลที่มีอยู่เพื่อตอบคำถามที่ผู้ชมอาจจะมี แน่นอนว่าถ้าเรื่องราว (Story) หรือ คำถามที่จะตอบแตกต่างกัน ก็จะต้องใช้แผนภาพคนละแบบในการอธิบาย ยกตัวอย่างเช่น หากเราต้องการตอบคำถามว่าผลิตภัณฑ์ประเภทใดที่ขายดีที่สุด ก็ควรจะใช้กราฟที่แสดงยอดขายที่แตกต่างกันของแต่ละประเภทให้เห็นชัดเจน แต่หากเราต้องการทราบว่าเวลาที่ใช้ในการจัดส่งสินค้าเป็นอย่างไร อาจจะต้องแสดงให้เห็นถึงการกระจายตัวของข้อมูลเวลาที่ใช้ในการจัดส่ง 2. ผู้ชม (Audience) เป็นคนประเภทไหน การทำ Data Visualization ให้ผู้ชมที่เป็นกลุ่มผู้บริหารควรมีรูปแบบที่ต่างออกไปจาก Visualization ที่ทำสำหรับผู้ชมกลุ่มผู้ปฏิบัติการ เนื่องด้วยความสนใจที่แตกต่างกันระหว่างคนสองกลุ่ม นอกจากนี้ระดับความเข้าใจของผู้ชมเป้าหมายก็ส่งถึงตัวเลือกรูปแบบในการนำเสนอข้อมูล ตัวอย่างเช่น กราฟที่ดูง่าย ๆ และกระชับ เช่น แผนภูมิวงกลม (Pie Chart) อาจจะเหมาะสมกว่าการทำแผนที่ต้นไม้ (Treemap) ที่ต้องใช้เวลาดูและคิดมากกว่า ข้อมูลอาจจะละเอียดมากเกินไปเหมาะสำหรับผู้บริหาร เป็นต้น 3. ข้อมูลมีจำนวนมากขนาดไหน           จำนวนของข้อมูลก็ส่งผลต่อแผนภาพที่เราจะสร้าง ตัวอย่างเช่น ถ้าทำแผนภาพการกระจาย (Scatter plot) ที่บอกถึงความสัมพันธ์ระหว่างยอดขายและราคา หากสินค้าซึ่งแทนด้วยจุดแต่ละจุดบนแผนภาพมีจำนวนมากก็จะทำให้แผนภาพนั้นดูเข้าใจได้ยาก (ซ้าย) ตัวอย่างเช่นนี้อาจจะต้องอาศัยการรวบแถวข้อมูล (Aggregate) ก่อนเพื่อจัดกลุ่มเป็นหมวดหมู่ (ขวา) เป็นต้น 4. ข้อมูลเป็นประเภทอะไร           โดยทั่วไปแล้วข้อมูลอาจแบ่งออกเป็นสองประเภท คือ ข้อมูลประเภทหมวดหมู่ (Categorical) และข้อมูลประเภทตัวเลข (Numerical) การสร้างแผนภาพสำหรับข้อมูลต่างประเภทก็จะมีความแตกต่างกัน ตัวอย่างเช่น หากต้องการเปรียบเทียบจำนวนสินค้าในประเภทผลิตภัณฑ์แตกต่างกันก็จะใช้กราฟแท่ง แต่ถ้าเปรียบเทียบจำนวนสินค้ากับผลิตภัณฑ์ราคาต่าง ๆ กัน ก็อาจจะใช้ ฮิสโตแกรม (Histogram) เพราะว่า ประเภทผลิตภัณฑ์กับราคาสินค้าเป็นข้อมูลคนละประเภทกัน 5 องค์ประกอบของแผนภาพที่ใช้สื่อถึงอะไร           หลักการของการทำแผนภาพ คือให้องค์ประกอบ (Element) แทนที่ตัวเลขหรือข้อมูลของเรา ตัวอย่างเช่น ในกราฟวงกลมเราให้ สีแสดงถึงหมวดหมู่ และมุมหรือพื้นที่ของพาย แสดงถึงจำนวนในหมวดหมู่นั้น ๆ แต่ละองค์ประกอบควรจะสื่อถึงปริมาณเพียงอย่างเดียว เพื่อให้สื่อสารได้อย่างแม่นยำ ทีนี้มาดูตัวอย่างแผนภาพต่าง ๆ ที่ใช้ตอบคำถามหลากหลายรูปแบบ 1. ต้องการแสดงถึงขนาดที่ต่างกัน หรือ จัดลำดับ โดยทั้งสองแบบอาจจะใช้สีในกรณีที่ต้องการแบ่งหมวดหมู่ ขนาดที่แตกต่างกันจะทำให้เห็นได้ชัดเจนว่าปริมาณในข้อมูลกลุ่มไหนมีขนาดใหญ่ที่สุด 2. ต้องการเห็นความสัมพันธ์ หากต้องการหาความสัมพันธ์ระหว่างสองตัวแปร เช่น ราคา กับ กำไร สัมพันธ์กันอย่างไร 3. ต้องการเห็นการกระจายตัว 4. ต้องการเห็นการเปลี่ยนแปลงตามช่วงเวลา 5. ต้องการเห็นข้อมูลที่เบี่ยงเบนจากปกติ หากต้องการเน้นว่าตัวเลขนั้นเบี่ยงเบนจากค่าอ้างอิง เช่น เป้าหมายหรือค่าเฉลี่ยมากน้อยแต่ไหน มีค่าบวกหรือลบมากน้อยเพียงใด เราสามารถใช้สีในการช่วยสื่อถึงว่าตัวเลขมีค่าสูงหรือต่ำกว่าเป้าหมายที่ต้องการแสดงเพียงใด 6. ต้องการแสดงถึงองค์ประกอบ 7. ต้องการแสดงถึงข้อมูลเชิงพื้นที่ แหล่งที่มา https://www.tableau.com/solutions/gallery/visual-vocabulary
19 March 2021
Curve Fitting อย่างง่ายดาย ด้วย SciPy : สำหรับการพยากรณ์แนวโน้มเบื้องต้น
ในช่วงที่มีการระบาดของโรคโควิด-19 นี้ เราอาจจะได้เห็นหลาย ๆ คนได้ลองพยายามนำข้อมูลของผู้ป่วยที่เพิ่มขึ้นทุก ๆ วันมาพยากรณ์ว่ามันจะมีแนวโน้มไปในทิศทางไหน โมเดลที่นิยมนำมาใช้ก็คือ SEIR model ที่สามารถอธิบายการระบาดโดยใช้สมการอนุพันธ์ต่าง ๆ แต่พอเข้าไปอ่านดูแล้วพวกเราบางคนอาจจะคิดในใจว่า ทำไมมันยากอย่างนี้!! วันนี้ผมจึงเอาอีกเทคนิคที่ง่ายขึ้นและซับซ้อนน้อยลงมานำเสนอนั่นก็คือการ fit curve แบบง่าย ๆ เลย
8 April 2020
สร้างแผนที่การระบาดโควิด-19 อย่างถูกหลักการ
ในปัจจุบันนี้เรามีเทคโนโลยีและเครื่องมือมากมายที่จะช่วยการนำเสนอข้อมูลในหลากหลายรูปแบบไม่ว่าจะเป็นแผนภาพหรือแผนที่ต่าง ๆ ได้อย่างง่ายดายและทันท่วงที สำหรับช่วงการระบาดของโควิดนี้ เราได้เห็นสื่อหรือหน่วยงานต่าง ๆ นำเสนอข้อมูลการระบาดของโรคทั้งในบริบทของประเทศไทยและในบริบทของสถานการณ์โลก แผนที่การระบาดถูกนำมาแชร์มากมายในโซเชียลมีเดีย และผู้อ่านหลายคนก็อาจจะอยากลองนำข้อมูลมาทำแผนที่เอง (ลองอ่าน การสร้าง Shape Map ใน Power BI จาก COVID-19 data) วันนี้เรามาลองดูกันดีกว่าว่าก่อนที่จะทำแผนที่อะไรนั้น อาจจะต้องนึกถึงหลักการอะไรบ้าง ในบทความนี้เราจะมาดูแผนที่แสดงการระบาดของโรคในประเทศจีน เนื่องจากมีการระบาดมานานกว่าใครเพื่อน และ เป็นประเทศแรกที่มีข้อมูลที่นำมาใช้ทำแผนที่ เดี๋ยวเรามาดูแผนที่แบบต่าง ๆ กันนะครับ (แผนที่ที่เราจะศึกษาเหล่านี้มาจาก ESRI ครับ) แผนที่แบบสี สำหรับเทคนิคที่ยอดนิยมที่สุดในการแสดงข้อมูลจำนวนในแผนที่นั้นก็คือ การใช้สีในแต่ละพื้นที่ หรือ เรียกว่า choropleth mapping โดยใช้สีเข้มขึ้นเพื่อสื่อถึงจำนวนที่มากขึ้นในพื้นที่นั้น ๆ เทคนิคนี้เป็นเทคนิคที่ดีเพราะสามารถทำให้ผู้เห็นเข้าใจได้ง่ายและรวดเร็ว แต่ก็สามารถทำให้ตีความหรือเข้าใจข้อมูลผิดได้ถ้าใช้ไม่ถูกวิธี จะผิดได้อย่างไรเรามาดูกันครับ รูปที่ 1 คือแผนที่การระบาดของโรคโควิดในประเทศจีนเมื่อวันที่ 24 กุมภาพันธ์ 2563 ที่ใช้เทคนิค choropleth mapping ภาพนี้อาจจะดูดีและเข้าใจง่ายใช่ไหมครับ แต่จริง ๆ แล้วแผนที่นี้หลอกตาเราอยู่อย่างหนึ่ง คือ สีที่ใช้แสดงถึงจำนวนรวมทั้งหมด (total) ในพื้นที่ ทว่าต้องอย่าลืมว่าแต่ละพื้นที่นั้นนอกจากจะมีขนาดไม่เท่ากันแล้วก็ยังมีจำนวนประชากรที่แตกต่างกัน การเปรียบเทียบสี (ซึ่งแสดงจำนวนผู้ติดเชื้อในพื้นที่) ของสองพื้นที่กันตรง ๆ อาจนำไปสู่ความเข้าใจที่คลาดเคลื่อนจากที่ควรจะเป็น ในแผนที่บอกว่ามณฑลหูเป่ยมีผู้ป่วยกว่า 65,000 คน ซึ่งดูเป็นจำนวนที่เยอะ แต่เราไม่รู้ว่าประชากรหูเป่ยมีจำนวนกี่คน มากกว่าหรือน้อยกว่ามณฑลข้างเคียง การเทียบด้วยจำนวนทั้งหมดอย่างเดียวจึงไม่ใช่การเปรียบเทียบที่ดีนัก นั่นจึงเป็นหลักการในการทำแผนที่ว่าการใช้สีแบบนี้ไม่ควรจะแสดงถึงค่ารวมของทั้งพื้นที่ นอกจากนี้อาจจะทำให้คนอ่านติดภาพในหัวไปว่าการระบาดนั้นเกิดขึ้นนั้นกระจายออกไปทั่วทั้งมณฑล ทั้งที่ความเป็นจริงนั้นการระบาดอาจจะถูกจำกัดอยู่ในเมืองใหญ่ในใจกลางมณฑลอย่างเดียวก็เป็นได้  อีกอย่างหนึ่งที่ต้องคำนึงถึงเมื่อใช้ choropleth mapping ก็คือ color scheme หรือ เกณฑ์ในการใช้สี ในรูปที่ 1 นี้มีการใช้จำนวนผู้ป่วย 1000 คนเป็นค่าสูงสุดและให้เป็นสีเข้มที่สุด ซึ่งมีอยู่ห้ามณฑลด้วยกัน ถ้าดูแผนที่นี้อย่างเผิน ๆ อาจเข้าใจว่าห้ามณฑลนี้มาการระบาดพอ ๆ กัน ใช่ไหมครับ… ผิดครับ ลองมาดูกราฟจะเห็นได้ว่าหูเป่ยมีปริมาณสูงกว่าอีกสี่มณฑลมาก ถ้าดูกราฟแท่งนี้แล้วกลับไปมองแผนที่ในรูป 1 จะพบว่ามันสื่อความหมายต่างกันสิ้นเชิง ซึ่งเป็นเพราะว่าการใช้ 1000 เคสผู้ป่วยเป็นตัวแบ่งสีนั้นอาจจะไม่ใช่ทางเลือกที่ดีนัก  จากสองข้อนี้เราควรจะทำอย่างไรดี ถึงจะได้แผนที่ที่ดูแล้วไม่ทำให้เข้าใจผิด? เราลองมาดูแผนที่อีกชิ้นที่นำเสนอข้อมูลเดียวกันกันนะครับ อย่างแรกเลยแผนที่นี้เปลี่ยนมาใช้สีน้ำเงินแทน เนื่องจากสีแดงเป็นสีที่สื่อถึงอารมณ์รุนแรง ถ้าย้อนกลับไปดูแผนที่ในรูปที่ 1 จะเห็นได้ว่าการที่มีสีแดงทั่วทั้งประเทศ อาจจะทำให้รู้สึกว่ามันแดงหมดทั้งประเทศแล้วนะหรืออาจะสื่อถึงความตายในขณะที่เรานำเสนอเพียงจำนวนผู้ป่วยไม่ได้หมายถึงจำนวนผู้เสียชีวิต การใช้สีแดงจะเป็นการเพิ่มอารมณ์ไปโดยที่ไม่จำเป็น (ถึงแม้จะดูสวยก็ตามเถอะ) แต่การใช้สีอื่นก็สามารถสื่อความหมายได้เหมือนกัน อย่างที่สองการใช้สีของแผนที่นี้สื่อถึงอัตราส่วนผู้ป่วยต่อจำนวนประชากร ไม่ได้หมายถึงจำนวนผู้ป่วยทั้งหมด ซึ่งนี่ทำให้สามารถแสดงได้ว่าการมีผู้ป่วย 10 คนในเมืองใหญ่ กับ 10 คนในหมู่บ้านเล็ก ๆ นั้นเห็นถึงความรุนแรงต่างกัน อย่างที่สามหูเป่ยมีผู้ติดเชื้อ 111 คนต่อแสนคน ในขณะที่มณฑลอื่นมีไม่ถึง 3 คนต่อแสนคน จึงใช้สีที่ต่างจากมณฑลอื่นอย่างเห็นได้ชัด ซึ่งแสดงให้เห็นถึงความแตกต่างที่ชัดเจนยิ่งขึ้น การใส่ label และ legend ที่เหมาะสมก็ช่วยให้ตีความข้อมูลได้ถูกต้องมากขึ้น อย่างไรก็ตามการใช้ choropleth mapping ก็ไม่ได้เป็นวิธีเดียวในการนำเสนอข้อมูลบนแผนที่ แล้วยังมีวิธีอื่นอีกไหม? แผนที่แบบจุด เราสามารถใช้แผนที่แบบจุดกระจาย หรือ dot density map แทนการใช้สีเพื่อแสดงข้อมูลผู้ป่วยได้ โดยในรูปที่ 4 แต่ละจุดในภาพสื่อถึงผู้ป่วยสิบคน การใช้จุดทำให้เราสามารถนำเสนอจำนวนผู้ป่วยทั้งหมดได้เลย ไม่ต้องทำอัตราส่วนก่อน เพราะจุดแต่ละจุดนั้นมีขนาดเท่ากันจะไม่ทำให้เกิดการตีความผิดแบบในกรณีใช้สี เนื่องจากเราไม่รู้ตำแหน่งทีแท้จริงของผู้ป่วยจึงให้จุดจะกระจายแบบสุ่มในแต่ละพื้นที่ ซึ่งแสดงให้เห็นถึงความแตกต่างที่ชัดเจนระหว่างหูเป่ยและมณฑลอื่น ๆ ข้อเสียคือทำให้คนอ่านเข้าใจผิดว่าแต่ละจุดหมายถึงผู้ป่วยหนึ่งคน ดังนั้นการใส่ label ที่เหมาะสมจึงมีความจำเป็น แผนที่อีกแบบที่สามารถใช้ได้คือแผนที่แสดงด้วยสัญลักษณ์สัดส่วน หรือ proportional symbol map ซึ่งใช้ขนาดของวงกลมมาแสดงถึงจำนวนผู้ป่วย โดยที่พื้นที่ของวงกลมจะแสดงถึงจำนวนผู้ป่วยรวมของแต่ละมณฑล มีใครเห็นข้อแตกต่างของแผนที่นี้กับแผนที่ที่ผ่านมาไหมครับ? ในแผนที่นี้เราสามารถมองเห็นฮ่องกงและมาเก๊าได้ เนื่องจากสองเขตนี้มีขนาดเล็กทำให้ยากต่อการมองเห็นใน choropleth หรือ dot density map ในขณะที่แผนที่แบบ proportional symbol map ช่วยให้เราเห็นข้อมูลของพื้นที่ที่มีขนาดเล็กได้เพราะขนาดของวงกลมที่แสดงจะไม่ขึ้นกับขนาดของพื้นที่นั่นเอง เนื่องจากหูเป่ยมีตัวเลขผู้ป่วยสูงจุดอื่น ๆ จึงมีขนาดเล็กหมด เราสามารถแก้ปัญหานี้ได้โดยใช้อัตราส่วนแบบ logarithm หรือที่เรียกกันว่า log scale ในการแสดงขนาดของจุด จะทำให้เปรียบเทียบมณฑลอื่น ๆ ได้ง่ายยิ่งขึ้น แต่อย่าลืม legend ที่ชัดเจนเพื่อบอกว่าขนาดของวงกลมหมายถึงอะไร แผนที่แบบอื่น ๆ เทคนิคที่กล่าวมาทั้งหมดก็น่าจะเพียงพอแล้ว ที่จะนำมาออกแบบแผนที่แสดงข้อมูล แต่จริง ๆ แล้วมันก็ยังมีอีกหลายอย่าง ซึ่ง”อาจจะ”นำมาใช้ได้ เทคนิคแรกเลยที่จะพูดถึงคือการใช้แผนที่ความร้อนหรือ heat map… ดูไม่งามเลยจริงไหมครับ แผนที่นี้สร้างโดยการประมาณค่าตัวเลขในพื้นที่ต่าง ๆ ให้ครอบคลุมทั้งประเทศ โดยใช้ค่าตั้งต้นจากผู้ป่วยในแต่ละมณฑลเป็นจุดกลางมณฑล ปัญหาคือมณฑลในจีนมีขนาดใหญ่มาก จุดกลางมณฑลที่ใช้ในการคำนวณอาจจะไม่ใช่จุดกึ่งกลางของการระบาดในมณฑลนั้น ๆ อีกอย่างหนึ่งคือเราดูแผนที่นี้แล้วดูไม่ออกว่าจุดเริ่มต้นของการระบาดอยู่ที่หูเป่ย ส่วนสีที่ใช้นั้นก็ดูไม่ค่อยสื่อถึงกับการระบาดของโรคเท่าไร แล้วแผนที่สามมิติล่ะ ใคร ๆ ก็ชอบสามมิติ แต่ผมว่าไม่ การใส่ effect สามมิติเข้าไปในแผนที่นั้น ไม่ได้ให้ข้อมูลอะไรออกมามากและดูเหมือนจะเบี่ยงเบนความสนใจของผู้อ่านไปจากข้อมูลที่ต้องการจะนำเสนอเสียด้วยซ้ำ แถมอย่างในรูปที่ 8 กราฟสามมิติที่แสดงจำนวนผู้ป่วยเป็นความสูง อาจจะบดบังข้อมูลของมณฑลบางมณฑลอีกด้วย แผนที่แบบ interactive อย่างสุดท้ายที่ผมจะพูดถึงคือการทำ Interactive map บนเว็บหรือ Dashboard ปัจจุบันมีเครื่องมือมากมายเช่น PowerBI หรือ Tableau (ตัวอย่าง จาก Tableau) ซึ่งทำให้เราสามารถเล่นกับแผนที่ได้ เช่น สามารถคลิกที่แต่ละพื้นที่แล้วแสดงข้อมูลแบบละเอียดออกมา หรือเมื่อซูมเข้าไปจะทำให้ข้อมูลที่แสดงออกมาละเอียดขึ้น เช่น เปลี่ยนจากจำนวนรวมของมณฑลเป็นจำนวนรวมแต่ละเมืองแทน การทำแผนที่เหล่านี้ก็ยังต้องคำนึกถึงสิ่งที่เขียนไว้ในบทความนี้เพื่อที่จะไม่ให้สื่อสารผิดวิธี ปัญหาหนึ่งของการทำ interactive map แบบนี้ คือผู้ใช้สามารถซูมเข้าไปได้เรื่อย ๆ ซึ่งหากซูมมากเกินไปกว่าขีดจำกัดของข้อมูลที่มีอาจจะทำให้คนเข้าใจผิดได้ เช่น ถ้าซูมเข้าไปที่จังหวัดจนมองไม่เห็นจุดที่แสดงถึงข้อมูล จะทำให้มองไม่เห็นจุดแล้วเข้าใจผิดได้ว่าในพื้นที่นั้นไม่มีการระบาดเป็นต้น จึงควรจำกัดการซูมไม่ให้เล็กกว่าขีดจำกัดของการแสดงผล และนี่ก็เป็นหลักการนำเสนอข้อมูลบนแผนที่ หวังว่าผู้อ่านทุกท่านจะนึกถึงหลักการเหล่านี้ ก่อนที่นำไปใช้ในการออกแบบแผนที่แสดงข้อมูลไม่ว่าจะเป็นเรื่องของสถานการณ์ระบาดของไวรัสโควิดหรือเรื่องอื่น ๆ ก็ตามครับ บทความแปลจาก https://www.esri.com/arcgis-blog/products/product/mapping/mapping-coronavirus-responsibly/
7 April 2020
ยาที่ถูกพัฒนาโดยระบบปัญญาประดิษฐ์ถูกนำมาใช้ในมนุษย์เป็นครั้งแรก
เราอาจจะเคยได้ยินถึงขีดความสามารถของระบบปัญญาประดิษฐ์หรือ AI ที่ในอนาคตอาจจะเข้ามาทำงานแทนที่มนุษย์แทบทุกอย่าง ไม่ว่าจะเป็นรถยนต์ไร้คนขับที่จะเข้ามาทำหน้าที่แทนคนขับแทกซี่หรือจะมาแย่งงานคุณหมอในการวินัจฉัยผู้ป่วยด้วย
27 March 2020
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings