Visualization

Visualization

ข่าวและบทความที่เกี่ยวข้อง

All Visualization

PostType Filter En

บทความ

ทำความรู้จักแผนภูมิปฏิทินความร้อน Calendar Heatmaps
กลับมาอีกครั้งกับบทความเกี่ยวกับ Data Visualization ซึ่งในครั้งนี้จะเป็นการนำเสนอการประยุกต์ใช้งานแผนภูมิความร้อนกับข้อมูลอนุกรมเวลาให้ออกมาเป็นรูปแบบแผนภูมิความร้อนชนิดหนึ่งที่เรียกว่า แผนภูมิปฏิทินความร้อน (Calendar Heatmaps) ก่อนอื่น ๆ เลย เรามาทำความรู้จักเบื้องต้นเกี่ยวกับแผนภูมิความร้อน (Heatmaps) กัน กำเนิดแผนภูมิความร้อน ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม เช่น เชื้อชาติ ต้นกำเนิด อายุ ในปารีส ทั้งนี้ในแผนภูมิความร้อนนี้ประกอบไปด้วยเขตพื้นที่รายแถวของปารีสเทียบกับค่าสถิติทางสังคมกว่า 30 ค่า โดยใช้สีทั้งหมด 4 สี คือ สีขาว สีน้ำเงิน สีเหลือง และ สีแดง ในการบ่งบอกถึงค่าต่าง ๆ แทนตัวเลข ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua[NP1] [AC2]  ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม เช่น เชื้อชาติ ต้นกำเนิด อายุ ในปารีส ทั้งนี้ในแผนภูมิความร้อนนี้ประกอบไปด้วยเขตพื้นที่รายแถวของปารีสเทียบกับค่าสถิติทางสังคมกว่า 30 ค่า โดยใช้สีทั้งหมด 4 สี คือ สีขาว สีน้ำเงิน สีเหลือง และ สีแดง ในการบ่งบอกถึงค่าต่าง ๆ แทนตัวเลข ทำให้ผู้คนเริ่มนำเทคนิคของ Loua ไปใช้ในเป็นส่วนประกอบของการแสดงแผนภูมิแบบตารางมากขึ้นอย่างแพร่หลายในช่วงปีคริสต์ศักราชที่ 19 จนถึงปัจจุบัน ประเภทของแผนภูมิความร้อน เมื่อแผนภูมิความร้อน (Heatmaps) หรือแผนภูมิอุณหภูมิ ถูกใช้งานมากขึ้น จึงมีรูปแบบที่ถูกพัฒนาขึ้นอย่างต่อเนื่อง ซึ่งแบ่งออกเป็นหลัก ๆ ทั้งหมด 2 ชนิด ได้แก่ แผนภูมิความร้อนกับข้อมูลเชิงอนุกรมเวลา จากที่ผู้เขียนได้เกริ่นไว้ข้างต้นที่จะมีการประยุกต์ใช้ข้อมูลเชิงอนุกรมเวลากับแผนภูมิความร้อนเข้าด้วยกัน ซึ่งโดยส่วนใหญ่การแสดงแผนภาพข้อมูลอนุกรมเวลา (Time-Series Data) จะมาในรูปแบบของกราฟเส้น อาทิเช่น กราฟเส้นแสดงข้อมูลการขายในช่วง 30 ปี กราฟเส้นแสดงข้อมูลยอดผู้เข้าชมวีดีโอ หรือกราฟหลากเส้นแสดงยอดขายตามปีเปรียบเทียบกับเดือน ซึ่งกราฟเส้นนี้นอกจากจะแสดงข้อมูลและเปรียบเทียบข้อมูล ยังแสดงถึงแนวโน้มในอนาคตหรือความสม่ำเสมอที่เกิดขึ้นในช่วงเวลาต่าง ๆ อย่างไรก็ตามการแสดงข้อมูลในเชิงอนุกรมเวลา อาจจะมีอุปสรรคในเชิงของความละเอียดของเวลา การจัดทำกราฟเส้นอาจไม่ตอบโจทย์หรือยากในการสังเกตและวิเคราะห์แนวโน้มเมื่อลงลึกถึงข้อมูลรายวัน ดังนั้นผู้เขียนจึงอยากจะให้ทุกท่านได้รู้จักกับ “แผนภูมิปฏิทินความร้อน” แผนภูมิปฏิทินความร้อน การเลือกใช้แผนภูมิปฏิทินความร้อนเพื่อนำเสนอข้อมูลจำเป็นต้องคำนึงถึงสิ่งที่อยากจะนำเสนอ หากเราต้องการนำเสนอข้อมูลอนุกรมเชิงเวลาในลักษณะรายวัน การใช้แผนภูมิปฏิทินความร้อนมาประยุกต์จึงเป็นอีกวิธีที่สามารถนำไปใช้งาน อาทิเช่น การแสดงการมีส่วนร่วมในโปรเจคบนเว็บไซต์ GitHub (ภาพที่ 4 บน) ว่ามีการทำงานหรือสนับสนุนมากน้อยเพียงใด หรือ การแสดงจำนวนอุบัติเหตุตามช่วงเวลาในแต่ละวันของสัปดาห์ (ภาพที่ 4 ล่าง) จะเห็นได้ว่าการแสดงข้อมูลแบบประยุกต์แผนภูมิความร้อนเข้าด้วยกันกับข้อมูลอนุกรมเวลา ก็ยังสามารถสังเกตและวิเคราะห์แนวโน้มของข้อมูลที่แสดงบนกราฟได้อีกด้วย ทั้งนี้ผู้เขียนจึงขอยกตัวอย่างการประยุกต์ข้อมูลอนุกรมเวลาเข้ากับแผนภูมิความร้อน โดยจะแสดงเป็นแผนภูมิปฏิทินความร้อน ซึ่งข้อมูลที่ผู้เขียนเลือกนำมาใช้คือข้อมูล PM2.5 ในปี 2022 ทุกจุดตรวจจากเว็บไซต์ Air4Thai กรมควบคุมมลพิษ ซึ่งทางผู้เขียนได้มีการจัดการข้อมูลให้สะดวกต่อการจัดทำแผนภูมิข้อมูลในรูปแบบปฏิทิน จากข้อมูลที่ผู้เขียนนำมาใช้แสดงในแผนภูมิปฏิทินนี้ สามารถสังเกตได้ว่าในช่วงเดือนพฤษภาคมจนถึงกลางเดือนตุลาคมมีปริมาณค่าฝุ่น PM2.5 ที่ค่อนข้างน้อยเมื่อเทียบกับเดือนอื่นๆ ซึ่งในช่วงต้นปีที่มีการเปลี่ยนฤดูเป็นฤดูหนาว เช่น เดือนมกราคมและเดือนกุมภาพันธ์จะมีค่า PM2.5 ที่ค่อนข้างสูง และในส่วนท้ายปีเดือนพฤศจิกายนและเดือนธันวาคมเริ่มมีแนวโน้มการเพิ่มขึ้นของปริมาณฝุ่น PM2.5 ซึ่งมีความน่าจะเป็นที่จะลามไปถึงเดือนมกราคมและเดือนกุมภาพันธ์ในปี 2023 ข้อควรระวังในการใช้งานแผนภูมิปฏิทินความร้อน อย่างไรก็ตามการจัดทำแผนภูมิความร้อนก็ยังมีข้อเสียในบางครั้ง การใช้แผนภูมิความร้อนที่ค่าของข้อมูลเป็นการไล่ระดับสีแทนค่าของช่วงข้อมูลอาจทำให้บางจุดยากต่อการเปรียบเทียบ สำหรับข้อมูลที่มีค่าใกล้เคียงกันการมองด้วยสายตาอาจไม่สามารถพบเจอความแตกต่างได้ ดังนั้นการจัดทำช่วงค่าข้อมูลจึงเป็นทางเลือกอีกทางหนึ่งสำหรับการใช้แผนภูมิความร้อน หรือการเลือกเฉดสีที่ต่างกันมาก ๆ เช่น น้ำเงินกับแดง เหลืองกับม่วง เป็นต้น โดยผู้เขียนก็อยากจะแนะนำเครื่องมือหนึ่งในการเลือกใช้สีแบบต่าง ๆ เครื่องมือนั้นก็คือ Colorbrewer ในบทความนี้ เราได้ทำการสำรวจโลกของ ‘แผนภูมิปฏิทินความร้อน’ หรือ ‘Calendar Heatmaps’ อย่างละเอียด ตั้งแต่ประวัติของมัน การประยุกต์ใช้ จะเห็นได้ว่าแผนภูมิความร้อนไม่เพียงแต่เป็นเครื่องมือที่มีประสิทธิภาพในการสื่อสารข้อมูล แต่ยังสามารถเปิดเผยแนวโน้มและรูปแบบที่ไม่คาดคิดได้อีกด้วย ความสามารถในการวิเคราะห์และนำเสนอข้อมูลเชิงลึกอย่างที่เราได้พูดถึงในบทความนี้ จะช่วยให้คุณเข้าใจว่าข้อมูลสามารถถูกเปลี่ยนเป็นข้อมูลที่มีคุณค่าและมีอิทธิพลได้อย่างไร เราหวังว่าคุณจะได้แรงบันดาลใจและความรู้ใหม่ๆ จากบทความนี้ และนำไปประยุกต์ใช้ในงานของคุณเอง อย่าลืมติดตามเราสำหรับบทความต่อไป ที่จะพาคุณไปสำรวจเทคนิคการวิเคราะห์ข้อมูลและการนำเสนอข้อมูลอื่น ๆ ที่น่าตื่นเต้นไม่แพ้กัน ที่นี่ เราจะช่วยให้คุณเข้าถึงเครื่องมือและทักษะใหม่ ๆ ในการเปลี่ยนข้อมูลเป็นมูลค่าและเรื่องราวที่น่าจดจำ เนื้อหาโดย อมร โชคชัยสิริภักดีตรวจทานและปรับปรุงโดย นววิทย์ พงศ์อนันต์ สำหรับผู้ที่สนใจขึ้นตอนการจัดทำแผนภูมิสามารถศึกษาได้จากบทความดังนี้ เอกสารอ้างอิง
25 December 2023

บทความ

การเตรียมข้อมูลเบื้องต้นด้วย Power BI (Basic Data Preparation with Power BI)
Microsoft Power BI เป็นซอฟต์แวร์ตัวหนึ่งในกลุ่มของเครื่องมือสำหรับการสร้าง Data Visualization ซึ่งกำลังได้รับความนิยมเพิ่มมากขึ้นในปัจจุบัน ซึ่งนอกจากจะมีความสามารถในการสร้าง Data Visualization แล้ว ยังมีความสามารถในการบริหารจัดการข้อมูล รวมไปถึงการเตรียมข้อมูลให้เหมาะสมสำหรับการนำไปสร้าง Data Visualization กลุ่มผลิตภัณฑ์ของ Power BI แบ่งหลัก ๆ ออกเป็น Power BI Desktop แอปพลิเคชันสำหรับเครื่องเดสก์ท็อป Windows, Power BI Service ให้บริการ SaaS (Software as a Service) แบบออนไลน์ที่, Power BI Mobile แอปพลิเคชันสำหรับอุปกรณ์เคลื่อนที่ และ Power BI Report Server องค์ประกอบของโปรแกรม สำหรับในส่วนของโปรแกรม Power BI Desktop มีการแบ่งส่วนการทำงานออกเป็น 2 ส่วนด้วยกันคือ (1) Power BI Desktop เป็นส่วนที่ใช้ในการสร้าง Visualization และ (2) Power Query เป็นส่วนที่ใช้สำหรับการบริหารจัดการเกี่ยวกับข้อมูล เช่น กระบวนการทำความสะอาดข้อมูล (Data cleansing หรือ Data scrubbing) หรือกระบวนการแปลงข้อมูล (Data Transformation) ในบทความนี้เราจะมาลองสำรวจรูปแบบการบริหารจัดการข้อมูลรูปแบบต่าง ๆ ที่พบกันได้บ่อยในการทำงานกับข้อมูล พร้อมทั้งคำสั่งที่เกี่ยวข้องไปด้วยกัน การเตรียมข้อมูลเบื้องต้นด้วย Power BI 1. การลบแถวข้อมูล (คำสั่ง Remove Rows) ที่ Ribbon Home > Remove Rows > Remove Top Rows > Number of rows: 2 (ระบุจำนวนแถวข้อมูลที่ต้องการลบ) 2. การตั้งแถวแรกให้เป็นชื่อคอลัมน์ ในการนำเข้าข้อมูลที่เป็นไฟล์ Excel แล้วพบว่าแถวข้อมูลที่ควรจะเป็นหัวตารางหรือชื่อคอลัมน์ กลับกลายเป็นส่วนหนึ่งของชุดข้อมูล กรณีเช่นนี้สามารถแก้ไขได้โดยใช้คำสั่ง Use First Row as Headers : ที่ Ribbon Home > User First Row as Headers 3. การลบคอลัมน์ (คำสั่ง Remove Columns) คลิกเลือกคอลัมน์ที่ต้องการลบ แล้วไปที่ Ribbon Home > Remove Columns 4. การปรับเปลี่ยนชนิดหรือรูปแบบของข้อมูล (คำสั่ง Data Type Setting) * ส่วนนี้จะทำงานที่ Power BI Desktop 5. การแยกคอลัมน์ (คำสั่ง Split Column) ในการจัดเก็บข้อมูลอาจจะพบลักษณะการจัดเก็บหลาย ๆ ข้อมูลในคอลัมน์เดียวกัน ตัวอย่างเช่น (ดูรูปประกอบ) มีการเก็บข้อมูลชื่อหนัง (ปีที่เริ่มฉาย) อยู่ภายในคอลัมน์เดียวกัน หากเราต้องการแยกข้อมูลสองเรื่องนี้ออกจากกัน สามารถใช้คำสั่งในการแยกคอลัมน์ได้ แต่จะต้องมีเงื่อนไขที่สามารถแยกคอลัมน์นั้น ๆ เช่น มีสัญลักษณ์พิเศษ หรือแยกตามตำแหน่งที่ระบุ 6. การรวบคอลัมน์ด้วยคำสั่ง Unpivot ในการเก็บข้อมูล โดยเฉพาะอย่างยิ่งรูปแบบของไฟล์ Excel ที่นอกจากจะเป็นการเก็บข้อมูลแล้ว ยังเป็นการแสดงข้อมูลในรูปแบบของรายงานด้วย ตัวอย่างเช่น (ดูรูปประกอบ) แสดงข้อมูลยอดขายรายเดือนในรายคอลัมน์ และแสดงข้อมูลรายปีในรายแถวข้อมูล หากต้องการนำข้อมูลลักษณะดังกล่าวมาสร้างเป็นกราฟ เพื่อให้สามารถเปรียบเทียบยอดขายรายเดือนได้ จะต้องทำการรวมคอลัมน์เดือนดังกล่าวให้เป็นคอลัมน์เดียวกัน ลักษณะนี้สามารถทำได้ด้วยการใช้คำสั่ง Unpivot Columns 7. การรวมข้อมูลในลักษณะของการรวมแถวข้อมูล (คำสั่ง Append Queries) หลาย ๆ ครั้งในการเก็บข้อมูลในรูปแบบของไฟล์ Excel จะมีการเก็บข้อมูลที่มีรูปแบบเดียวกัน แต่แยกเป็นหลาย ๆ Sheet เพื่อความสะดวกในการทำรายงานสรุป แต่เมื่อต้องการนำข้อมูลทั้งหมดมารวมกันเพื่อวิเคราะห์เปรียบเทียบ จะต้องทำการรวมข้อมูลจากหลาย ๆ Sheet หรือแม้กระทั่งหลาย ๆ ไฟล์ ลักษณะนี้สามารถทำได้ด้วยการใช้คำสั่ง Append Queries แต่มีข้อสังเกตคือการจะรวมแถวข้อมูลได้นั้น ข้อมูลในแต่ละ Sheet หรือแต่ละไฟล์ จะต้องมีรูปแบบโครงสร้างแบบเดียวกัน เช่น มีจำนวนคอลัมน์, ชื่อคอลัมน์, ลำดับของคอลัมน์ ที่เหมือนกัน 8. การรวมข้อมูลในลักษณะของการอ้างอิงคอลัมน์ (คำสั่ง Merge Queries) จะเป็นการรวมข้อมูลจาก 2 ตาราง/Sheet/ไฟล์ โดยมีคอลัมน์อ้างอิงข้อมูลซึ่งกันและกัน เช่น ข้อมูลรายละเอียดการขายสินค้า กับข้อมูลสินค้า จะมีคอลัมน์อ้างอิงกันคือคอลัมน์รหัสสินค้า การรวมข้อมูลลักษณะนี้สามารถทำได้ด้วยการใช้คำสั่ง Merge Queries จากที่ได้กล่าวมา เป็นเพียงตัวอย่างการใช้งาน Power BI ในการเตรียมข้อมูลเบื้องต้นเท่านั้น ทั้งนี้ตัวโปรแกรมเองยังมีความสามารถในการเตรียมข้อมูลในลักษณะอื่นๆ อีก ซึ่งความสามารถในส่วนนี้มีความสำคัญและช่วยให้การสร้าง Visualization สะดวกมากขึ้น
24 April 2021

บทความ

6 ปัจจัยสำคัญที่ทำให้ Visualization มีความสมบูรณ์ โดย ศาสตราจารย์ Edward Tufte
Edward Roft Tufte นักสถิติชื่อดัง ผู้บุกเบิกศาสตร์แห่ง visualisation จะมาพูดถึง 6 ปัจจัยสำคัญที่ทำให้การพล็อตกราฟมีความสมบูรณ์และเหมาะสมที่สุด!
7 December 2020

บทความ

สร้างแผนที่การระบาดโควิด-19 อย่างถูกหลักการ
ในปัจจุบันนี้เรามีเทคโนโลยีและเครื่องมือมากมายที่จะช่วยการนำเสนอข้อมูลในหลากหลายรูปแบบไม่ว่าจะเป็นแผนภาพหรือแผนที่ต่าง ๆ ได้อย่างง่ายดายและทันท่วงที สำหรับช่วงการระบาดของโควิดนี้ เราได้เห็นสื่อหรือหน่วยงานต่าง ๆ นำเสนอข้อมูลการระบาดของโรคทั้งในบริบทของประเทศไทยและในบริบทของสถานการณ์โลก แผนที่การระบาดถูกนำมาแชร์มากมายในโซเชียลมีเดีย และผู้อ่านหลายคนก็อาจจะอยากลองนำข้อมูลมาทำแผนที่เอง (ลองอ่าน การสร้าง Shape Map ใน Power BI จาก COVID-19 data) วันนี้เรามาลองดูกันดีกว่าว่าก่อนที่จะทำแผนที่อะไรนั้น อาจจะต้องนึกถึงหลักการอะไรบ้าง ในบทความนี้เราจะมาดูแผนที่แสดงการระบาดของโรคในประเทศจีน เนื่องจากมีการระบาดมานานกว่าใครเพื่อน และ เป็นประเทศแรกที่มีข้อมูลที่นำมาใช้ทำแผนที่ เดี๋ยวเรามาดูแผนที่แบบต่าง ๆ กันนะครับ (แผนที่ที่เราจะศึกษาเหล่านี้มาจาก ESRI ครับ) แผนที่แบบสี สำหรับเทคนิคที่ยอดนิยมที่สุดในการแสดงข้อมูลจำนวนในแผนที่นั้นก็คือ การใช้สีในแต่ละพื้นที่ หรือ เรียกว่า choropleth mapping โดยใช้สีเข้มขึ้นเพื่อสื่อถึงจำนวนที่มากขึ้นในพื้นที่นั้น ๆ เทคนิคนี้เป็นเทคนิคที่ดีเพราะสามารถทำให้ผู้เห็นเข้าใจได้ง่ายและรวดเร็ว แต่ก็สามารถทำให้ตีความหรือเข้าใจข้อมูลผิดได้ถ้าใช้ไม่ถูกวิธี จะผิดได้อย่างไรเรามาดูกันครับ รูปที่ 1 คือแผนที่การระบาดของโรคโควิดในประเทศจีนเมื่อวันที่ 24 กุมภาพันธ์ 2563 ที่ใช้เทคนิค choropleth mapping ภาพนี้อาจจะดูดีและเข้าใจง่ายใช่ไหมครับ แต่จริง ๆ แล้วแผนที่นี้หลอกตาเราอยู่อย่างหนึ่ง คือ สีที่ใช้แสดงถึงจำนวนรวมทั้งหมด (total) ในพื้นที่ ทว่าต้องอย่าลืมว่าแต่ละพื้นที่นั้นนอกจากจะมีขนาดไม่เท่ากันแล้วก็ยังมีจำนวนประชากรที่แตกต่างกัน การเปรียบเทียบสี (ซึ่งแสดงจำนวนผู้ติดเชื้อในพื้นที่) ของสองพื้นที่กันตรง ๆ อาจนำไปสู่ความเข้าใจที่คลาดเคลื่อนจากที่ควรจะเป็น ในแผนที่บอกว่ามณฑลหูเป่ยมีผู้ป่วยกว่า 65,000 คน ซึ่งดูเป็นจำนวนที่เยอะ แต่เราไม่รู้ว่าประชากรหูเป่ยมีจำนวนกี่คน มากกว่าหรือน้อยกว่ามณฑลข้างเคียง การเทียบด้วยจำนวนทั้งหมดอย่างเดียวจึงไม่ใช่การเปรียบเทียบที่ดีนัก นั่นจึงเป็นหลักการในการทำแผนที่ว่าการใช้สีแบบนี้ไม่ควรจะแสดงถึงค่ารวมของทั้งพื้นที่ นอกจากนี้อาจจะทำให้คนอ่านติดภาพในหัวไปว่าการระบาดนั้นเกิดขึ้นนั้นกระจายออกไปทั่วทั้งมณฑล ทั้งที่ความเป็นจริงนั้นการระบาดอาจจะถูกจำกัดอยู่ในเมืองใหญ่ในใจกลางมณฑลอย่างเดียวก็เป็นได้  อีกอย่างหนึ่งที่ต้องคำนึงถึงเมื่อใช้ choropleth mapping ก็คือ color scheme หรือ เกณฑ์ในการใช้สี ในรูปที่ 1 นี้มีการใช้จำนวนผู้ป่วย 1000 คนเป็นค่าสูงสุดและให้เป็นสีเข้มที่สุด ซึ่งมีอยู่ห้ามณฑลด้วยกัน ถ้าดูแผนที่นี้อย่างเผิน ๆ อาจเข้าใจว่าห้ามณฑลนี้มาการระบาดพอ ๆ กัน ใช่ไหมครับ… ผิดครับ ลองมาดูกราฟจะเห็นได้ว่าหูเป่ยมีปริมาณสูงกว่าอีกสี่มณฑลมาก ถ้าดูกราฟแท่งนี้แล้วกลับไปมองแผนที่ในรูป 1 จะพบว่ามันสื่อความหมายต่างกันสิ้นเชิง ซึ่งเป็นเพราะว่าการใช้ 1000 เคสผู้ป่วยเป็นตัวแบ่งสีนั้นอาจจะไม่ใช่ทางเลือกที่ดีนัก  จากสองข้อนี้เราควรจะทำอย่างไรดี ถึงจะได้แผนที่ที่ดูแล้วไม่ทำให้เข้าใจผิด? เราลองมาดูแผนที่อีกชิ้นที่นำเสนอข้อมูลเดียวกันกันนะครับ อย่างแรกเลยแผนที่นี้เปลี่ยนมาใช้สีน้ำเงินแทน เนื่องจากสีแดงเป็นสีที่สื่อถึงอารมณ์รุนแรง ถ้าย้อนกลับไปดูแผนที่ในรูปที่ 1 จะเห็นได้ว่าการที่มีสีแดงทั่วทั้งประเทศ อาจจะทำให้รู้สึกว่ามันแดงหมดทั้งประเทศแล้วนะหรืออาจะสื่อถึงความตายในขณะที่เรานำเสนอเพียงจำนวนผู้ป่วยไม่ได้หมายถึงจำนวนผู้เสียชีวิต การใช้สีแดงจะเป็นการเพิ่มอารมณ์ไปโดยที่ไม่จำเป็น (ถึงแม้จะดูสวยก็ตามเถอะ) แต่การใช้สีอื่นก็สามารถสื่อความหมายได้เหมือนกัน อย่างที่สองการใช้สีของแผนที่นี้สื่อถึงอัตราส่วนผู้ป่วยต่อจำนวนประชากร ไม่ได้หมายถึงจำนวนผู้ป่วยทั้งหมด ซึ่งนี่ทำให้สามารถแสดงได้ว่าการมีผู้ป่วย 10 คนในเมืองใหญ่ กับ 10 คนในหมู่บ้านเล็ก ๆ นั้นเห็นถึงความรุนแรงต่างกัน อย่างที่สามหูเป่ยมีผู้ติดเชื้อ 111 คนต่อแสนคน ในขณะที่มณฑลอื่นมีไม่ถึง 3 คนต่อแสนคน จึงใช้สีที่ต่างจากมณฑลอื่นอย่างเห็นได้ชัด ซึ่งแสดงให้เห็นถึงความแตกต่างที่ชัดเจนยิ่งขึ้น การใส่ label และ legend ที่เหมาะสมก็ช่วยให้ตีความข้อมูลได้ถูกต้องมากขึ้น อย่างไรก็ตามการใช้ choropleth mapping ก็ไม่ได้เป็นวิธีเดียวในการนำเสนอข้อมูลบนแผนที่ แล้วยังมีวิธีอื่นอีกไหม? แผนที่แบบจุด เราสามารถใช้แผนที่แบบจุดกระจาย หรือ dot density map แทนการใช้สีเพื่อแสดงข้อมูลผู้ป่วยได้ โดยในรูปที่ 4 แต่ละจุดในภาพสื่อถึงผู้ป่วยสิบคน การใช้จุดทำให้เราสามารถนำเสนอจำนวนผู้ป่วยทั้งหมดได้เลย ไม่ต้องทำอัตราส่วนก่อน เพราะจุดแต่ละจุดนั้นมีขนาดเท่ากันจะไม่ทำให้เกิดการตีความผิดแบบในกรณีใช้สี เนื่องจากเราไม่รู้ตำแหน่งทีแท้จริงของผู้ป่วยจึงให้จุดจะกระจายแบบสุ่มในแต่ละพื้นที่ ซึ่งแสดงให้เห็นถึงความแตกต่างที่ชัดเจนระหว่างหูเป่ยและมณฑลอื่น ๆ ข้อเสียคือทำให้คนอ่านเข้าใจผิดว่าแต่ละจุดหมายถึงผู้ป่วยหนึ่งคน ดังนั้นการใส่ label ที่เหมาะสมจึงมีความจำเป็น แผนที่อีกแบบที่สามารถใช้ได้คือแผนที่แสดงด้วยสัญลักษณ์สัดส่วน หรือ proportional symbol map ซึ่งใช้ขนาดของวงกลมมาแสดงถึงจำนวนผู้ป่วย โดยที่พื้นที่ของวงกลมจะแสดงถึงจำนวนผู้ป่วยรวมของแต่ละมณฑล มีใครเห็นข้อแตกต่างของแผนที่นี้กับแผนที่ที่ผ่านมาไหมครับ? ในแผนที่นี้เราสามารถมองเห็นฮ่องกงและมาเก๊าได้ เนื่องจากสองเขตนี้มีขนาดเล็กทำให้ยากต่อการมองเห็นใน choropleth หรือ dot density map ในขณะที่แผนที่แบบ proportional symbol map ช่วยให้เราเห็นข้อมูลของพื้นที่ที่มีขนาดเล็กได้เพราะขนาดของวงกลมที่แสดงจะไม่ขึ้นกับขนาดของพื้นที่นั่นเอง เนื่องจากหูเป่ยมีตัวเลขผู้ป่วยสูงจุดอื่น ๆ จึงมีขนาดเล็กหมด เราสามารถแก้ปัญหานี้ได้โดยใช้อัตราส่วนแบบ logarithm หรือที่เรียกกันว่า log scale ในการแสดงขนาดของจุด จะทำให้เปรียบเทียบมณฑลอื่น ๆ ได้ง่ายยิ่งขึ้น แต่อย่าลืม legend ที่ชัดเจนเพื่อบอกว่าขนาดของวงกลมหมายถึงอะไร แผนที่แบบอื่น ๆ เทคนิคที่กล่าวมาทั้งหมดก็น่าจะเพียงพอแล้ว ที่จะนำมาออกแบบแผนที่แสดงข้อมูล แต่จริง ๆ แล้วมันก็ยังมีอีกหลายอย่าง ซึ่ง”อาจจะ”นำมาใช้ได้ เทคนิคแรกเลยที่จะพูดถึงคือการใช้แผนที่ความร้อนหรือ heat map… ดูไม่งามเลยจริงไหมครับ แผนที่นี้สร้างโดยการประมาณค่าตัวเลขในพื้นที่ต่าง ๆ ให้ครอบคลุมทั้งประเทศ โดยใช้ค่าตั้งต้นจากผู้ป่วยในแต่ละมณฑลเป็นจุดกลางมณฑล ปัญหาคือมณฑลในจีนมีขนาดใหญ่มาก จุดกลางมณฑลที่ใช้ในการคำนวณอาจจะไม่ใช่จุดกึ่งกลางของการระบาดในมณฑลนั้น ๆ อีกอย่างหนึ่งคือเราดูแผนที่นี้แล้วดูไม่ออกว่าจุดเริ่มต้นของการระบาดอยู่ที่หูเป่ย ส่วนสีที่ใช้นั้นก็ดูไม่ค่อยสื่อถึงกับการระบาดของโรคเท่าไร แล้วแผนที่สามมิติล่ะ ใคร ๆ ก็ชอบสามมิติ แต่ผมว่าไม่ การใส่ effect สามมิติเข้าไปในแผนที่นั้น ไม่ได้ให้ข้อมูลอะไรออกมามากและดูเหมือนจะเบี่ยงเบนความสนใจของผู้อ่านไปจากข้อมูลที่ต้องการจะนำเสนอเสียด้วยซ้ำ แถมอย่างในรูปที่ 8 กราฟสามมิติที่แสดงจำนวนผู้ป่วยเป็นความสูง อาจจะบดบังข้อมูลของมณฑลบางมณฑลอีกด้วย แผนที่แบบ interactive อย่างสุดท้ายที่ผมจะพูดถึงคือการทำ Interactive map บนเว็บหรือ Dashboard ปัจจุบันมีเครื่องมือมากมายเช่น PowerBI หรือ Tableau (ตัวอย่าง จาก Tableau) ซึ่งทำให้เราสามารถเล่นกับแผนที่ได้ เช่น สามารถคลิกที่แต่ละพื้นที่แล้วแสดงข้อมูลแบบละเอียดออกมา หรือเมื่อซูมเข้าไปจะทำให้ข้อมูลที่แสดงออกมาละเอียดขึ้น เช่น เปลี่ยนจากจำนวนรวมของมณฑลเป็นจำนวนรวมแต่ละเมืองแทน การทำแผนที่เหล่านี้ก็ยังต้องคำนึกถึงสิ่งที่เขียนไว้ในบทความนี้เพื่อที่จะไม่ให้สื่อสารผิดวิธี ปัญหาหนึ่งของการทำ interactive map แบบนี้ คือผู้ใช้สามารถซูมเข้าไปได้เรื่อย ๆ ซึ่งหากซูมมากเกินไปกว่าขีดจำกัดของข้อมูลที่มีอาจจะทำให้คนเข้าใจผิดได้ เช่น ถ้าซูมเข้าไปที่จังหวัดจนมองไม่เห็นจุดที่แสดงถึงข้อมูล จะทำให้มองไม่เห็นจุดแล้วเข้าใจผิดได้ว่าในพื้นที่นั้นไม่มีการระบาดเป็นต้น จึงควรจำกัดการซูมไม่ให้เล็กกว่าขีดจำกัดของการแสดงผล และนี่ก็เป็นหลักการนำเสนอข้อมูลบนแผนที่ หวังว่าผู้อ่านทุกท่านจะนึกถึงหลักการเหล่านี้ ก่อนที่นำไปใช้ในการออกแบบแผนที่แสดงข้อมูลไม่ว่าจะเป็นเรื่องของสถานการณ์ระบาดของไวรัสโควิดหรือเรื่องอื่น ๆ ก็ตามครับ บทความแปลจาก https://www.esri.com/arcgis-blog/products/product/mapping/mapping-coronavirus-responsibly/
7 April 2020
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.