สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

ทำความรู้จักแผนภูมิปฏิทินความร้อน Calendar Heatmaps

Dec 25, 2023

กลับมาอีกครั้งกับบทความเกี่ยวกับ Data Visualization ซึ่งในครั้งนี้จะเป็นการนำเสนอการประยุกต์ใช้งานแผนภูมิความร้อนกับข้อมูลอนุกรมเวลาให้ออกมาเป็นรูปแบบแผนภูมิความร้อนชนิดหนึ่งที่เรียกว่า แผนภูมิปฏิทินความร้อน (Calendar Heatmaps) ก่อนอื่น ๆ เลย เรามาทำความรู้จักเบื้องต้นเกี่ยวกับแผนภูมิความร้อน (Heatmaps) กัน

กำเนิดแผนภูมิความร้อน

ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม เช่น เชื้อชาติ ต้นกำเนิด อายุ ในปารีส ทั้งนี้ในแผนภูมิความร้อนนี้ประกอบไปด้วยเขตพื้นที่รายแถวของปารีสเทียบกับค่าสถิติทางสังคมกว่า 30 ค่า โดยใช้สีทั้งหมด 4 สี คือ สีขาว สีน้ำเงิน สีเหลือง และ สีแดง ในการบ่งบอกถึงค่าต่าง ๆ แทนตัวเลข

ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua[NP1] [AC2]  ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม เช่น เชื้อชาติ ต้นกำเนิด อายุ ในปารีส ทั้งนี้ในแผนภูมิความร้อนนี้ประกอบไปด้วยเขตพื้นที่รายแถวของปารีสเทียบกับค่าสถิติทางสังคมกว่า 30 ค่า โดยใช้สีทั้งหมด 4 สี คือ สีขาว สีน้ำเงิน สีเหลือง และ สีแดง ในการบ่งบอกถึงค่าต่าง ๆ แทนตัวเลข

ทำให้ผู้คนเริ่มนำเทคนิคของ Loua ไปใช้ในเป็นส่วนประกอบของการแสดงแผนภูมิแบบตารางมากขึ้นอย่างแพร่หลายในช่วงปีคริสต์ศักราชที่ 19 จนถึงปัจจุบัน

ประเภทของแผนภูมิความร้อน

เมื่อแผนภูมิความร้อน (Heatmaps) หรือแผนภูมิอุณหภูมิ ถูกใช้งานมากขึ้น จึงมีรูปแบบที่ถูกพัฒนาขึ้นอย่างต่อเนื่อง ซึ่งแบ่งออกเป็นหลัก ๆ ทั้งหมด 2 ชนิด ได้แก่

  • แบบตาราง (Grid) ซึ่งสามารถถูกแบ่งชนิดย่อยได้ อาทิเช่น แผนภูมิความร้อนแบบตาราง แผนภูมิเพื่อหาความสัมพันธ์ (Correlation) หรือแผนภูมิความร้อนตามอนุกรมเวลา เป็นต้น
  • แบบพื้นที่ (Spatial) เช่น แผนภูมิความร้อนแบบภูมิศาสตร์ หรือแผนที่เฉดสี (Choropleth) ก็ถือว่าเป็นแผนที่ความร้อนด้วยเช่นเดียวกัน
ภาพที่ 2 ประเภทของแผนภูมิความร้อน

แผนภูมิความร้อนกับข้อมูลเชิงอนุกรมเวลา

จากที่ผู้เขียนได้เกริ่นไว้ข้างต้นที่จะมีการประยุกต์ใช้ข้อมูลเชิงอนุกรมเวลากับแผนภูมิความร้อนเข้าด้วยกัน ซึ่งโดยส่วนใหญ่การแสดงแผนภาพข้อมูลอนุกรมเวลา (Time-Series Data) จะมาในรูปแบบของกราฟเส้น อาทิเช่น กราฟเส้นแสดงข้อมูลการขายในช่วง 30 ปี กราฟเส้นแสดงข้อมูลยอดผู้เข้าชมวีดีโอ หรือกราฟหลากเส้นแสดงยอดขายตามปีเปรียบเทียบกับเดือน ซึ่งกราฟเส้นนี้นอกจากจะแสดงข้อมูลและเปรียบเทียบข้อมูล ยังแสดงถึงแนวโน้มในอนาคตหรือความสม่ำเสมอที่เกิดขึ้นในช่วงเวลาต่าง ๆ อย่างไรก็ตามการแสดงข้อมูลในเชิงอนุกรมเวลา อาจจะมีอุปสรรคในเชิงของความละเอียดของเวลา การจัดทำกราฟเส้นอาจไม่ตอบโจทย์หรือยากในการสังเกตและวิเคราะห์แนวโน้มเมื่อลงลึกถึงข้อมูลรายวัน ดังนั้นผู้เขียนจึงอยากจะให้ทุกท่านได้รู้จักกับ “แผนภูมิปฏิทินความร้อน”

แผนภูมิปฏิทินความร้อน

การเลือกใช้แผนภูมิปฏิทินความร้อนเพื่อนำเสนอข้อมูลจำเป็นต้องคำนึงถึงสิ่งที่อยากจะนำเสนอ หากเราต้องการนำเสนอข้อมูลอนุกรมเชิงเวลาในลักษณะรายวัน การใช้แผนภูมิปฏิทินความร้อนมาประยุกต์จึงเป็นอีกวิธีที่สามารถนำไปใช้งาน อาทิเช่น การแสดงการมีส่วนร่วมในโปรเจคบนเว็บไซต์ GitHub (ภาพที่ 4 บน) ว่ามีการทำงานหรือสนับสนุนมากน้อยเพียงใด หรือ การแสดงจำนวนอุบัติเหตุตามช่วงเวลาในแต่ละวันของสัปดาห์ (ภาพที่ 4 ล่าง) จะเห็นได้ว่าการแสดงข้อมูลแบบประยุกต์แผนภูมิความร้อนเข้าด้วยกันกับข้อมูลอนุกรมเวลา ก็ยังสามารถสังเกตและวิเคราะห์แนวโน้มของข้อมูลที่แสดงบนกราฟได้อีกด้วย

ภาพที่ 4 ตัวอย่างแผนภูมิความร้อนอนุกรมเวลา
บน GitHub – A hack to get a nice github commit heatmap
ล่าง Time Based Heatmaps in R

ทั้งนี้ผู้เขียนจึงขอยกตัวอย่างการประยุกต์ข้อมูลอนุกรมเวลาเข้ากับแผนภูมิความร้อน โดยจะแสดงเป็นแผนภูมิปฏิทินความร้อน ซึ่งข้อมูลที่ผู้เขียนเลือกนำมาใช้คือข้อมูล PM2.5 ในปี 2022 ทุกจุดตรวจจากเว็บไซต์ Air4Thai กรมควบคุมมลพิษ ซึ่งทางผู้เขียนได้มีการจัดการข้อมูลให้สะดวกต่อการจัดทำแผนภูมิข้อมูลในรูปแบบปฏิทิน

ภาพที่ 5 ตัวอย่างแผนภูมิปฏิทินความร้อน

จากข้อมูลที่ผู้เขียนนำมาใช้แสดงในแผนภูมิปฏิทินนี้ สามารถสังเกตได้ว่าในช่วงเดือนพฤษภาคมจนถึงกลางเดือนตุลาคมมีปริมาณค่าฝุ่น PM2.5 ที่ค่อนข้างน้อยเมื่อเทียบกับเดือนอื่นๆ ซึ่งในช่วงต้นปีที่มีการเปลี่ยนฤดูเป็นฤดูหนาว เช่น เดือนมกราคมและเดือนกุมภาพันธ์จะมีค่า PM2.5 ที่ค่อนข้างสูง และในส่วนท้ายปีเดือนพฤศจิกายนและเดือนธันวาคมเริ่มมีแนวโน้มการเพิ่มขึ้นของปริมาณฝุ่น PM2.5 ซึ่งมีความน่าจะเป็นที่จะลามไปถึงเดือนมกราคมและเดือนกุมภาพันธ์ในปี 2023

ข้อควรระวังในการใช้งานแผนภูมิปฏิทินความร้อน

อย่างไรก็ตามการจัดทำแผนภูมิความร้อนก็ยังมีข้อเสียในบางครั้ง การใช้แผนภูมิความร้อนที่ค่าของข้อมูลเป็นการไล่ระดับสีแทนค่าของช่วงข้อมูลอาจทำให้บางจุดยากต่อการเปรียบเทียบ สำหรับข้อมูลที่มีค่าใกล้เคียงกันการมองด้วยสายตาอาจไม่สามารถพบเจอความแตกต่างได้ ดังนั้นการจัดทำช่วงค่าข้อมูลจึงเป็นทางเลือกอีกทางหนึ่งสำหรับการใช้แผนภูมิความร้อน หรือการเลือกเฉดสีที่ต่างกันมาก ๆ เช่น น้ำเงินกับแดง เหลืองกับม่วง เป็นต้น โดยผู้เขียนก็อยากจะแนะนำเครื่องมือหนึ่งในการเลือกใช้สีแบบต่าง ๆ เครื่องมือนั้นก็คือ Colorbrewer

ภาพที่ 6 colorbrewer เครื่องมือในการช่วยเลือกสีและระดับสี

ในบทความนี้ เราได้ทำการสำรวจโลกของ ‘แผนภูมิปฏิทินความร้อน’ หรือ ‘Calendar Heatmaps’ อย่างละเอียด ตั้งแต่ประวัติของมัน การประยุกต์ใช้ จะเห็นได้ว่าแผนภูมิความร้อนไม่เพียงแต่เป็นเครื่องมือที่มีประสิทธิภาพในการสื่อสารข้อมูล แต่ยังสามารถเปิดเผยแนวโน้มและรูปแบบที่ไม่คาดคิดได้อีกด้วย

ความสามารถในการวิเคราะห์และนำเสนอข้อมูลเชิงลึกอย่างที่เราได้พูดถึงในบทความนี้ จะช่วยให้คุณเข้าใจว่าข้อมูลสามารถถูกเปลี่ยนเป็นข้อมูลที่มีคุณค่าและมีอิทธิพลได้อย่างไร เราหวังว่าคุณจะได้แรงบันดาลใจและความรู้ใหม่ๆ จากบทความนี้ และนำไปประยุกต์ใช้ในงานของคุณเอง

อย่าลืมติดตามเราสำหรับบทความต่อไป ที่จะพาคุณไปสำรวจเทคนิคการวิเคราะห์ข้อมูลและการนำเสนอข้อมูลอื่น ๆ ที่น่าตื่นเต้นไม่แพ้กัน ที่นี่ เราจะช่วยให้คุณเข้าถึงเครื่องมือและทักษะใหม่ ๆ ในการเปลี่ยนข้อมูลเป็นมูลค่าและเรื่องราวที่น่าจดจำ

เนื้อหาโดย อมร โชคชัยสิริภักดี
ตรวจทานและปรับปรุงโดย นววิทย์ พงศ์อนันต์

สำหรับผู้ที่สนใจขึ้นตอนการจัดทำแผนภูมิสามารถศึกษาได้จากบทความดังนี้

เอกสารอ้างอิง

Amorn Chokchaisiripakdee

Data Scientist at Big Data Institute (Public Organization), BDI

Navavit Ponganan

Editor-in-Chief and Senior Data Scientist at Big Data Institute (Public Organization), BDI