Geospatial

Geospatial

ข่าวและบทความที่เกี่ยวข้อง

All Geospatial

PostType Filter En

บทความ

ข้อมูลภูมิสารสนเทศแนวเขตการปกครอง กับปัญหาที่รอการแก้ไข (Geospatial Data on Administrative Boundaries and Pending Issues)
ข้อมูลเกี่ยวกับแนวเขตการปกครอง (ขอบเขตจังหวัด อำเภอ ตำบล) ในระบบภูมิสารสนเทศมีความสำคัญมากในการจัดการที่มีประสิทธิภาพในพื้นที่ เนื่องจากมีผลต่อการอ้างอิงขอบเขตอำนาจหน้าที่ของหน่วยงานราชการต่าง ๆ โดยกรมการปกครองถือว่าเป็นหน่วยงานหลักที่มีหน้าที่ดูแลในการจัดเก็บข้อมูล (การทบทวนหน่วยงานที่รับผิดชอบชุดข้อมูลภูมิสารสนเทศพื้นฐาน FGDS) โดยได้ดำเนินการสำรวจ ตรวจสอบ และปรับปรุงข้อมูลดังกล่าวตลอดเวลาตั้งแต่ปี พ.ศ. 2546 ภายใต้โครงการปรับปรุงข้อมูลแนวเขตการปกครองในระบบภูมิสารสนเทศ (GIS) มาตราส่วน 1:50000 อย่างไรก็ตามยังมีการปรับปรุงแก้ไขแนวเขตการปกครองเพียงบางพื้นที่เท่านั้น และยังไม่มีการปรับปรุงข้อมูลให้ครอบคลุมทั่วถึงและถูกต้องตามปัจจุบันในทุกพื้นที่ของประเทศ โดยข้อมูลแนวเขตการปกครองในระบบภูมิสารสนเทศ ที่ถูกปรับปรุงล่าสุดโดยกรมการปกครอง อยู่ที่ ปี 2556 รูปแบบในการใช้งานข้อมูลขอบเขตการปกครอง ก่อนที่ผมจะลงลึกไปถึงปัญหา อยากขออธิบายคร่าว ๆ ว่าเราใช้ขอบเขตการปกครองเพื่ออะไรบ้าง  ในกรณีนี้สามารถแยกได้ 2 กรณี กรณีที่ 1 ใช้เพื่อนำเสนอ หรือสื่อสารข้อมูล (Data Storytelling) โดยไม่ต้องการความแม่นยำทางภูมิศาสตร์ ยกตัวอย่าง ภาพที่ 1 จะเห็นได้ว่าแผนที่นี้ต้องการที่จะสื่อสารว่าคนในจังหวัดกระบี่ ขาดสารอาหารประเภททองแดง การทำแผนที่ประเภทนี้ก็เพียงแค่เน้นให้จังหวัดกระบี่สามารถสังเกตได้ง่ายกว่าจังหวัดอื่น โดยไม่ได้ต้องการความถูกต้องของแนวเขตจังหวัด เป็นต้น สำหรับนักวิทยาศาสตร์ข้อมูลที่ใช้เครื่องมือ BI ต่าง ๆ ก็อาจจะคุ้นชินกับการใช้เครื่องมือเหล่านี้ในการทำแผนที่ในกรณีนี้เป็นอย่างดี แต่ก็ยังมีอีกกรณีที่เครื่องมือ BI ยังไม่อาจตอบโจทย์ได้นั่นคือ กรณีที่ 2 ใช้เพื่อการพิสูจน์สิทธิ์ การแบ่งหน้าที่ความรับผิดชอบ การกำหนดขอบเขตการเข้าทำประโยชน์ หรือการแบ่งผลประโยชน์ ต้องการการคำนวณขนาดพื้นที่ ฯลฯ ยกตัวอย่างดังภาพที่ 2 หมายเหตุ ในกรณีนี้ไม่ได้บอกว่าเราสามารถใช้ข้อมูลภูมิสารสนเทศขอบเขตการปกครองอ้างอิงได้โดยตรง เพราะต้องมีการตรวจสอบความถูกต้องโดยการรังวัดที่ดินเพื่อปักเขตและทำเขตที่แม่นยำ หน่วยงาน หมายเหตุ แหล่งที่มา กรมการปกครอง (DOPA) ข้อมูลปี 2556 สามารถติดต่อผ่านช่องทางของหน่วยงาน กรมพัฒนาที่ดิน (LDD) ข้อมูลปี 2661 (ขอบเขตจังหวัดเชียงหม่ ที่แนบมากับข้อมูลการใช้ที่ดิน) Link Information Technology Outreach Services (ITOS) (Reference from file’s metadata) ข้อมูลนี้ ICRC ได้รับมาจาก กรมที่ดินราชอาณาจักรไทย (RTSD) และถูกเผยแพร่ให้ OCHA ใช้งาน Link ตารางที่ 1 แหล่งข้อมูลขอบเขตการปกครอง จากภาพที่ 2 จะสังเกตได้ว่าข้อมูลจุดความร้อนเกิดขึ้นอยู่ระหว่างประเทศไทยและประเทศพม่า ซึ่งก็อาจเกิดข้อถกเถียงเรื่องขอบเขตความรับผิดชอบต่อจุดความร้อนดังกล่าวได้ จะเห็นได้ว่าขอบเขต จังหวัด อำเภอ ตำบล เป็นข้อมูลภูมิสารสนเทศพื้นฐานที่มักถูกนำมาใช้ประกอบการวิเคราะห์ข้อมูลด้านต่าง ๆ แต่ทว่าปัญหาใหญ่ที่พบเจอคือ ข้อมูลเหล่านี้มักมีที่มาจากแหล่งข้อมูลที่หลากหลาย ทำให้เกิดปัญหาในการใช้งานร่วมกัน บทความนี้มุ่งเน้นไปที่การอภิปรายปัญหาที่อาจเกิดขึ้นจากการใช้ข้อมูลดังกล่าว ปัญหาที่พบเจอ ผลกระทบ ปัญหาเหล่านี้ส่งผลกระทบต่อการวิเคราะห์ข้อมูลภูมิสารสนเทศ รวมไปถึงการบริหารงาน ตัวอย่างเช่น แนวทางแก้ไข (ดีที่สุดที่เราจะสามารถทำได้ ณ ขณะนี้) จะเห็นได้ว่าแนวทางแก้ไขที่เราเสนอไปก็ไม่ได้เป็นการแก้ไขที่ยั่งยืน ในการนี้ ผู้เขียนขออนุญาตเสนอแนวทางในการบริหารจัดการข้อมูลชุดนี้ดังต่อไปนี้ ความเคลื่อนไหวของหน่วยงานผู้รับผิดชอบ ในปัจจุบัน กรมการปกครองมีโครงการจัดทำข้อมูลภูมิสารสนเทศขั้นพื้นฐานหลัก ชั้นข้อมูลแนวเขตการปกครองระดับหมู่บ้าน มาตรส่วน 1:4000 ด้วยงบประมาณกว่า 700 ล้านบาท ซึ่งมีเป้าหมายที่จะแนวเขตการปกครองตำบล อำเภอ และจังหวัดในพื้นที่ระดับหมู่บ้านทั้งหมด 63193 หมู่บ้าน และคาดว่าโครงการนี้จะเสร็จสิ้นในปี พ.ศ. 2569 บทสรุป แม้ว่าปัจจุบันจะยังมีปัญหาในการใช้งานข้อมูลขอบเขตการปกครองจากหลายแหล่งที่มาและความไม่สอดคล้องกัน แต่เรามีแนวทางในการแก้ไขปัญหาเบื้องต้นเพื่อลดผลกระทบ เช่น การเลือกใช้ข้อมูลจากแหล่งที่น่าเชื่อถือ ตรวจสอบระบบพิกัดให้ตรงกัน และติดตามการเปลี่ยนแปลงเขตการปกครองอย่างใกล้ชิด รวมถึงการจัดทำ metadata อย่างละเอียด นอกจากนี้ กรมการปกครองได้ตระหนักถึงปัญหาดังกล่าวและมีโครงการจัดทำข้อมูลภูมิสารสนเทศขอบเขตการปกครองในระดับหมู่บ้านทั่วประเทศอย่างครอบคลุมและมีมาตรฐานเดียวกัน ซึ่งหากดำเนินการได้สำเร็จตามแผน ก็จะเป็นการแก้ไขปัญหาได้อย่างยั่งยืน การริเริ่มโครงการสำคัญนี้ถือเป็นความหวังที่จะทำให้ข้อมูลขอบเขตการปกครองมีความถูกต้อง ทันสมัย และเป็นมาตรฐานเดียวกันทั่วประเทศ ซึ่งจะส่งผลให้การนำข้อมูลไปใช้งานมีประสิทธิภาพสูงสุดและแก้ไขปัญหาข้อขัดแย้งต่าง ๆ ได้อย่างมีประสิทธิผล บทความโดย นววิทย์ พงศ์อนันต์ตรวจทานและปรับปรุงโดย อิสระพงษ์ เอกสินชล อ้างอิง
1 May 2024

บทความ

อะไรอะไรก็ Shapefile: ข้อมูลภูมิสารสนเทศยุคใหม่มีทางเลือกอื่นหรือไม่?
โลกของ GIS รูปแบบไฟล์ที่เรียกว่า Shapefile ได้ถูกใช้งานกันอย่างแพร่หลาย แต่เมื่อเวลาผ่านไป Shapefile ก็ไม่อาจรองรับการใช้งานที่หลากหลาย เราผู้ใช้จะสามารถเลือกอะไรมาทดแทนได้บ้าง สามารถอ่านได้ในบทความนี้
18 March 2024

บทความ

คัมภีร์การทำแผนที่บน MS Power BI ฉบับประเทศไทย The Cartographic Bible for MS Power BI, Thailand Edition
การวิเคราะห์ข้อมูลภูมิศาสตร์และตำแหน่งที่ตั้งเป็นสิ่งที่สำคัญต่อการตัดสินใจในธุรกิจของหลายภาคส่วน การแสดงผลแผนที่แบบอินเตอร์แอคทีฟเป็นอีกหนึ่งวิธีที่ช่วยให้เราสามารถแสดงข้อมูลตำแหน่งในรูปแบบแผนที่ได้อย่างสะดวก และช่วยให้เราสามารถเข้าใจแนวโน้มของข้อมูลที่ซับซ้อนได้ง่ายขึ้น
19 May 2023

บทความ

เทคนิคการ Feature Engineering จากพิกัดละติจูด ลองจิจูด
ในปัจจุบัน เราจะพบข้อมูลพิกัดบอกตำแหน่ง ละติจูด (Latitude) และลองจิจูด (Longitude) เป็นจำนวนมาก โดยการนำไปใช้ประโยชน์เชิงวิเคราะห์นั้น หากเลือกใช้ ละติจูด และลองจิจูดเป็นสองตัวแปรแยกกันมักจะได้ผลออกมาแล้วตีความยาก ในบทความนี้จะทำการอธิบายและนำเสนอตัวอย่างวิธีการ Feature Engineering จากข้อมูลพิกัดจุด การเลือกใช้ ละติจูด และลองจิจูดเป็นสองตัวแปรแยกกันมักจะได้ผลออกมาแล้วตีความยาก การสร้าง Feature จากข้อมูลพิกัดจุด (Geospatial Data) นั้นจำเป็นต้องใช้ความเข้าใจในความสัมพันธ์จากบริบทของภูมิศาสตร์ กับโจทย์ปัญหาที่เราต้องการแก้ เช่น หากโจทย์ต้องการทำนายราคาบ้าน เราอาจจะเริ่มด้วยการคิดว่ามีปัจจัยใดบ้างที่มีผลต่อราคา เช่น ระยะทางจากสถานีรถไฟฟ้า, ระยะทางจากศูนย์กลางเมือง, ระยะห่างจากทะเล เป็นต้น ดังนั้นเราจะต้องแปลงปัจจัยดังกล่าวให้เป็นตัวเลขเพื่อนำไปใช้ในการวิเคราะห์ และนำไปใช้ประโยชน์ได้ ในบทความนี้ เราจะยกตัวอย่างการใช้ข้อมูลพิกัดจุดเพื่อใช้ทำนายราคาบ้านโดยใช้ข้อมูล Kaggle California Housing Prices ในการวิเคราะห์ ซึ่งเป็นข้อมูลสำรวจ Census ในปี 1990 แต่ละระเบียนจะเป็นข้อมูลของสิ่งปลูกสร้าง 1 บล็อก ในชุดข้อมูลนี้จะมีข้อมูลอยู่ทั้งหมด 10 คอลัมน์ แต่เราจะเลือกใช้แค่ 4 คอลัมน์ ได้แก่ รูปภาพประกอบในบทความนี้สามารถสร้างได้จากชุดคำสั่งใน Python ซึ่งผู้อ่านสามารถทำตามได้จาก House Value California: Feature Engineering หากเรานำพิกัดจุดมาใช้โดยตรงนั้นจะไม่ค่อยได้ประโยชน์เท่าไหร่ เพื่อให้เห็นภาพชัดเจนเราจะใช้ scatter plot ระหว่างตัวแปรและค่าราคาบ้าน จะเห็นได้ว่าตัวแปรละติจูดและลองจิจูด นั้นไม่ได้มีความเกี่ยวข้องกับราคาบ้านที่ชัดเจน ดังนั้นเราอาจจำเป็นต้องผ่านกระบวนการอื่นเพิ่มเติมก่อนที่จะนำในการนำตัวแปรสองตัวนี้ไปใช้ประโยชน์ได้ การใช้ Diagonal เพื่อประเมินระยะห่างจากชายฝั่ง จาก Fig.2 จะมองเห็นได้ชัดเจนว่าบ้านที่อยู่ใกล้กับชายฝั่งจะมีราคาแพงมากกว่าบ้านที่อยู่ห่างจากชายฝั่ง โดยเราสามารถแปลความใกล้กับชายฝั่งได้แบบง่ายๆ โดยการนำเอาพิกัดละติจูดและลองจิจูดมาบวกกันเป็น Feature ใหม่ที่ชื่อว่า Diagonal เมื่อย้อนกลับไปดูที่ Fig. 2 จะสามารถเห็นได้ว่าถ้าผลบวกน้อยจะใกล้ชายฝั่ง (เส้นสีเขียว) ถ้าผลบวกมากจะอยู่ห่างจากชายฝั่ง (เส้นส้ม) [1] จะเห็นได้ว่า Diagonal นั้นมีความสัมพันธ์กับราคาบ้านที่ชัดเจนขึ้นและสอดคล้องกับ Label ที่ได้มาจากคอลัมน์ ocean_proximity การคำนวณ Diagonal นั้นมีข้อดีที่ใช้ง่ายและสามารถมองเห็นได้ด้วยตาเปล่า แต่อาจจะต้องปรับการใช้ตามลักษณะรูปร่างขอเมือง ในกรณีนี้สามารถใช้ได้ดีเป็นกรณีพิเศษเนื่องจากรัฐ California มีลักษณะเป็นแนวเส้นเฉียงจากซ้ายบนลงขวาล่าง (ตามรูป) โดยในประเทศไทยนั้นมีจังหวัดที่มีรูปร่างที่เหมาะกับการใช้ Diagonal ได้แก่ กระบี่, ตรัง และสตูล เป็นต้น การใช้ Principal Component Analysis ในส่วนนี้เราจะนำการใช้ Principal Component Analysis [3]เพื่อนำแนวความคิดของการใช้ diagonal มาใช้กับเมืองที่อยู่ติดชายฝั่ง แต่อาจจะไม่ได้เฉียงจากซ้ายบนลงขวาล่าง โดยจังหวัดในประเทศไทยที่เข้าข่ายนี้ ได้แก่ ชลบุรี และ ประจวบครีขันธ์ การใช้ Principal Component Analysis (PCA) นั้นจะให้ตัวโปรแกรมหาแกนที่เหมาะสมให้เราเอง โดยหลักการคร่าวๆนั้นตัวโปรแกรมจะทำการลากเส้นบนแผนที่ (ตาม Fig.4) แล้วเลือกแกนที่มีการกระจายตัวของข้อมูลมากที่สุดเป็น PCA 1 และเลือกแกนที่ตั้งฉากกันเป็น PCA 2 จะเห็นได้ว่าค่าของ PCA 2 ที่ได้มานั้นจะมีค่าสูงเมื่อบ้านอยู่ห่างจากชายฝั่ง และต่ำเมื่อบ้านอยู่ใกล้ชายฝั่ง จึงทำให้นำมาใช้แทน Diagonal ได้ แต่วิธีการนี้ก็ยังมีข้อจำกัดอยู่ที่ว่าสามารถใช้ได้กับเมืองที่มีลักษณะเป็นแนวเฉียงเท่านั้น ซึ่งในกรณีอื่นนั้นอาจจะนำความรู้เรื่องตำแหน่งของใจกลางเมืองมาช่วยในการสร้าง Feature เพื่อนำมาใช้ประโยชน์ได้ การใช้ระยะห่างจากเมืองใหญ่ ย้อนกลับไปที่ Fig. 2 เราอาจสังเกตได้ว่าบ้านที่มีราคาสูงจะกระจุกตัวอยู่ใกล้ตัวเมือง Los Angeles และ San Francisco ซึ่งค่อนข้างสมเหตุสมผล เนื่องจากมีระยะใกล้กับสิ่งอำนวยความสะดวกและสถานที่ทำงานมากกว่า ทำให้มีความราคาแพงกว่าบ้านที่อยู่ห่างจากตัวเมือง ในกรณีนี้เราอาจจะเลือกใช้ระยะห่างจากเมืองใหญ่ถึงบ้านใช้เป็น feature ที่ใช้ในการทำนายราคาบ้านได้ โดยการคำนวณระยะทางจากพิกัดละติดจูด และ ลองจิจูด ตามหลักแล้วจะต้องใช้ฟังก์ชั่น Haversine (มีฟังก์ชั่นสำเร็จรูปใน Python – คู่มือการใช้) เพื่อการคำนวณให้แม่นยำ แต่ในกรณีนี้เราใช้เพื่อนำมาทำ Feature Engineering อาจจะไม่ต้องการความแม่นยำมาก เราอาจจะใช้สูตรพิทาโกรัส เพื่อคำนวณระยะห่างแบบง่ายๆ โดยเราจะเลือกใช้ระยะทางจากเมืองที่อยู่ใกล้บ้านที่สุดมาใช้คำนวณได้ สรุปผล การทำ Feature Engineering นั้น สิ่งที่จะต้องคำนึงถึงเป็นอย่างแรกคือลักษณะรูปร่างของเมืองและความสัมพันธ์ของข้อมูล ในบทความนี้เราได้ยกตัวอย่างรัฐ California ซึ่งมีลักษณะเฉพาะตัว โดยได้ยกตัวอย่างการทำ Feature Engineering อยู่ 3 วิธีคือ Diagonal, Principal Component Analysis และ การใช้ระยะห่างจากเมืองใหญ่ โดยเน้นวิธีการที่สามารถตีความได้ง่ายและไม่ซับซ้อน โดยในบางกรณีการนำข้อมูล Geospatial ไปใช้ยังมีวิธีอื่นที่ไม่ได้รวมไว้อยู่ในบทความนี้ เช่น Clustering, geohash [6] โดยผู้ทำการวิเคราะห์สามารถเลือกใช้ให้เข้ากับบริบทของโจทย์ อ้างอิง
28 July 2022

บทความ

เข้าถึง Geospatial Big Data ง่าย ๆ ด้วย Google Earth Engine
Google Earth Engine ถือว่าเป็น Game Changer ในโลกของ Geospatial ทำให้เราสามารถเข้าถึงข้อมูลการสำรวจโลกได้อย่างรวดเร็ว และเปลี่ยนวิธีการเดิมๆในการวิเคราะห์ข้อมูลดาวเทียม เรามาทำความรู้จักกับ Google Earth Engine กันนะครับ
8 September 2020

บทความ

สร้างแผนที่การระบาดโควิด-19 อย่างถูกหลักการ
ในปัจจุบันนี้เรามีเทคโนโลยีและเครื่องมือมากมายที่จะช่วยการนำเสนอข้อมูลในหลากหลายรูปแบบไม่ว่าจะเป็นแผนภาพหรือแผนที่ต่าง ๆ ได้อย่างง่ายดายและทันท่วงที สำหรับช่วงการระบาดของโควิดนี้ เราได้เห็นสื่อหรือหน่วยงานต่าง ๆ นำเสนอข้อมูลการระบาดของโรคทั้งในบริบทของประเทศไทยและในบริบทของสถานการณ์โลก แผนที่การระบาดถูกนำมาแชร์มากมายในโซเชียลมีเดีย และผู้อ่านหลายคนก็อาจจะอยากลองนำข้อมูลมาทำแผนที่เอง (ลองอ่าน การสร้าง Shape Map ใน Power BI จาก COVID-19 data) วันนี้เรามาลองดูกันดีกว่าว่าก่อนที่จะทำแผนที่อะไรนั้น อาจจะต้องนึกถึงหลักการอะไรบ้าง ในบทความนี้เราจะมาดูแผนที่แสดงการระบาดของโรคในประเทศจีน เนื่องจากมีการระบาดมานานกว่าใครเพื่อน และ เป็นประเทศแรกที่มีข้อมูลที่นำมาใช้ทำแผนที่ เดี๋ยวเรามาดูแผนที่แบบต่าง ๆ กันนะครับ (แผนที่ที่เราจะศึกษาเหล่านี้มาจาก ESRI ครับ) แผนที่แบบสี สำหรับเทคนิคที่ยอดนิยมที่สุดในการแสดงข้อมูลจำนวนในแผนที่นั้นก็คือ การใช้สีในแต่ละพื้นที่ หรือ เรียกว่า choropleth mapping โดยใช้สีเข้มขึ้นเพื่อสื่อถึงจำนวนที่มากขึ้นในพื้นที่นั้น ๆ เทคนิคนี้เป็นเทคนิคที่ดีเพราะสามารถทำให้ผู้เห็นเข้าใจได้ง่ายและรวดเร็ว แต่ก็สามารถทำให้ตีความหรือเข้าใจข้อมูลผิดได้ถ้าใช้ไม่ถูกวิธี จะผิดได้อย่างไรเรามาดูกันครับ รูปที่ 1 คือแผนที่การระบาดของโรคโควิดในประเทศจีนเมื่อวันที่ 24 กุมภาพันธ์ 2563 ที่ใช้เทคนิค choropleth mapping ภาพนี้อาจจะดูดีและเข้าใจง่ายใช่ไหมครับ แต่จริง ๆ แล้วแผนที่นี้หลอกตาเราอยู่อย่างหนึ่ง คือ สีที่ใช้แสดงถึงจำนวนรวมทั้งหมด (total) ในพื้นที่ ทว่าต้องอย่าลืมว่าแต่ละพื้นที่นั้นนอกจากจะมีขนาดไม่เท่ากันแล้วก็ยังมีจำนวนประชากรที่แตกต่างกัน การเปรียบเทียบสี (ซึ่งแสดงจำนวนผู้ติดเชื้อในพื้นที่) ของสองพื้นที่กันตรง ๆ อาจนำไปสู่ความเข้าใจที่คลาดเคลื่อนจากที่ควรจะเป็น ในแผนที่บอกว่ามณฑลหูเป่ยมีผู้ป่วยกว่า 65,000 คน ซึ่งดูเป็นจำนวนที่เยอะ แต่เราไม่รู้ว่าประชากรหูเป่ยมีจำนวนกี่คน มากกว่าหรือน้อยกว่ามณฑลข้างเคียง การเทียบด้วยจำนวนทั้งหมดอย่างเดียวจึงไม่ใช่การเปรียบเทียบที่ดีนัก นั่นจึงเป็นหลักการในการทำแผนที่ว่าการใช้สีแบบนี้ไม่ควรจะแสดงถึงค่ารวมของทั้งพื้นที่ นอกจากนี้อาจจะทำให้คนอ่านติดภาพในหัวไปว่าการระบาดนั้นเกิดขึ้นนั้นกระจายออกไปทั่วทั้งมณฑล ทั้งที่ความเป็นจริงนั้นการระบาดอาจจะถูกจำกัดอยู่ในเมืองใหญ่ในใจกลางมณฑลอย่างเดียวก็เป็นได้  อีกอย่างหนึ่งที่ต้องคำนึงถึงเมื่อใช้ choropleth mapping ก็คือ color scheme หรือ เกณฑ์ในการใช้สี ในรูปที่ 1 นี้มีการใช้จำนวนผู้ป่วย 1000 คนเป็นค่าสูงสุดและให้เป็นสีเข้มที่สุด ซึ่งมีอยู่ห้ามณฑลด้วยกัน ถ้าดูแผนที่นี้อย่างเผิน ๆ อาจเข้าใจว่าห้ามณฑลนี้มาการระบาดพอ ๆ กัน ใช่ไหมครับ… ผิดครับ ลองมาดูกราฟจะเห็นได้ว่าหูเป่ยมีปริมาณสูงกว่าอีกสี่มณฑลมาก ถ้าดูกราฟแท่งนี้แล้วกลับไปมองแผนที่ในรูป 1 จะพบว่ามันสื่อความหมายต่างกันสิ้นเชิง ซึ่งเป็นเพราะว่าการใช้ 1000 เคสผู้ป่วยเป็นตัวแบ่งสีนั้นอาจจะไม่ใช่ทางเลือกที่ดีนัก  จากสองข้อนี้เราควรจะทำอย่างไรดี ถึงจะได้แผนที่ที่ดูแล้วไม่ทำให้เข้าใจผิด? เราลองมาดูแผนที่อีกชิ้นที่นำเสนอข้อมูลเดียวกันกันนะครับ อย่างแรกเลยแผนที่นี้เปลี่ยนมาใช้สีน้ำเงินแทน เนื่องจากสีแดงเป็นสีที่สื่อถึงอารมณ์รุนแรง ถ้าย้อนกลับไปดูแผนที่ในรูปที่ 1 จะเห็นได้ว่าการที่มีสีแดงทั่วทั้งประเทศ อาจจะทำให้รู้สึกว่ามันแดงหมดทั้งประเทศแล้วนะหรืออาจะสื่อถึงความตายในขณะที่เรานำเสนอเพียงจำนวนผู้ป่วยไม่ได้หมายถึงจำนวนผู้เสียชีวิต การใช้สีแดงจะเป็นการเพิ่มอารมณ์ไปโดยที่ไม่จำเป็น (ถึงแม้จะดูสวยก็ตามเถอะ) แต่การใช้สีอื่นก็สามารถสื่อความหมายได้เหมือนกัน อย่างที่สองการใช้สีของแผนที่นี้สื่อถึงอัตราส่วนผู้ป่วยต่อจำนวนประชากร ไม่ได้หมายถึงจำนวนผู้ป่วยทั้งหมด ซึ่งนี่ทำให้สามารถแสดงได้ว่าการมีผู้ป่วย 10 คนในเมืองใหญ่ กับ 10 คนในหมู่บ้านเล็ก ๆ นั้นเห็นถึงความรุนแรงต่างกัน อย่างที่สามหูเป่ยมีผู้ติดเชื้อ 111 คนต่อแสนคน ในขณะที่มณฑลอื่นมีไม่ถึง 3 คนต่อแสนคน จึงใช้สีที่ต่างจากมณฑลอื่นอย่างเห็นได้ชัด ซึ่งแสดงให้เห็นถึงความแตกต่างที่ชัดเจนยิ่งขึ้น การใส่ label และ legend ที่เหมาะสมก็ช่วยให้ตีความข้อมูลได้ถูกต้องมากขึ้น อย่างไรก็ตามการใช้ choropleth mapping ก็ไม่ได้เป็นวิธีเดียวในการนำเสนอข้อมูลบนแผนที่ แล้วยังมีวิธีอื่นอีกไหม? แผนที่แบบจุด เราสามารถใช้แผนที่แบบจุดกระจาย หรือ dot density map แทนการใช้สีเพื่อแสดงข้อมูลผู้ป่วยได้ โดยในรูปที่ 4 แต่ละจุดในภาพสื่อถึงผู้ป่วยสิบคน การใช้จุดทำให้เราสามารถนำเสนอจำนวนผู้ป่วยทั้งหมดได้เลย ไม่ต้องทำอัตราส่วนก่อน เพราะจุดแต่ละจุดนั้นมีขนาดเท่ากันจะไม่ทำให้เกิดการตีความผิดแบบในกรณีใช้สี เนื่องจากเราไม่รู้ตำแหน่งทีแท้จริงของผู้ป่วยจึงให้จุดจะกระจายแบบสุ่มในแต่ละพื้นที่ ซึ่งแสดงให้เห็นถึงความแตกต่างที่ชัดเจนระหว่างหูเป่ยและมณฑลอื่น ๆ ข้อเสียคือทำให้คนอ่านเข้าใจผิดว่าแต่ละจุดหมายถึงผู้ป่วยหนึ่งคน ดังนั้นการใส่ label ที่เหมาะสมจึงมีความจำเป็น แผนที่อีกแบบที่สามารถใช้ได้คือแผนที่แสดงด้วยสัญลักษณ์สัดส่วน หรือ proportional symbol map ซึ่งใช้ขนาดของวงกลมมาแสดงถึงจำนวนผู้ป่วย โดยที่พื้นที่ของวงกลมจะแสดงถึงจำนวนผู้ป่วยรวมของแต่ละมณฑล มีใครเห็นข้อแตกต่างของแผนที่นี้กับแผนที่ที่ผ่านมาไหมครับ? ในแผนที่นี้เราสามารถมองเห็นฮ่องกงและมาเก๊าได้ เนื่องจากสองเขตนี้มีขนาดเล็กทำให้ยากต่อการมองเห็นใน choropleth หรือ dot density map ในขณะที่แผนที่แบบ proportional symbol map ช่วยให้เราเห็นข้อมูลของพื้นที่ที่มีขนาดเล็กได้เพราะขนาดของวงกลมที่แสดงจะไม่ขึ้นกับขนาดของพื้นที่นั่นเอง เนื่องจากหูเป่ยมีตัวเลขผู้ป่วยสูงจุดอื่น ๆ จึงมีขนาดเล็กหมด เราสามารถแก้ปัญหานี้ได้โดยใช้อัตราส่วนแบบ logarithm หรือที่เรียกกันว่า log scale ในการแสดงขนาดของจุด จะทำให้เปรียบเทียบมณฑลอื่น ๆ ได้ง่ายยิ่งขึ้น แต่อย่าลืม legend ที่ชัดเจนเพื่อบอกว่าขนาดของวงกลมหมายถึงอะไร แผนที่แบบอื่น ๆ เทคนิคที่กล่าวมาทั้งหมดก็น่าจะเพียงพอแล้ว ที่จะนำมาออกแบบแผนที่แสดงข้อมูล แต่จริง ๆ แล้วมันก็ยังมีอีกหลายอย่าง ซึ่ง”อาจจะ”นำมาใช้ได้ เทคนิคแรกเลยที่จะพูดถึงคือการใช้แผนที่ความร้อนหรือ heat map… ดูไม่งามเลยจริงไหมครับ แผนที่นี้สร้างโดยการประมาณค่าตัวเลขในพื้นที่ต่าง ๆ ให้ครอบคลุมทั้งประเทศ โดยใช้ค่าตั้งต้นจากผู้ป่วยในแต่ละมณฑลเป็นจุดกลางมณฑล ปัญหาคือมณฑลในจีนมีขนาดใหญ่มาก จุดกลางมณฑลที่ใช้ในการคำนวณอาจจะไม่ใช่จุดกึ่งกลางของการระบาดในมณฑลนั้น ๆ อีกอย่างหนึ่งคือเราดูแผนที่นี้แล้วดูไม่ออกว่าจุดเริ่มต้นของการระบาดอยู่ที่หูเป่ย ส่วนสีที่ใช้นั้นก็ดูไม่ค่อยสื่อถึงกับการระบาดของโรคเท่าไร แล้วแผนที่สามมิติล่ะ ใคร ๆ ก็ชอบสามมิติ แต่ผมว่าไม่ การใส่ effect สามมิติเข้าไปในแผนที่นั้น ไม่ได้ให้ข้อมูลอะไรออกมามากและดูเหมือนจะเบี่ยงเบนความสนใจของผู้อ่านไปจากข้อมูลที่ต้องการจะนำเสนอเสียด้วยซ้ำ แถมอย่างในรูปที่ 8 กราฟสามมิติที่แสดงจำนวนผู้ป่วยเป็นความสูง อาจจะบดบังข้อมูลของมณฑลบางมณฑลอีกด้วย แผนที่แบบ interactive อย่างสุดท้ายที่ผมจะพูดถึงคือการทำ Interactive map บนเว็บหรือ Dashboard ปัจจุบันมีเครื่องมือมากมายเช่น PowerBI หรือ Tableau (ตัวอย่าง จาก Tableau) ซึ่งทำให้เราสามารถเล่นกับแผนที่ได้ เช่น สามารถคลิกที่แต่ละพื้นที่แล้วแสดงข้อมูลแบบละเอียดออกมา หรือเมื่อซูมเข้าไปจะทำให้ข้อมูลที่แสดงออกมาละเอียดขึ้น เช่น เปลี่ยนจากจำนวนรวมของมณฑลเป็นจำนวนรวมแต่ละเมืองแทน การทำแผนที่เหล่านี้ก็ยังต้องคำนึกถึงสิ่งที่เขียนไว้ในบทความนี้เพื่อที่จะไม่ให้สื่อสารผิดวิธี ปัญหาหนึ่งของการทำ interactive map แบบนี้ คือผู้ใช้สามารถซูมเข้าไปได้เรื่อย ๆ ซึ่งหากซูมมากเกินไปกว่าขีดจำกัดของข้อมูลที่มีอาจจะทำให้คนเข้าใจผิดได้ เช่น ถ้าซูมเข้าไปที่จังหวัดจนมองไม่เห็นจุดที่แสดงถึงข้อมูล จะทำให้มองไม่เห็นจุดแล้วเข้าใจผิดได้ว่าในพื้นที่นั้นไม่มีการระบาดเป็นต้น จึงควรจำกัดการซูมไม่ให้เล็กกว่าขีดจำกัดของการแสดงผล และนี่ก็เป็นหลักการนำเสนอข้อมูลบนแผนที่ หวังว่าผู้อ่านทุกท่านจะนึกถึงหลักการเหล่านี้ ก่อนที่นำไปใช้ในการออกแบบแผนที่แสดงข้อมูลไม่ว่าจะเป็นเรื่องของสถานการณ์ระบาดของไวรัสโควิดหรือเรื่องอื่น ๆ ก็ตามครับ บทความแปลจาก https://www.esri.com/arcgis-blog/products/product/mapping/mapping-coronavirus-responsibly/
7 April 2020
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.