สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

Big Data

ข้อมูลเกี่ยวกับแนวเขตการปกครอง (ขอบเขตจังหวัด อำเภอ ตำบล) ในระบบภูมิสารสนเทศมีความสำคัญมากในการจัดการที่มีประสิทธิภาพในพื้นที่ เนื่องจากมีผลต่อการอ้างอิงขอบเขตอำนาจหน้าที่ของหน่วยงานราชการต่าง ๆ โดยกรมการปกครองถือว่าเป็นหน่วยงานหลักที่มีหน้าที่ดูแลในการจัดเก็บข้อมูล (การทบทวนหน่วยงานที่รับผิดชอบชุดข้อมูลภูมิสารสนเทศพื้นฐาน FGDS) โดยได้ดำเนินการสำรวจ ตรวจสอบ และปรับปรุงข้อมูลดังกล่าวตลอดเวลาตั้งแต่ปี พ.ศ. 2546 ภายใต้โครงการปรับปรุงข้อมูลแนวเขตการปกครองในระบบภูมิสารสนเทศ (GIS) มาตราส่วน 1:50000 อย่างไรก็ตามยังมีการปรับปรุงแก้ไขแนวเขตการปกครองเพียงบางพื้นที่เท่านั้น

Power BI เป็นซอฟต์แวร์ของบริษัท Microsoft สำหรับใช้เป็นเครื่องมือในการจัดการและวิเคราะห์ข้อมูล โดยสามารถนำเสนอข้อมูล (Data Visualization) ได้ในรูปแบบของ Dashboard ในบทความนี้เราจะนำเสนอการใช้ซอฟต์แวร์ที่ชื่อ Power BI Desktop ซึ่งเป็นซอฟต์แวร์ในกลุ่มผลิตภัณฑ์ของ Power BI เป็นตัวอย่างในการอธิบายโดยใช้เครื่องมือนำเสนอข้อมูล (Visual Tool)

การจัดการข้อมูลเชิงพื้นที่มีความสำคัญอย่างยิ่งต่อองค์กรต่าง ๆ และ FOSS4G เป็นทางเลือกที่น่าสนใจในการสร้างแพลตฟอร์มเหล่านี้ มาทำความรู้จักกับ FOSS4G และเหตุผลที่ควรพิจารณาในการใช้งาน ในบทความนี้"

ทุกวันนี้ Large Language Models (LLMs) ถูกนำมาใช้กันอย่างแพร่หลายมากขึ้นในปัจจุบัน หลายคนถือว่า LLMs ถูกผนวกรวมเป็นส่วนหนึ่งของชีวิตและการทำงานของเราอย่างขาดไม่ได้ แต่อย่างไรก็ตาม การประยุกต์ใช้งาน LLMs ก็ยังพบปัญหาและอุปสรรคบางอย่างอยู่ เช่น ปัญหาของการสร้างคำตอบที่ไม่ถูกต้องขึ้นมา (Hallucination) หรือปัญหาของชุดความรู้ที่ไม่อัปเดต ทำให้มีคนที่พยายามคิดค้นและพัฒนากระบวนการที่จะมาช่วยแก้ปัญหาตรงจุดนี้ ซึ่งวิธีที่จะมาช่วยแก้ปัญหาดังกล่าว เรียกว่า

Log เป็นข้อมูลที่ได้มาจากระบบคอมพิวเตอร์ ซึ่งทำหน้าที่ในการบันทึกรายละเอียดข้อมูลการทำงานต่าง ๆ ของระบบ ช่วยให้ผู้พัฒนาและผู้ดูแลระบบสามารถเข้าใจการทำงานของระบบ วิเคราะห์พฤติกรรมที่ผิดปกติและสามารถแก้ไขได้อย่างทันท่วงที ในระบบที่มีขนาดใหญ่ขึ้นทำให้ปริมาณของ Log นั้นเพิ่มตามไปด้วย การอ่านข้อมูล Log ทั้งหมดด้วยตนเองจึงทำได้ยาก Log parser จึงเข้ามาช่วยแก้ปัญหาตรงนี้ โดย Log parser นั้นจะทำให้ข้อมูล

ในบางครั้งการสร้างโมเดลทำนาย เราไม่ได้สนใจเพียงแค่ว่าสิ่งทีทำนายออกมาจะเป็น class อะไร แต่สนใจไปถึงโอกาสหรือความน่าจะเป็นของผลการทำนายเพื่อจะเอาไปคำนวณ risk หรือ expected value อื่น ๆ ต่อไป เชื่อว่าชาว data sci หลาย ๆ คน ถ้าอยากได้ผลการทำนายเป็น probability