สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

ประชาธิปไตยข้อมูล (Data Democratization) เทรนที่องค์กรควรสนใจ

Feb 28, 2022
data_democratization

คำถามเหล่านี้เป็นคำถามเกี่ยวกับความเสมอภาคในการเข้าถึงและใช้ประโยชน์ของข้อมูลในองค์กร ซึ่งเป็นคนละประเด็นกับสิทธิ์ในการเข้าถึงข้อมูลบางประเภท (User Type) ทำให้หลายๆองค์กรเริ่มมองถึงความไม่เสมอภาคนี้และเป็นที่มาของการทำข้อมูลให้เป็นประชาธิปไตย หรือ Data Democratization

how_to_democratization

ประชาธิปไตยข้อมูล (Data Democratization) ไม่ใช่แค่เรื่องของ การเข้าถึงข้อมูล (Data Access)

การทำข้อมูลให้เป็นประชาธิปไตยนั้นมักจะถูกเข้าใจว่าเป็นการให้ทุกคนสามารถเข้าถึงข้อมูลได้อย่างทั่วถ้วนเท่านั้น ซึ่งไม่ถูกเสียทั้งหมด เพราะผู้บริหารก็คงไม่อยากให้พนักงานเห็นข้อมูลความลับของบริษัท หรือฝ่ายบุคคลก็คงไม่อยากให้เราเห็นเงินเดือนของเพื่อนร่วมงานด้วยเช่นกัน ซึ่งหลักการใหญ่ๆในการทำข้อมูลให้เป็นประชาธิปไตย สรุปได้ดังนี้

  1. มีเครื่องมือที่เหมาะสมกับความสามารถของบุคคลในการเข้าถึงและใช้งานข้อมูล
  2. สร้างบรรยากาศให้พนักงานรู้สึกผ่อนคลายในการใช้ข้อมูลและตั้งคำถามที่ตอบด้วยข้อมูล
  3. ทำเรื่องนี้ให้เป็นกระบวนการต่อเนื่องจนเกิดเป็นวัฒนธรรมขององค์กรในที่สุด

เกิดขึ้นเพื่อ แก้ ปัญหาความท้าทายของการใช้ข้อมูล

ทำไมองค์กรถึงควรให้ความสำคัญกับเรื่องนี้ ก็เป็นเพราะว่าเรื่องนี้เพื่อจะช่วยแก้ปัญหาที่คนในองค์กรต้องเผชิญเกี่ยวกับการใช้ข้อมูลในวันต่อวัน ซึ่งเป็นอุปสรรคใหญ่ที่ทำให้องค์กรไม่เป็น Data-driven สักที ลองพิจารณาประเด็นต่อไปนี้

  • ฉันเข้าถึงข้อมูลที่ต้องการใช้ไม่ได้
  • กว่าจะได้ข้อมูลมาทำงานใช้เวลานานมาก (ก.ไก่หลายตัว)
  • ไม่รู้ว่าข้อมูลที่ได้มาถูกต้องหรือเปล่า
  • ไม่รู้ว่าจะตอบคำถามของฉันจากข้อมูลเหล่านี้ยังไง
  • โปรแกรมวิเคราะห์ที่บริษัทซื้อมาใช้ยากมาก ก็มีแต่ทีม Analyse เท่านั้นแหละที่ใช้ได้
  • ทีม Data Science ไม่ว่างมาช่วยซักที

ปัญหาทั่วไปที่ฟังๆดูแล้วก็น่าจะแก้ได้ด้วยการทำ Data Governance ในองค์กรได้ (ขอแนะนำให้ลองอ่านกรอบการวิเคราะห์ข้อมูลขนาดใหญ่ภาครัฐ) ซึ่งก็ถูกต้องในแง่ของการการทำโครงสร้างให้มั่นคงพร้อมรับสถานการณ์การใช้ข้อมูลแบบต่างๆ แต่อีกปัญหาใหญ่ที่ยังไม่ถูกแก้ด้วย Data Governance คือ เครื่องมือที่เหมาะสมกับผู้ใช้งาน

การมีเครื่องมือที่เหมาะสม คือ ความเสมอภาค

“จอบที่เหมือนกัน ไม่ได้ทำให้ทุกคนได้หัวมันที่เท่ากัน และหัวมันที่เท่ากันก็ไม่ได้ทำให้คนอิ่มเท่ากันได้”

“ความเสมอภาค” คือการเข้าถึงโอกาสได้เหมือนกัน บางคนต้องการน้อย บางคนต้องการมาก เช่นเดียวกับการเข้าถึงและใช้งานข้อมูล อันดับแรกในการสร้างความเสมอภาคคือ ต้องเข้าใจว่าผู้ใช้ต้องการอะไร เช่น

  • ฝ่ายขาย ต้องการใช้ข้อมูลเพื่อหาโอกาส ที่จะกลายเป็นลูกค้าจริงๆได้
  • ฝ่ายการตลาด  ต้องการใช้ข้อมูลเพื่อหาทางจัดแคมเปญเด็ด ๆ โดนใจคนจะได้กลายมาเป็นลูกค้า
  • ฝ่ายโลจิสติกส์ ต้องการใช้ข้อมูลเพื่อปรับปรุงกระบวนการขนส่งให้รวดเร็วยิ่งขึ้น
  • ฝ่าย E-Commerse ต้องการข้อมูลเพื่อหาช่องทางขยายฐานลูกค้าในโลกออนไลน์
  • ฝ่ายบุคคล ต้องการข้อมูลเพื่อเลื่อนตำแหน่งและอัดฉีดเงินเดือนให้พนักงานที่มีประโยชน์กับบริษัทจริงๆ
  • ผู้บริหาร ต้องการข้อมูลเพื่อหาทางทำให้บริษัทคงอยู่ได้และเจริญเติบโต

จะดีกว่าไหมหากให้เครื่องมือที่แต่ละฝ่ายสามารถใช้วิเคราะห์ง่ายๆได้เอง เช่น ทำ Dashboards หรือวิเคราะห์ทำนายผลพื้นฐาน และเหลือเพียงงานหินๆให้ทีม Data Science ได้ลงมือได้เต็มที่ ซึ่งในปัจจุบันก็มี Software มากมายที่ให้ผู้ใช้งานสร้าง Dashbaords ได้ภายในไม่กี่นาที ด้วยการลากวาง หรือการสร้าง Model ทำนายผล ที่ไม่ต้องเขียนโค้ด สามารถลากวาง กำหนดค่า และแปรผลให้เราได้เอง ส่วนที่องค์กรต้องสนับสนุนเพิ่มคือ การอบรมใช้เครื่องมือ และความเข้าใจทางสถิติให้แก่พนักงาน 

Modern Data Stack เป็นชุดของเครื่องมือที่องค์กรควรลงทุนเพื่อตอบสนองความต้องการใช้ข้อมูลของส่วนต่าง ๆ ในองค์กร ทั้งนี้องค์กรก็ควรพิจารณาถึงขนาดความต้องการและความพร้อมของข้อมูล (Data Maturity) ในองค์กรประกอบด้วย โดยส่วนใหญ่แล้วองค์กรด้านธุรกิจมักจะลงทุนในเครื่องมือเหล่านี้

  • Data Warehouse เพื่อให้ข้อมูลพร้อมที่จะถูกใช้วิเคราะห์หรือใช้ประโยชน์อื่น ยกตัวอย่างเช่น Snowflake, BigQuery, Firebolt เป็นต้น
  • ELT & Reversed ELT เพื่อการโอนย้ายถ่ายเทข้อมูล ยกตัวอย่างเช่น Airbyte, Firetran, Meltano, Census, Hightouch, Grouparoo เป็นต้น
  • Business Intelligence (BI) เครื่องมือที่ถูกวางไว้เหนือฐานข้อมูลเพื่อทำให้ผู้ใช้งานสามารถทำการวิเคราะห์ด้วยตนเองได้ (Self-serve analytics) ยกตัวอย่างเช่น Tableau, Microsoft Power BI, Google Data Studio, Looker, Mode, Superset เป็นต้น
  • Low-code Analytics Platform เพื่อการวิเคราะห์ข้อมูลสำหรับผู้ที่ไม่ถนัดการเขียนโปรแกรม ยกตัวอย่างเช่น Alteryx, RapidMiner Studio, Loginom เป็นต้น
modern_data_stack

Dataportal กรณีศึกษา Data Democratization ที่ Airbnb

ลองมาดูตัวอย่างการทำให้ข้อมูลเป็นประชาธิปไตยอย่างเป็นรูปธรรมกัน ที่ Airbnb ซึ่งเป็นเทคสตาร์ทอัพด้านการจองที่พักที่มีการเติบโตในจำนวนพนักงานและจำนวนข้อมูลที่พร้อม ๆ กัน ปัญหาที่เกิดขึ้นคือการเข้าถึงสิ่งที่ต้องการในทะเลของข้อมูล (Data Lake) อย่างไรให้มีประสิทธิภาพและประสิทธิผลสูงสุด จึงเป็นที่มาของ Dataportal เครื่องมือและช่องทางให้พนักงานของ Airbnb เข้าถึงและเข้าใช้ข้อมูล ด้วยการอำนวยความสะดวกดังต่อไปนี้

airbnb_dataportal
  1. Search – ค้นหาชุดข้อมูลและผลการวิเคราะห์ที่ได้จัดทำไว้แล้ว
  2. Context and Metadata – อธิบายรายละเอียดชุดข้อมูล (Metadata) ให้มีความชัดเจนและนำไปใช้ได้จริง
  3. Employee-centric Data – สามารถดูข้อมูลในมุมมองของผู้ใช้งานแต่ละคนได้ว่าใครสร้างหรือใช้งานหรือชื่นชอบข้อมูลอะไรบ้าง คล้ายๆ โปรไฟล์ใน Facebook
  4. Team-centric Data – สามารถดูข้อมูลในมุมมองของทีมว่ามีข้อมูลหรือ Dashboards อะไรที่เป็นประโยชน์ต่อการทำงานของตนเองบ้าง

การขับเคลื่อนองค์กรด้วยข้อมูลเริ่มต้นจากประชาธิปไตยของข้อมูล

ความเสมอภาค คือคำสำคัญหลักที่ทำให้เกิดประชาธิปไตย การทำให้คนในองค์กรสามารถเข้าถึงและใช้ข้อมูลตามสิทธิของตนเองได้ ด้วยเครื่องมือที่เหมาะสมกับความสามารถและลักษณะของงาน จะสร้างให้เกิดบรรยากาศการทำงานกับข้อมูลอย่างเป็นรูปธรรม ซึ่งจะนำไปสู่การเกิดวัฒนธรรมที่คนในองค์กรจะหยิบยกข้อมูลมาพูดคุยและถกเถียงกัน เมื่อข้อมูลถูกวิเคราะห์ ตกตะกอน กลายเป็นข้อสรุป เกิดเป็นการตัดสินใจ องค์กรนั้นก็สามารถเรียกตัวเองได้ว่าเป็น Data-driven

แหล่งอ้างอิง

Saksit Srimarong

Data Scientist Government Big Data Institute (GBDi)

Navavit Ponganan

Editor-in-Chief and Senior Data Scientist at Big Data Institute (Public Organization), BDI