สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

ตัวอย่างการใช้ Big Data เพื่อส่งเสริมการลงทุน

Oct 13, 2023

ช่วงนี้หลาย ๆ คนอาจจะได้ยินคำว่า Big Data หรือ Data Science กันบ่อย ๆ เนื่องจากเรากำลังอยู่ในยุคที่มีการเก็บข้อมูลเป็นจำนวนมากมหาศาล และการใช้ประโยชน์จากข้อมูลเพื่อพัฒนาหรือตอบโจทย์ทางธุรกิจในด้านต่าง ๆ ก็กำลังเป็นที่แพร่หลายเช่นกัน

สำหรับใครที่กำลังสงสัยว่า Big Data สามารถถูกนำไปใช้ประโยชน์จริง ๆ ได้อย่างไร เรามีตัวอย่างการนำความรู้ทาง Big Data ไปใช้ประโยชน์ใน Finance Sector ให้ดูค่ะ

ส่งเสริมการออมเงินของสมาชิก กบข. ด้วย Big Data

โดยตัวอย่างการพัฒนาแบบจำลองเชิงพยากรณ์ (Predictive Model) ที่เรานำเสนอในบทความนี้ มาจากโมเดลจริงที่ทาง Government Big Data Institute (GBDi) ร่วมมือกับสถาบันการเงินที่บริหารกองทุนบำเหน็จบำนาญข้าราชการทำขึ้น โดยกองทุนบำเหน็จบำนาญข้าราชการ (กบข.) นั้นเป็นสถาบันบริหารเงินออมของข้าราชการเพื่อการเกษียณที่มีความยั่งยืน และมีเป้าหมายในการใช้ข้อมูลที่มีอยู่และความรู้ทาง Data Science เพื่อศึกษาวิจัยด้านการลงทุนในแง่ของเงินออมของสมาชิกเพื่อช่วยให้ กบข. สามารถส่งเสริมและสนับสนุนสมาชิกในการลงทุนที่เหมาะสม และผลักดัน กบข. ให้เป็นองค์กรที่ขับเคลื่อนด้วยข้อมูล (Data Driven Organization) อย่างแท้จริง

หนึ่งในเป้าหมายหลักด้านการส่งเสริมการออมเงินของสมาชิก กบข.นั้นก็คือ ทาง กบข. ต้องการให้สมาชิกมีความสนใจมาเพิ่มการลงทุนในกองทุนบำเหน็จบำนาญข้าราชการ (pension fund) ให้มากขึ้น เพื่อที่ว่าสมาชิกจะได้มีเงินออมที่พอใช้หลังเกษียณ เราจึงเริ่มจากการใช้ความรู้ทาง Data science มาช่วยในการวิเคราะห์ว่าสมาชิกคนไหนอยู่ในกลุ่มที่มีโอกาสจะมาเพิ่มเงินลงทุนใน pension fund ที่มากกว่า (Potential group) เพื่อที่เราจะได้สามารถเจาะกลุ่มสมาชิกได้ถูกกลุ่ม และเพิ่มประสิทธิภาพในการคิดแผนการตลาดต่าง ๆ ได้ โดยมีขั้นตอนในการดำเนินงานดังนี้

การพัฒนาแบบจำลองเชิงพยากรณ์ (Predictive Model) สามารถช่วยให้กองทุนบำเหน็จบำนาญข้าราชการ (กบข.) ส่งเสริมและสนับสนุนสมาชิกในการลงทุนที่เหมาะสม ขับเคลื่อนด้วยข้อมูล (Data Driven Organization) อย่างแท้จริง ออกแบบแคมเปญหรือกิจกรรมต่าง ๆ เพื่อส่งเสริมทางการตลาดได้อย่างตรงจุดและได้ผลที่มากยิ่งขึ้น

ศึกษาการจำแนกกลุ่มของข้อมูล หาผู้ที่มีแนวโน้มการออมเงินเพิ่ม

ขั้นแรก จะเริ่มจากการจัดเตรียมข้อมูลสมาชิก จัดการความถูกต้อง และความเป็นระเบียบของข้อมูลและทำ Feature Engineering เพื่อให้โมเดลการทำนายมีประสิทธิภาพ เช่น การวิเคราะห์เพื่อดูว่าข้อมูลใดที่ควรนำมาเป็นตัวแปร (input feature) ที่จะใช้ในโมเดล โดยข้อมูลที่ใช้สำหรับการสร้างโมเดล จะประกอบไปด้วยหลายส่วน ได้แก่

  • ข้อมูลทางประชากร (Demographic data) เช่น เพศ อายุ รายได้
  • ข้อมูลทางภูมิศาสตร์ (Geographic data) เช่น จังหวัดหรือภูมิภาคที่อาศัย
  • ข้อมูลเชิงจิตวิทยา (Psychographic data) เช่น ไลฟ์สไตล์ ความชอบในสินค้า
  • ข้อมูลทางพฤติกรรม (Behavioral data) เช่น พฤติกรรมการใช้งานของสินค้าและบริการ

หลังจากขั้นตอนการจัดเตรียมข้อมูล เราจะนำข้อมูลเข้าสู่โมเดลเพื่อทำการเรียนรู้ โดยมีวัตถุประสงค์เพื่อจำแนกสมาชิก กบข. ออกเป็น กลุ่มที่มีแนวโน้มว่าจะมาเพิ่มเงินออมสูง กลุ่มที่มีแนวโน้มว่าจะออมเงินเพิ่มปานกลาง และกลุ่มที่มีแนวโน้มว่าจะออมเงินเพิ่มต่ำ โดยเกณฑ์ที่ใช้ในการจำแนกกลุ่มนี้ก็คือ ค่าความน่าจะเป็นที่ได้มาจากโมเดลนั่นเอง

ซึ่งโมเดลทางคณิตศาสตร์ที่สามารถนำมาใช้เพื่อจำแนกแนวโน้มการออมเงินเพิ่มของสมาชิก (Classification model) นั้นมีอยู่หลายโมเดลด้วยกัน อาทิเช่น Logistic regression, Naive Bayes classifier, Least squares support vector machines, Random forests, Neural networks ฯลฯ โดยหลังจากที่ทดลองใช้ข้อมูลจากสมาชิก กบข.กับหลาย ๆ โมเดลแล้ว ผลที่ได้พบว่า อัลกอริทึม Extreme Gradient Boosting (XGBoost) เป็นอัลกอริทึมที่มีประสิทธิภาพสูงที่สุดในการสร้างโมเดลสำหรับจำแนกสมาชิกด้านเงินออมของ กบข. ซึ่ง XGBoost นั้นก็เป็นโมเดลทำนายพื้นฐานที่ได้รับความนิยมอย่างมากและถูกใช้ในการแข่งขันวิเคราะห์ข้อมูลอย่างแพร่หลายโดยเฉพาะในเว็บไซต์ชุมชนวิเคราะห์ข้อมูลอย่าง Kaggle (“XGBoost – ML winning solutions (incomplete list)”, 2016)

หลักการทำงานของ XGBoost จะมีลักษณะการนำเอา Decision Tree มาเทรนต่อกันหลายๆต้น โดยที่แต่ละ Decision tree จะเรียนรู้จาก error ของต้นก่อนหน้า ดังนั้น ความแม่นยำในการทำนายจะสูงขึ้นเรื่อย ๆ และโมเดลจะหยุดเรียนรู้เมื่อไม่เหลือแพทเทิร์นของ error ก่อนหน้าให้เรียนรู้อีก ซึ่งเราเรียกโมเดลลักษณะแบบนี้ว่า Ensemble Learning หรือหมายถึงการใช้หลาย ๆ โมเดลมาประกอบกันเป็นหนึ่งโมเดลเพื่อเพิ่มประสิทธิภาพในการทำนายนั่นเอง

หากต้องการศึกษาข้อมูลเกี่ยวกับ Decision Tree เพิ่มเติม สามารถดูวีดีโอได้ที่ https://youtu.be/wUGGLJF_gA8 

จากโมเดลคณิตศาสตร์ สู่แคมเปญส่งเสริมการออม

หลังจากที่เราทราบแล้วว่าสมาชิกคนใดมีโอกาสที่จะออมเงินในกองทุนกับ กบข. เพิ่มมากหรือน้อยแล้วนั้น กบข. ก็จะสามารถออกแบบแคมเปญหรือกิจกรรมต่าง ๆ เพื่อส่งเสริมทางการตลาดได้อย่างตรงจุดและได้ผลที่มากยิ่งขึ้น ตัวอย่างเช่น ข้อความที่ กบข. จะส่งออกให้แก่สมาชิกแต่ละกลุ่มผ่านทาง SMS, E-mail, Line message, Mobile application หรือช่องทางต่าง ๆ เพื่อชักชวนหรือให้ความรู้นั้น อาจเป็นข้อความที่ต่างกันตามกลุ่มที่จำแนกไว้ โดยอาจโฆษณาผลิตภัณฑ์ A ให้กับสมาชิกที่มีแนวโน้มในการออมเงินเพิ่มสูง และส่งแคมเปญ B ให้แก่กลุ่มสมาชิกที่โมเดลทำนายว่ามีแนวโน้มที่จะมาออมเงินเพิ่มต่ำ เพื่อเป็นการกระตุ้นให้สมาชิกกลุ่มนี้หันมาสนใจในการออมเงินที่มากยิ่งขึ้น ซึ่งนอกจากประโยชน์ในแง่ของการตลาดที่มีประสิทธิภาพมากขึ้นแล้วนั้น การทำการตลาดแบบเจาะกลุ่มคนที่เราสนใจ (Focus group) ยังสามารถช่วยประหยัดเวลาและค่าใช้จ่ายได้อย่างมากอีกด้วย   

หากต้องการรับชมตัวอย่างเพิ่มเติมในเรื่องของการใช้ Big Data สำหรับ Finance Sector ในรูปแบบของวีดีโอ สามารถเข้าไปดูได้ที่ https://youtu.be/G54XC_i9Gao