สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

Big Data และ Data Analytics เพื่อการจัดเก็บภาษี

Dec 14, 2022

ทุก ๆ ปีสรรพากรทั่วโลกจะต้องสูญเสียรายได้หลายสิบล้านเหรียญจากการโกงและหลีกเลี่ยงภาษี จากข้อมูลสถิติพบว่า 145 ประเทศทั่วโลกซึ่งมีขนาดเศรษฐกิจรวมกันประมาณ 95% ของ GDP โลก[1] มีการสูญเสียรายได้ทางภาษีรวมกันปีละ 2.4 ล้านล้านยูโร หรือประมาณ 91.4 ล้านล้านบาท นับเป็นมูลค่าที่มหาศาลมาก ดังนั้นจึงไม่เป็นที่น่าแปลกใจที่สรรพากรหรือหน่วยงานที่มีหน้าที่จัดเก็บภาษีของแต่ละประเทศ[2] หันมาใช้ประโยชน์จาก Big Data และมุ่งหาเครื่องมือใหม่ ๆ ที่ช่วยให้การจัดเก็บภาษีมีประสิทธิภาพและรวดเร็วยิ่งขึ้น

“2.4 trillion Euros are lost every year because of fraud and tax evasion.”

Ian Pretty, Capgemini (2013)

บทความนี้ขอนำเสนอตัวอย่างการใช้ Big Data และ Data Analytics ของสรรพากรในต่างประเทศเพื่อเป็นข้อมูลให้กับผู้ที่สนใจด้านการวิเคราะห์ข้อมูล ตลอดจนนักวิทยาศาสตร์ข้อมูลและนักศึกษาที่อาจมีความสนใจด้านธุรกิจหรือด้านการเงิน

ที่มา: เอกสาร The Data Intelligent Tax Administration (2018) โดย Microsoft และ PwC Netherlands

ตัวอย่างแรก ขอเริ่มกันที่สรรพากรของประเทศไอร์แลนด์ หรือ Ireland Tax and Customs ที่มีการนำข้อมูล Big Data ที่เป็นข้อมูลภายนอกองค์กรทั้งแบบ structured และ unstructured มาใช้ประโยชน์เพื่อให้ได้ข้อมูลผู้เสียภาษีที่ครบถ้วนยิ่งขึ้น โดยทางสรรพากรของประเทศไอร์แลนด์ได้นำข้อมูลภายนอกมาใช้ร่วมกับข้อมูลภายในของหน่วยงาน แล้วมาทำโมเดลเพื่อวิเคราะห์ตัวเลขต่าง ๆ ทางภาษี อาทิ การนำข้อมูลภายนอกมาใช้พยากรณ์รายได้ของผู้เสียภาษี เพื่อเปรียบเทียบกับจำนวนรายได้ที่ยื่นในแบบภาษีเงินได้ โดยโมเดลที่ทางสรรพากรของประเทศไอร์แลนด์เลือกใช้นั้นเป็นเพียง Regression โมเดลธรรมดา มิได้ต้องใช้โมเดลอะไรที่ซับซ้อนเนื่องจากหากข้อมูลดีมีคุณภาพ การเลือกใช้โมเดลที่เข้าใจง่ายและอธิบายให้ผู้ใช้งานเข้าใจได้ง่ายย่อมดีกว่าการเลือกใช้โมเดลที่ซับซ้อนอย่างแน่นอน ตัวอย่างของประเทศไอร์แลนด์แสดงให้เห็นว่า เจ้าหน้าที่สามารถใช้ประโยชน์จากข้อมูล Big Data มาตรวจสอบกับข้อมูลรายได้ของผู้เสียภาษี เพื่อค้นหาว่าผู้เสียภาษีรายใดอาจทำการยื่นรายได้ต่ำกว่าความเป็นจริง ปัจจุบันหลายหน่วยงานภาษีทั่วโลกมีการใช้ประโยชน์จาก Big Data อาทิ ประเทศรัสเซีย ออสเตรเลีย แคนาดา และสิงคโปร์ อย่างไรก็ตาม ผู้ทำโมเดลจำเป็นจะต้องมั่นใจว่า ข้อมูลภายนอกที่ได้มาเป็นข้อมูลที่มีคุณภาพสูงและน่าเชื่อถือได้ มิฉะนั้นผลลัพธ์ที่ได้อาจเข้าข่ายของสโลแกนทางสถิติที่เป็นที่รู้จักดี คือ Garbage In, Garbage Out (GIGO) นั่นเอง

ที่มา: Intra-European Organisation of Tax Administrations (IOTA)

ตัวอย่างที่สอง ขอนำเสนอการใช้ประโยชน์จากวิธีการเก็บข้อมูลสมัยใหม่หรือเทคนิค web-scraping ที่เป็นที่นิยมในการเก็บข้อมูลตามเว็บไซต์หรือสื่อออนไลน์ต่าง ๆ ที่ใคร ๆ ก็สามารถเข้าถึงได้เพราะถือเป็นข้อมูลสาธารณะ (Public Data) ในประเทศสเปน เจ้าหน้าที่สรรพากรได้ใช้เทคนิค web-scraping นี้ไปเก็บข้อมูลบนสื่อออนไลน์ต่าง ๆ ที่เกี่ยวกับการซื้อขายสินค้าออนไลน์และการซื้อขายอสังหาฯ เพื่อใช้เป็นข้อมูลในการประเมินรายได้ของผู้เสียภาษีที่อาจจะพยายามหลีกเลี่ยงการเสียภาษี แน่นอนว่าการทำ web-scraping เป็นเพียงการเก็บข้อมูลเท่านั้น มิใช่เป็นการทำโมเดลเพื่อบ่งชี้รายได้ ดังนั้นเจ้าหน้าที่สรรพากรของประเทศสเปนต้องมาพัฒนาโมเดลที่สามารถบ่งชี้หรือคาดการณ์รายได้ของผู้เสียภาษีในภายหลัง แต่น่าเสียดายที่ทางสรรพากรของประเทศสเปนไม่ยอมเปิดเผยถึงโมเดลที่ใช้หรือแหล่งสื่อออนไลน์ที่ไปเก็บข้อมูลมาเพราะถือเป็น “ความลับในทางธุรกิจ”

ปัจจุบันธุรกิจอีคอมเมิร์ซหรือการขายสินค้าออนไลน์มีจำนวนเพิ่มสูงขึ้นเป็นอย่างมาก และเป็นช่องทางการซื้อ-ขายที่ได้รับความนิยมสูงจากผู้บริโภคทุกกลุ่ม แต่การชำระภาษีของภาคธุรกิจนี้สร้างความเหลื่อมล้ำและความได้เปรียบที่ไม่เป็นธรรมกับผู้เสียภาษีจากภาคธุรกิจเดียวกัน  ดังนั้น หากมองในเชิงโครงสร้างภาษีและเชิงเศรษฐศาสตร์ การจัดเก็บภาษีจากธุรกิจอีคอมเมิร์ซที่พยายามหลีกเลี่ยงภาษี จะเปรียบเสมือนการส่งเสริมให้ตลาดการขายสินค้าออนไลน์เกิดความยุติธรรมและลดความได้เปรียบทางภาษีของผู้ขายสินค้าออนไลน์บางรายอีกด้วย

ตัวอย่างที่สาม ขอนำเสนอการใช้ประโยชน์จากข้อมูลผู้เสียภาษีเพื่อช่วยเหลือหรือแบ่งเบาภาระของผู้เสียภาษีและยังสามารถลดต้นทุนในการจัดเก็บหนี้ภาษีได้อีกด้วย กล่าวคือ win-win ทั้งสองฝ่าย ตัวอย่างนี้มาจากสรรพากรของประเทศสวีเดน (Swedish Tax Agency) ที่ได้นำโมเดลทางสถิติมาใช้เพื่อให้งานด้านการจัดเก็บหนี้เป็นเชิงรุกมากขึ้น โดยโมเดลที่ได้พัฒนาขึ้นมานั้น เป็นโมเดลที่ช่วยระบุว่า ผู้เสียภาษีรายใดมีโอกาสสูงที่จะไม่ชำระหนี้หรือมีปริมาณหนี้ที่เพิ่มสูงขึ้น เพื่อแจ้งให้เจ้าหน้าที่ไปติดต่อเพื่อสอบถามถึงปัญหาของผู้เสียภาษีรายนั้น ๆ การทำโมเดลในลักษณะนี้ย่อมส่งผลให้ผู้เสียภาษีพึงพอใจ เพราะผลลัพธ์ที่ได้จากโมเดลนี้จะสามารถช่วยแบ่งเบาภาระของผู้เสียภาษีและให้โอกาสผู้เสียภาษีเลือกปรับแผนการชำระหนี้ให้สอดคล้องกับความสามารถในการชำระหนี้ของผู้เสียภาษีได้ นอกจากนั้น โมเดลนี้ยังช่วยลดความเสี่ยงจากการเกิดหนี้เสียได้ โดยส่งผลให้รายได้ทางภาษีของสรรพากรของประเทศสวีเดนเพิ่มสูงขึ้นอีกด้วย

ที่มา: ผู้เขียน

จากตัวอย่างทั้งสามตัวอย่างที่นำเสนอมา จะเห็นว่า ข้อมูล Big Data และ Data Analytics นั้นมิได้มีไว้สำหรับภาคเอกชนเท่านั้น หน่วยงานรัฐก็สามารถใช้ประโยชน์จาก ข้อมูล Big Data ได้เช่นกัน แต่อย่างไรก็ตาม การใช้ข้อมูลไม่ว่าจะขนาดเล็กหรือขนาดใหญ่ ต้องเป็นข้อมูลที่มีคุณภาพ และการเลือกใช้โมเดลหรือเทคนิคที่ใช้ในการวิเคราะห์ข้อมูลก็ต้องเหมาะสมกับข้อมูลและโจทย์ที่ต้องการวิเคราะห์ด้วย ความยากง่ายของโมเดลมิใช่สาระสำคัญของการได้ผลที่แม่นยำหรือประโยชน์ที่เกิดจากการวิเคราะห์ข้อมูล

เอกสารอ้างอิง:


[1] หรือ ผลิตภัณฑ์มวลรวมในประเทศของทุกประเทศทั่วโลก (Global Gross Domestic Product: GDP)

[2] ชื่อหน่วยงานที่มีหน้าที่จัดเก็บภาษีในแต่ละประเทศนั้นมีหลากหลายชื่อ อาทิ ที่ประเทศอเมริกาเรียกว่า Internal Revenue Service (IRS) แต่ที่ประเทศอังกฤษเรียกว่า Her Majesty’s Revenue and Customs (HMRC) ส่วนที่ประเทศออสเตรเลียเรียกว่า Australian Taxation Office (ATO) ดังนั้น ผู้เขียนขอใช้คำว่า “สรรพากร” เพื่อสื่อถึงหน่วยงานที่มีหน้าที่จัดเก็บภาษีในแต่ละประเทศ

Vorapitchaya Rabiablok

Senior Data Scientist and Project Manager Government Big Data Institute (GBDi)

Isarapong Eksinchol, PhD

Editor and Data Scientist at Big Data Institute (Public Organization), BDI