21 มกราคม 2569, กรุงเทพฯ – สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI โดย ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ พร้อมด้วย นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร บริษัท เนชั่น กรุ๊ป (ไทยแลนด์) จำกัด (มหาชน) หรือ NATION GROUP ร่วมลงนามบันทึกข้อตกลงความร่วมมือ (MOU) โครงการสนับสนุนการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดยมี ดร.สุนทรีย์ ส่งเสริม รองผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ (BDI) และ นางวรางคณา กัลยาณประดิษฐ ที่ปรึกษาประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป พร้อมด้วยคณะผู้บริหารทั้งสองหน่วยงาน เข้าร่วมเป็นสักขีพยาน ณ อาคาร เนชั่น ทาวเวอร์

ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ กล่าวว่า ปัจจุบันเทคโนโลยีปัญญาประดิษฐ์ หรือ AI กลายเป็นส่วนหนึ่งในชีวิตของคนไทย แต่กลับพบว่า AI ส่วนใหญ่ถูกฝึกจากข้อมูลภาษาอังกฤษจำนวนมหาศาล โดยมีสัดส่วนมากกว่า 40% ของข้อมูลทั้งหมด ขณะที่ข้อมูลภาษาไทยมีสัดส่วนเพียง 0.4% เท่านั้น ซึ่งถือว่ามีพื้นที่น้อยมาก สะท้อนให้เห็นว่าประเทศไทยขาด “โมเดลภาษา” ที่เข้าใจบริบทของคนไทยอย่างแท้จริง การพัฒนา ThaiLLM ไม่ได้เป็นเพียงการสร้างโมเดลภาษา แต่เป็นภารกิจของประเทศในการวาง “โครงสร้างพื้นฐานปัญญาประดิษฐ์ด้านภาษา” เพื่อให้ประเทศไทยสามารถพัฒนาและใช้งาน AI ได้อย่างสอดคล้องกับบริบทของตนเอง โดย BDI ทำหน้าที่เป็นหน่วยงานกลางบูรณาการความร่วมมือ และร่วมวางมาตรฐานการพัฒนา AI ภาษาไทย

BDI ได้ร่วมมือกับหน่วยงานด้านวิจัยและพัฒนาเทคโนโลยีของประเทศ ได้แก่ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) สถาบันวิทยสิริเมธี (VISTEC) สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) และสมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT) โดยได้รับการสนับสนุนจากกองทุนพัฒนาดิจิทัลเพื่อเศรษฐกิจและสังคม (DEF) ในการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์ภาษาไทยในรูปแบบ Open Source/Open License เพื่อเปิดโอกาสให้นักพัฒนา หน่วยงานภาครัฐ และภาคเอกชน สามารถนำไปต่อยอดใช้งานได้อย่างกว้างขวาง ลดการพึ่งพาเทคโนโลยีจากต่างประเทศ และสนับสนุนการพัฒนา AI ภาษาไทยในหลากหลายบริบท

ความร่วมมือกับเครือเนชั่นในครั้งนี้ นับเป็นครั้งแรกที่ BDI ได้ร่วมมือกับภาคสื่อมวลชนอย่างเป็นทางการ เพื่อยกระดับการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดย BDI จะได้รับการสนับสนุนข้อมูลภาษาไทยจากภาคสื่อมวลชน ซึ่งครอบคลุมเนื้อหาข่าว บทวิเคราะห์ และข้อมูลเชิงบริบทที่สะท้อนเหตุการณ์ทางสังคม เศรษฐกิจ และนโยบายสาธารณะของประเทศอย่างต่อเนื่อง ข้อมูลดังกล่าวจะช่วยเสริมศักยภาพให้ ThaiLLM สามารถเรียนรู้ภาษาไทยจากสถานการณ์จริง และเข้าใจบริบทของสังคมไทยได้อย่างลึกซึ้งมากยิ่งขึ้น

อีกทั้ง ยังมีส่วนช่วยเสริมสร้างความมั่นคงด้านภาษาและอธิปไตยทางดิจิทัล (Digital Sovereignty) ตลอดจนสนับสนุนการพัฒนาคลังข้อมูลกลางเพื่อการพัฒนาปัญญาประดิษฐ์ของประเทศ (National Data Bank for AI) ซึ่งจะเป็นรากฐานสำคัญในการรวบรวม บูรณาการ และบริหารจัดการข้อมูลจากหลากหลายภาคส่วน นำไปสู่การสร้างและขับเคลื่อนระบบนิเวศปัญญาประดิษฐ์ของไทยให้เติบโตอย่างเข้มแข็ง และรองรับการพัฒนาเทคโนโลยีและนวัตกรรมดิจิทัลของประเทศอย่างมั่นคงและยั่งยืน

นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป กล่าวถึงความร่วมมือในครั้งนี้ว่า ท่ามกลางการเปลี่ยนแปลงด้านเทคโนโลยี ปัญญาประดิษฐ์ หรือ AI ถือเป็นความท้าทายที่สื่อทั่วโลกต้องเผชิญ เครือเนชั่นเราให้ความสำคัญกับการพัฒนาองค์ความรู้ด้าน AI ในองค์กรอย่างต่อเนื่อง ทั้งในมิติของฮาร์ดแวร์และซอฟต์แวร์ โดยนำ AI มาเป็นเครื่องมือในการยกระดับขีดความสามารถของบุคลากร การบริหารจัดการต้นทุน และเพิ่มศักยภาพการผลิตเนื้อหาเพื่อนำเสนอข่าวสารที่เป็นสาระประโยชน์สู่สาธารณะ ภายใต้กรอบจริยธรรมวิชาชีพสื่อ เพื่อรักษาความน่าเชื่อถือในฐานะสถาบันสื่อที่สังคมไทยไว้วางใจมากว่า 55 ปี

ความร่วมมือกับสถาบันข้อมูลขนาดใหญ่ BDI ในครั้งนี้ ถือเป็นก้าวสำคัญในการสนับสนุนโครงการ ThaiLLM ผ่านการส่งต่อองค์ความรู้ด้านข่าวสาร นโยบาย และประเด็นสาธารณะ ที่ผ่านการตรวจสอบและเรียบเรียงโดยกองบรรณาธิการมืออาชีพเครือเนชั่น ข้อมูลเหล่านี้จะเป็นฟันเฟืองหลักเพื่อสร้างโมเดล AI ภาษาไทย ที่ถูกต้อง เข้าใจบริบททางสังคม และวัฒนธรรมของไทยอย่างแท้จริง อันจะนำไปสู่การต่อยอดนวัตกรรมในด้านการสื่อสาร และบริการสาธารณะที่มีประสิทธิภาพสูงสุดเพื่อคนไทยทุกคน

สำหรับความคืบหน้าของโครงการThaiLLM ขณะนี้ได้ขยายผลสู่การใช้งานจริงในเครือข่ายผู้พัฒนาโมเดลภาษาขนาดใหญ่ภาษาไทยจากทั้งภาครัฐและภาคเอกชน อาทิ Pathumma LLM โดย NECTEC, OpenThaiGPT โดย AIEAT, Typhoon โดย SCB 10X และ THaLLE โดย KBTG ต่างแสดงความสนใจในการนำไปทดลองพัฒนาต่อยอดผ่านแพลตฟอร์ม Hugging Face ที่ https://huggingface.co/ThaiLLM โดยได้เผยแพร่โมเดลพื้นฐานขนาด 8B พารามิเตอร์ และโมเดลขนาด 30B พารามิเตอร์ไปแล้ว และผู้ที่สนใจ หรือประชาชนทั่วไปสามารถทดลองใช้ ThaiLLM Playground ได้ภายในเดือนมกราคมนี้

Public Relations and Communication Specialist
Big Data Institute (Public Organization), BDI
- Narisara Boonsrihttps://bdi.or.th/en/author/narisara-bo/
- Narisara Boonsrihttps://bdi.or.th/en/author/narisara-bo/
- Narisara Boonsrihttps://bdi.or.th/en/author/narisara-bo/
- Narisara Boonsrihttps://bdi.or.th/en/author/narisara-bo/






