Taking too long? Close loading screen.

สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

ความท้าทายในงานจดหมายเหตุเมื่อเข้าสู่ยุค Big Data: ตอนที่ 2 การทำให้เป็นดิจิทัลของเอกสารจดหมายเหตุ (Digitization)

Sep 6, 2023

ความท้าทายงานจดหมายเหตุเมื่อเข้าสู่ยุค Big Data
ตอนที่ 1. ความหมายของจดหมายเหตุ
ตอนที่ 2. การทำให้เป็นดิจิทัลของเอกสารจดหมายเหตุ (ท่านกำลังอ่านบทความนี้)
ตอนที่ 3. การใช้ประโยชน์ข้อมูลงานจดหมายเหตุ


ก่อนหน้านี้ในบทความ งาน “จดหมายเหตุ” ความท้าทายเมื่อเข้าสู่ยุค Big Data เราได้รู้จักคำจำกัดความของงาน “จดหมายเหตุ” และการคัดแยกระหว่างสิ่งที่เป็นเอกสารจดหมายเหตุและสิ่งที่ไม่ใช่เอกสารจดหมายเหตุ ซึ่งจะเห็นได้ว่ารูปแบบของเอกสารจดหมายเหตุเปลี่ยนไปตามกาลเวลาดังภาพที่ 1

ภาพที่ 1 ภาพประกอบในบทความก่อนที่จำแนกระหว่างสิ่งที่เป็นจดหมายเหตุและสิ่งที่ไม่เป็นจดหมายเหตุ

การจัดการเอกสารจดหมายเหตุในปัจจุบันสมัยจึงเป็นสิ่งที่ท้าทายมากยิ่งขึ้นทั้งในปัจจัยทางรูปแบบเอกสารและปัจจัยทางการวิเคราะห์ข้อมูล ซึ่งในบทความนี้จะแบ่งความท้าทายในงานจดหมายเหตุออกเป็น 4 ประเด็นดังนี้

  1. ข้อมูลมีความหลากหลายมากขึ้นในยุค Big Data
  2. หากต้องการใช้ข้อมูลเก่าในการวิเคราะห์ การแปลงข้อมูลให้อยู่ในรูปแบบดิจิทัล (Digitization) กับข้อมูลชุดนั้นจึงมีบทบาทที่สำคัญ
  3. ข้อมูลที่มีมากขึ้นในปัจจุบันทำให้เทคนิคในการหาข้อมูลเชิงลึก (Insights) และการจัดการเอกสารที่ซับซ้อนยิ่งขึ้นจึงเป็นเรื่องที่สำคัญ
  4. ข้อมูลมีบริบทที่หลากหลายทำให้คนที่ตีความข้อมูลและผลการวิเคราะห์ต้องมีความรู้รอบด้าน

โดยบทความนี้จะพูดถึงในสองหัวข้อแรกก่อน ซึ่งเกี่ยวข้องกับส่วนของการแปลงข้อมูลให้อยู่ในรูปแบบดิจิทัล (Digitalization)

ข้อมูลที่หลากหลายมากขึ้นในยุค Big Data

ด้วยความที่หลักฐานทางประวัติศาสตร์สามารถเป็นเอกสารจดหมายเหตุได้ โดยขึ้นอยู่การจัดการเก็บรวบรวมของเอกสารหรือวัสดุนั้น ๆ หากหลักฐานทางประวัติศาสตร์นั้นได้ถูกจัดเก็บและได้ทำบัญชีแล้ว หลักฐานทางประวัติศาสตร์นั้นจะนับเป็นเอกสารจดหมายเหตุตามนิยามของเอกสารจดหมายเหตุ ฉะนั้นการพิจารณารูปแบบของเอกสารจดหมายเหตุจึงสามารถทำได้เหมือนกับ “หลักฐานทางประวัติศาสตร์”

เอกสารจดหมายเหตุสามารถเป็นได้ทั้งในรูปแบบที่เป็นลายลักษณ์อักษรและไม่ใช่ลายลักษณ์อักษร โดยผันแปรไปตามเทคโนโลยี ซึ่งในปัจจุบัน รูปแบบการจัดเก็บของเอกสาร มีความซับซ้อนยิ่งขึ้นตามเทคโนโลยี เอกสารจดหมายเหตุนั้นสามารถอยู่ทั้งในรูปแบบดิจิทัลและรูปแบบไม่เป็นดิจิทัล ซึ่งสามารถแบ่งออกมาได้เป็นดังภาพที่ 2

ภาพที่ 2 เอกสารที่สามารถเป็นจดหมายเหตุได้ ซึ่งหมายรวมถึงยังอยู่ในกระแสการใช้งานและไม่อยู่ในกระแสการใช้งานในปัจจุบัน ซึ่งในอนาคตสามารถเป็นเอกสารที่ไม่อยู่ในกระแสการใช้งาน จะสามารถแบ่งออกเป็น 2 ประเภทหลัก คือ Digital-born Archives และ Non-digital-born Archives โดยการแบ่งในขั้นตอนถัดจากนั้น คือ ความเป็นโครงสร้างของเอกสาร ซึ่งหมายถึงความซับซ้อนในการจัดการกับข้อมูลชุดนั้น ๆ
เอกสารแบบมีโครงสร้างกับเอกสารแบบไม่มีโครงสร้าง

โครงสร้างของเอกสารนับจากรูปแบบที่ตายตัวของเอกสารนั้น ๆ เช่น เอกสารที่มีรูปแบบชัดเจนถูกกำหนดด้วยระเบียบ เช่น เอกสารของรัฐในสหรัฐอเมริกาที่มีรูปแบบมาตรฐานจาก U.S. Government Publishing Office Style Manual หรือในประเทศไทยที่มีระเบียบสำนักนายกรัฐมนตรีว่าด้วยงานสารบรรณ พ.ศ. 2526 กำกับอย่างชัดเจน หรือแม้แต่ว่าหากไม่ได้มีลักษณะรูปแบบที่ตายตัวก็อาจมีวิธีการเขียนที่ตายตัว เช่น มหากฎบัตร (Magna Carta)

แต่เมื่อเรากล่าวถึงเอกสารที่ไม่มีรูปแบบตายตัวหรือเอกสารไม่มีโครงสร้าง เราจะหมายถึงวิธีการเขียนที่มีพลวัตเฉพาะในแต่ละเล่ม หรือ อาจมีลักษณะการเขียนที่เฉพาะซึ่งไม่ตรงกับไวยากรณ์ปัจจุบันหรือเป็นการเล่นกลเพื่อสุนทรียภาพ เช่น ความเป็นกลบท หรือ ภาพประกอบ ซึ่งลักษณะเอกสารโบราณเหล่านี้จึงไม่สามารถใช้วิธีการจัดการเอกสารเหมือนกับเอกสารในยุคปัจจุบันได้

การคัดแยกเอกสารที่สามารถเป็นจดหมายเหตุได้ว่าเป็น Digital-born จะสามารถคัดแยกได้จากความจำเป็นในการทำ Digitization ต่อเอกสารนั้น ๆ หากต้องการให้คอมพิวเตอร์สามารถอ่านได้ หากเอกสารนั้นไม่มีความจำเป็นในการทำ Digitization จะนับว่าเอกสารที่เป็น Digital-born

ว่าด้วยรูปแบบเอกสาร Digital-born และโครงการที่เกี่ยวข้อง

เอกสารที่เป็น Digital-born จะกล่าวถึงเอกสารที่สร้างขึ้นจากคอมพิวเตอร์ โดยไม่ได้เกิดจากกระบวนการ Digitization โดยตัวอย่างเอกสาร Digital-born จะเป็นไปดังภาพที่ 3

ภาพที่ 3 ตัวอย่างเอกสาร Digital-born ซึ่งมีความแตกต่างกันในรูปแบบของเอกสารและวิธีการซึ่งได้มาด้วยข้อมูล
ตัวอย่างของเอกสาร digital-born
  1. ข้อมูลเว็บไซต์ เป็นข้อมูลที่สามารถเข้าถึงได้ผ่านเว็บเบราว์เซอร์ โดยอยู่ในรูปแบบเว็บไซต์ เช่น เว็บไซต์ของหน่วยงานราชการ ซึ่งจะเก็บรูปแบบของเว็บไซต์และข่าวประชาสัมพันธ์ที่เกี่ยวข้อง
  2. ข้อมูลที่เกี่ยวข้องกับ e-Service เป็นข้อมูล Transactional ที่เกิดขึ้นจากกระบวนการที่เกี่ยวข้องกับบริการอิเล็กทรอนิกส์
  3. ข้อมูลสถิติ เป็นข้อมูลที่สร้างขึ้นโดยเป็นดิจิทัล ทั้งในรูปแบบเชิงภูมิสารสนเทศ ซึ่งสร้างขึ้นจากดาวเทียมหรืออากาศยานที่ส่งข้อมูลแบบดิจิทัล หรือไม่ใช่รูปแบบสารสนเทศที่ไม่ใช่เชิงภูมิสารสนเทศ เช่น ข้อมูลสำรวจ ข้อมูลเอกสารสารบรรณอิเล็กทรอนิกส์
  4. ข้อมูลประเภทอื่น ๆ เช่นข้อมูล Graph Network เช่น ข้อมูลสังคมออนไลน์ ข้อมูลความเชื่อมโยงจากความสัมพันธ์ที่วิเคราะห์ในแบบจำลอง หรือ Linked Data เช่น วิกิพีเดีย, ข้อมูล Streaming อย่างข้อมูลจากอุปกรณ์ Internet of Things (IoT) เป็นต้น

การแบ่งรูปแบบเอกสาร Digital-born นี้มีความแตกต่างในการจัดเก็บข้อมูล อย่างข้อมูลเว็บไซต์อาจต้องเก็บข้อมูลให้ยังสามารถเข้าถึงผ่านเว็บเบราว์เซอร์ได้ในปัจจุบัน โดยมีเซิร์ฟเวอร์ที่สามารถโฮสต์เว็บนั้นได้อยู่ ข้อมูลที่เกี่ยวข้องกับ e-Service อาจสามารถเก็บอยู่ภายใต้ Relational Database, ข้อมูลสถิติอาจปล่อยเป็นรูปแบบหน้า View ซึ่งให้เข้าถึงผ่าน API ได้ หรือข้อมูลประเภทอื่น ๆ ซึ่งวิธีการเก็บข้อมูลต่าง ๆ จะใช้สถาปัตยกรรมข้อมูลที่แตกต่างกันขึ้นกับข้อมูลนั้น ๆ

ความท้าทายแรกที่ว่านี้จึงเป็นส่วนของการวางสถาปัตยกรรมข้อมูลและการวางนโยบายธรรมาภิบาลข้อมูลขององค์กร ซึ่งโครงการธรรมาภิบาลข้อมูลจากแต่ละประเภทข้อมูลที่ได้ยกตัวอย่างมาอาจยกตัวอย่างได้ 2 กรณี คือ

  1. Government Web Archive: ในหลายประเทศ โครงการที่เกี่ยวข้องกับการทำงานจดหมายเหตุกับข้อมูลเว็บไซต์ของรัฐบาลได้มีการจัดทำขึ้น เช่น สหราชอาณาจักร ออสเตรเลีย นิวซีแลนด์ โดยโครงการดังกล่าวนี้ได้เก็บเว็บไซต์ของรัฐในทุก ๆ เวอร์ชันตั้งแต่เวอร์ชันเก่า จนถึงเวอร์ชันก่อนเวอร์ชันปัจจุบัน การต่อยอดการวิเคราะห์ข้อมูลเว็บไซต์เกิดขึ้นเพื่ออำนวยความสะดวกในการค้นคว้าข้อมูลได้เกิดขึ้น ซึ่งตัวอย่างหน่วยงานที่เกี่ยวข้องกับการวิเคราะห์ข้อมูลขนาดใหญ่ที่จัดทำโครงการนี้ คือ สถาบันอลัน ทัวริ่ง (Alan Turing Institute) ภายใต้การสนับสนุนงบประมาณของรัฐบาลสหราชอาณาจักร โดยจัดทำ Semantic Search Engine ของ The National Web Archive ของสหราชอาณาจักร1 สร้างออกมาเป็น Knowledge Graph และทำ Tagging ในเว็บเพจที่มีในฐานข้อมูล
  2. Government Open Data: หลายประเทศก็มีโครงการในลักษณะแบบนี้เช่นกัน โดยมีกระบวนการที่ถูกวิจัยหลายประเด็น เช่น การทำ Semantic Tagging ในกระบวนการจัดทำร่างกฎหมาย2 หรือมีความพยายามสร้างการมีส่วนร่วมของประชาชนของ Open Data platform เช่น https://data.gouv.fr ก็เป็นการจัดการเอกสาร Digital-born ในอีกรูปแบบหนึ่งเช่นกัน

แต่ถ้าหากว่าเราสนใจเอกสารที่ไม่เป็น Digital-born ความท้าทายที่เกิดขึ้นจะเป็นอีกรูปแบบหนึ่ง ซึ่งเจาะจงไปที่การทำให้อยู่ในรูปแบบดิจิทัลของเอกสารนั้น ๆ โดยจะกล่าวถึงในหัวข้อถัดไป

กระบวนการ Digitization ในเอกสารจดหมายเหตุ

การทำ Digitization เบื้องต้นในเอกสารจดหมายเหตุจะสามารถแบ่งขั้นตอนได้ออกมาเป็น 4 ขั้นตอนหลักดังภาพที่ 4 ซึ่งกระบวนการที่มีความแตกต่าง คือ กระบวนการที่ 1 ในการสแกนเอกสารซึ่งใช้อุปกรณ์และเทคนิคที่แตกต่างกันตามชนิดเอกสารนั้น ๆ และกระบวนการที่ 3 ที่จะทำการดึงสารสนเทศของเอกสาร (Information Retrieval) นั้นออกมา เช่น เอกสารลายลักษณ์ สามารถใช้เทคนิค Optical Character Recognition (OCR) ในดึงข้อความจากเอกสาร หรือ เอกสารจำพวกเสียง อาจนำเทคนิคที่เกี่ยวกับ Speech-to-text มาแปลงเป็นรูปคำที่กล่าวออกมาในไฟล์เสียงนั้น ๆ ได้อีกด้วย

ภาพที่ 4 กระบวนการทำ Digitization เบื้องต้น
รายละเอียดการทำ digitization

ขั้นตอนการทำ digitization สามารถแบ่งเป็น 4 ขั้นตอนโดยคร่าวดังนี้

  1. Scanning: กระบวนการนี้เป็นการทำให้เอกสารอยู่ในรูปแบบดิจิทัล (Digitalization) จะใช้อุปกรณ์ที่ตรวจจับสัญญาณแอนาล็อกเป็นสัญญาณดิจิทัล (Analog-to-digital Device) เช่น กล้องถ่ายรูป เครื่องอัดเสียงดิจิทัล เครื่องสแกนสามมิติที่พยายามสร้าง Point Cloud แล้วแปลงเป็นวัตถุสามมิติ โดยกระบวนการนี้จะเป็นเพียงการสุ่มตัวอย่างจากบางส่วนของสัญญาณแอนาล็อกเท่านั้น เพราะ Digitalization จะมีขั้นตอนที่ทำให้เกิดการสูญเสียรายละเอียดข้อมูลไปบางส่วนจากกระบวนการ Sampling กับ Quantization
  2. Upload: ถัดจากที่ได้เอกสารรูปแบบดิจิทัลในขั้นตอนที่ 1 เป็นที่เรียบร้อยแล้ว การจัดเก็บข้อมูลที่ได้มาเป็นเรื่องที่สำคัญก่อนที่จะนำมาใช้ประโยชน์ ซึ่งส่วนประกอบที่สำคัญ คือ ตัวจัดเก็บข้อมูลและระบบจัดการไฟล์ ซึ่งสามารถเป็นได้ทั้งระดับส่วนบุคคล จนถึงสามารถวางศูนย์ข้อมูลที่รองรับข้อมูลขนาดใหญ่มากขึ้น
  3. Process: สืบเนื่องจากเอกสารดิจิทัลที่ได้มาในขั้นตอนที่ 1 นั้นยังมีลักษณะรูปแบบที่คอมพิวเตอร์ยังไม่สามารถประมวลผลได้ (Machine-readable) ขั้นตอนนี้จึงเป็นการตีความหมาย ซึ่งถ้าหากเป็นตัวอักษรอาจทำการปริวรรต (Transliteration) หรือถ้าเป็นเสียง อาจใช้การถอดเสียง (Transcription) ออกมาได้เช่นกัน นอกจากนี้ การทำสาระสังเขปหรือบัญชีข้อมูลให้กับเอกสารดังกล่าวก็มีส่วนที่ทำให้เห็นถึงบริบทของเอกสารมากยิ่งขึ้นอีกด้วย
  4. Display: เมื่อเอกสารได้ผ่านกระบวนการทั้งสามกระบวนการเป็นที่เรียบร้อยแล้ว เราสามารถทำให้เกิดการใช้ประโยชน์ข้อมูลโดยสาธารณะได้ด้วยการเผยแพร่และสร้างแพลตฟอร์มให้สามารถเข้าถึงได้ ซึ่งทำให้การเป็นจดหมายเหตุสาธารณะได้ทำหน้าที่ของมันโดยสมบูรณ์

ทว่าในบางครั้ง ความแม่นยำในการดึงสารสนเทศออกมาจากเอกสารเหล่านั้นอาจมีไม่สูงนัก เนื่องจากข้อจำกัดทางอุปกรณ์และอัลกอริทึมที่ใช้ในการดึงข้อมูล โดยในที่นี้เราจะยกตัวอย่างเป็นเอกสารลายลักษณ์ที่ปรากฏอยู่ในประวัติศาสตร์ไทย

Digitization งานเอกสารลายลักษณ์ภาษาไทย

ในบริบทของภาษาไทย การปฏิรูปอักขระไทยมีส่วนสำคัญในการประเมินความสะดวกในการทำ digitization โดยการปฏิรูปอักขระไทยเกิดขึ้นในสมัยรัชกาลที่ 3 จากใบประกาศห้ามสูบฝิ่นและเอกสารไวยากรณ์ไทย และมีแบบอักขระในการจัดพิมพ์ที่เหมาะสมกับการพิมพ์เอกสารด้วยแท่นเดิม ซึ่งเรียกว่าตัวพิมพ์ตะกั่ว เหตุการณ์สำคัญดังกล่าวที่ใช้แยกเกณฑ์การทำ Digitization คือ การทำให้ตัวอักขระไทยเป็นอักขระตั้งตรง (Latinization3,4) โดยความแตกต่างเป็นไปดังภาพที่ 5

ภาพที่ 5 วัฒนาการของอักษรไทยที่มีผลต่อการทำ Digitization เอกสารเก่าของไทย ซึ่งแบ่งจากกระบวนการ Latinization ในสมัยรัชกาลที่ 3 โดยความแตกต่างระหว่างตัวพิมพ์ที่ทำ Latinization กับยังไม่ได้ทำ Latinization คือ โครงสร้างตั้งตรงของตัวอักษรและจัดการตัวอักษรเป็นลักษณะบล็อก แยกเป็นอักขระตัวต่อตัวชัดเจน ไม่มีการรวมตัวอักษรเข้าด้วยกันเป็นลักษณะพิเศษ (Ligature เช่น เข้า ในภาพแรก และ หมาย ในภาพที่สอง)

นอกจากนี้แล้ว รูปแบบเอกสารอาจไม่ได้มีลักษณะเป็นการเขียนเรียงเป็นบรรทัดอย่างที่เป็นในปัจจุบันดังตัวอย่างในภาพที่ 6 เช่น กลบท หรือ การเขียนรวบรัดอย่างฉบับขอม รวมทั้งในบางครั้งเอกสารนั้นอาจไม่ได้ใช้ตัวอักษรไทย แต่อาจใช้ไวยากรณ์และการสะกดแบบภาษาไทย เช่น ตัวอักษรไทยย่อ ไทยขอม ปัลลวะ ตัวธรรมอีสาน/เมือง หรืออาจเขียนเป็นภาษาอื่น เช่น ภาษาจีน

ภาพที่ 6 การเขียนที่เป็นความท้าทายต่อการดึงข้อมูลสารเทศในเอกสารลายลักษณ์ไทย

หากว่ากระบวนการ OCR ไม่สามารถนำมาใช้ได้แล้ว โดยปกติ วิธีการทางโบราณคดีในการตีความเอกสารเหล่านี้จะแบ่งออกเป็น 5 ขั้นตอนตามภาพที่ 7

ภาพที่ 7 กระบวนการตีความแปลอักษรจากเอกสารลายลักษณ์ในทางโบราณคดี ซึ่งยกตัวอย่างจารึกวัดศรีชุม
รายละเอียดการถอดอักขระจากเอกสารลายลักษณ์ไทย (ซึ่งอาจไม่ใช่อักษรไทยปัจจุบัน)
  1. ทำสำเนาต้นฉบับกับเอกสารที่เกี่ยวข้องในกรณีที่เอกสารดังกล่าวนั้นไม่สามารถยกมาได้ (ซึ่ง ณ ที่นี้ หมายถึงกำลังแรงของนักโบราณคดีทั่วไปคนหนึ่ง)
    • เอกสารที่สามารถยกมาได้ ยกตัวอย่างเช่น หนังสือไม้ไผ่จากสมัยจีนยุคจักรพรรดิ สมุดใบลาน สมุดไทย ซึ่งสิ่งเหล่านี้สามารถยกมาได้ไม่ต้องทำขั้นตอนนี้ แต่หากว่ามีการถอดรื้อหรือทำความสะอาดเพื่อบำรุงรักษาเอกสารและทำให้กระบวนการถอดอักขระเป็นไปได้ง่ายยิ่งขึ้น
    • เอกสารที่ไม่สามารถยกได้ เช่น จารึก ซึ่งกระบวนการทำสำเนาจารึกจะเป็นไปในลักษณะดังในวิดีทัศน์นี้ (วิดีทัศน์ประกอบ: ตอนที่ 4 การทำสำเนาจารึก โดย อาจารย์พอพล สุกใส – YouTube)
  2. ถอดอักษรจากต้นฉบับหรืออักขรวิทยา (Paleography): กระบวนการนี้อาศัยความเข้าใจในบริบททางประวัติศาสตร์และอักษรศาสตร์ในการถอดอักษรออกมาให้ใกล้เคียงกับสถานการณ์ ณ ขณะนั้นที่สุด เริ่มต้นจากการตีความก่อนว่าอักษรดังกล่าวเป็นอักษรรูปแบบใดและเขียนในภาษาใด ซึ่งอาจมีการเข้ารหัสข้อความและถอดความต่อไปในขั้นตอนถัดไป
  3. การถอดปริวรรต (Transliteration): กระบวนการนี้เป็นกระบวนการที่พยายามแปลงอักษรที่ได้มาจากการแปลงในการทำอักขรวิทยาให้อยู่ในรูปแบบภาษาปัจจุบันตามหลักการสะกดและไวยากรณ์
  4. การแปลความ: กระบวนการนี้จะมีการใช้บริบททางประวัติศาสตร์เพิ่มเข้าไปให้บุคคลอื่นสามารถเข้าใจความเป็นมาของเอกสาร นักประวัติศาสตร์จะมีบทบาทมากในส่วนนี้ ซึ่งฐานคิดของนักประวัติศาสตร์จะวางอยู่บนปรัชญาประวัติศาสตร์ของสำนักต่าง ๆ และข้อเสนอของนักประวัติศาสตร์ท่านอื่น ๆ

จะเห็นได้ว่าในกระบวนการ Digitization ขั้นตอนที่ 1 และ 3 ในภาพที่ 4 นั้นมีความละเอียดอ่อนและบางครั้งอาจต้องใช้ผู้เชี่ยวชาญจากสาขาที่เกี่ยวข้องกับเอกสารชุดนั้น ๆ มาทำ Digitization อีกด้วย นอกจากนี้แล้ว กระบวนการ Digitization ยังมีความซับซ้อนเพิ่มเติมในส่วนขั้นตอนที่ 2 และขั้นตอนที่ 4 อีกด้วย ซึ่งความซับซ้อนดังกล่าวเกี่ยวข้องกับการจัดการข้อมูลขนาดใหญ่และลักษณะภววิทยาของเอกสารจดหมายเหตุที่แปลงมาอยู่ในรูปแบบดิจิทัลเป็นที่เรียบร้อยแล้วอีกด้วย

เมื่อเรากล่าวถึงกระบวนการที่ทำให้เอกสารต่าง ๆ เป็นข้อมูลดิจิทัลซึ่งนำไปใช้ประโยชน์ได้แล้ว ความท้าทายหนึ่งที่สำคัญไม่แพ้กับกระบวนการ Digitization คือ การนำข้อมูลไปใช้ประโยชน์ได้อย่างมีประสิทธิภาพ ซึ่งเราจะกล่าวในตอนถัดไป


เชิงอรรถ

  1. Alan Turing Institute, Data Study Group Final Report: The National Archives, UK, สามารถเข้าถึงได้ที่ https://www.turing.ac.uk/sites/default/files/2021-06/data_study_group_final_report_2020_-_national_archives.pdf ↩︎
  2. Petr Křemen และ Martin Nečaský (2019), Improving discoverability of open government data with rich metadata descriptions using semantic government vocabulary, สามารถเข้าถึงได้ที่: https://doi.org/10.1016/j.websem.2018.12.009 ↩︎
  3. ประชา สุวีรานนท์ (2545), ๑๐ ตัวพิมพ์ กับ ๑๐ ยุคสังคมไทย, สามารถเข้าถึงได้ที่: https://www.sarakadee.com/feature/2002/09/thaifont.htm ↩︎
  4. กมลกานต์ โกศลกาญจน์ (2564), ทุติยะและฝรั่งเศส ความจริงในความเปลี่ยนแปลง, สามารถเข้าถึงได้ที่: https://www.cadsondemak.com/medias/read/thai-latinized-typeface ↩︎

เรียบเรียงโดย กฤตพัฒน์ รัตนภูผา
ตรวจทานและปรับปรุงโดย นววิทย์ พงศ์อนันต์

Kittapat Ratanaphupha

Data Scientist at Big Data Institute (Public Organization), BDI

Navavit Ponganan

Editor-in-Chief and Senior Data Scientist at Big Data Institute (Public Organization), BDI