Taking too long? Close loading screen.

สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน)

Navavit Ponganan

Editor-in-Chief and Senior Data Scientist at Big Data Institute (Public Organization), BDI

Publishing Time

Dec 27, 2023 -
Big Data 101

การพยากรณ์อนุกรมเวลา (Time Series Forecasting)

ปัจจุบันนี้ หลายสิ่งรอบที่มีผลกระทบกับตัวเราทั้งทางตรง และ ทางอ้อม ล้วนแล้วมีการพยากรณ์ค่าในอนาคตด้วยกันทั้งนั้นไม่ว่าจะเป็น การพยากรณ์อุณหภูมิ 24 ชั่วโมงข้างหน้า ที่ช่วยให้เราพอจะคาดการณ์ได้ว่า จะหนาว หรือ จะร้อน การพยากรณ์ปริมาณฝุ่น PM2.5 ที่เป็นภัยต่อระบบทางเดินหายใจ การพยากรณ์ปริมาณน้ำฝน ที่ส่งผลต่อการวางแผนใช้ชีวิต หรือ กระทั่งการพยากรณ์จำนวนรถยนต์บนท้องถนน ซึ่งส่งผลต่อการวางแผนเดินทางของเราเป็นอย่างมาก นอกจากนั้นแล้ว ในโลกของธุรกิจ ก็ยังมีการพยากรณ์เชิงตัวเลขมากมาย ไม่ว่าจะเป็น การประมาณการยอดขาย (Sale Forecasting) การประมาณการสินค้าคงคลัง (Inventory Forecasting)...

Dec 26, 2023 -
Data for Business

บทบาทของปัญญาประดิษฐ์ในกลยุทธ์ธุรกิจสมัยใหม่ (The role of AI in modern business strategies)

ปัญญาประดิษฐ์ (AI) กลายเป็นพลังแห่งการเปลี่ยนแปลง และได้ปฏิวัติหลายสิ่งหลายอย่างในชีวิตเรา รวมถึงปฏิวัติวิธีการทำธุรกิจด้วย ความก้าวหน้าอันรวดเร็วของเทคโนโลยี AI ได้นำไปสู่การบูรณาการ AI เข้ากับกลยุทธ์ธุรกิจสมัยใหม่ AI ได้มอบโอกาสมากมายให้ธุรกิจสามารถเจริญเติบโตได้ในสภาพแวดล้อมที่มีการแข่งขันสูงขึ้น ตั้งแต่การปรับปรุงการดำเนินงานไปจนถึงการยกระดับประสบการณ์ของลูกค้า ในบทความนี้ เราจะมาลงลึกบทบาทของ AI ในกลยุทธ์ธุรกิจสมัยใหม่ และสำรวจกันว่า AI กำลังเปลี่ยนอุตสาหกรรมทั่วโลกไปอย่างไร 1. ระบบอัตโนมัติและความมีประสิทธิภาพ (Automation and Efficiency) ประโยชน์หลักประการหนึ่งของ AI ในกลยุทธ์ธุรกิจ คือ ความสามารถในการทำให้งานและกระบวนการต่าง...

Dec 25, 2023 -
Big Data 101

ทำความรู้จักแผนภูมิปฏิทินความร้อน Calendar Heatmaps

กลับมาอีกครั้งกับบทความเกี่ยวกับ Data Visualization ซึ่งในครั้งนี้จะเป็นการนำเสนอการประยุกต์ใช้งานแผนภูมิความร้อนกับข้อมูลอนุกรมเวลาให้ออกมาเป็นรูปแบบแผนภูมิความร้อนชนิดหนึ่งที่เรียกว่า แผนภูมิปฏิทินความร้อน (Calendar Heatmaps) ก่อนอื่น ๆ เลย เรามาทำความรู้จักเบื้องต้นเกี่ยวกับแผนภูมิความร้อน (Heatmaps) กัน กำเนิดแผนภูมิความร้อน ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม เช่น เชื้อชาติ ต้นกำเนิด อายุ ในปารีส ทั้งนี้ในแผนภูมิความร้อนนี้ประกอบไปด้วยเขตพื้นที่รายแถวของปารีสเทียบกับค่าสถิติทางสังคมกว่า 30 ค่า โดยใช้สีทั้งหมด 4...

Dec 13, 2023 -
Big Data 101

การตรวจจับวัตถุด้วยรูปภาพ (Image Detection)

ในปัจจุบันการตรวจจับวัตถุด้วยรูปภาพ (Image Detection) เป็นเทคโนโลยีที่ใช้คอมพิวเตอร์ในการระบุและวิเคราะห์วัตถุที่อยู่ในรูปภาพ ซึ่งการใช้งานนั้นสามารถประยุกต์ใช้ในหลายรูปแบบ ตัวอย่างเช่น การระบุใบหน้าในภาพถ่ายที่เวลาพนักงานต้องเข้าตึกหรือที่เห็นตามหนัง การระบุสินค้าในคลังสินค้า รวมไปถึงในปัจจุบันที่รถยนต์สามารถขับแบบอัตโนมัติได้ก็จะมีการนำเทคโนโลยีนี้มาใช้งานด้วยเช่นกัน ดังนั้นในบทความนี้เราจะมาอธิบายถึงภาพรวมเพื่อให้เห็นภาพว่ามันคืออะไรครับ ประเภทของการตรวจจับวัตถุด้วยรูปภาพ ก่อนอื่นเลย คนที่เข้ามาใหม่หรือยังไม่คุ้นชินกับเรื่องรูปเท่าไหร่ อาจจะมีคำถามว่าเราทำ Image Detection ไปทำไม แล้วมีตัวอย่างให้เห็นภาพชัด ๆ ไหม การตรวจจับวัตถุสามารถแบ่งออกเป็นสามประเภทหลักๆขึ้นอยู่กับเป้าหมายในการใช้งานโดยจะมี Image Classification เป็นการใช้ AI ให้มันบอกเราว่ารูปที่มีมันคือรูปของอะไร เช่น รูปตัวอย่างดังต่อไปนี้ น้องแมว แน่นอนว่าทุกคนรู้ว่ามันคือ...

Oct 17, 2023 -
Data for Business

การใช้ข้อมูลขนาดใหญ่ในวงการแฟชั่นระดับโลก (Big Data in the Global Fashion Industry)

หากพูดถึงแบรนด์ดัง ๆ อย่าง Gucci Montblanc Burberry Zara Pomelo ฯลฯ คนที่ชื่นชอบเรื่องแฟชั่นน่าจะรู้จักกันดี แต่เบื้องหลังความสำเร็จของแบรนด์ดังเหล่านี้ มีการใช้ประโยชน์จากข้อมูลขนาดใหญ่ (Big Data) เพื่อนำมาวิเคราะห์ในมิติต่าง ๆ ในการเพิ่มประสิทธิภาพในการสร้างรายได้และกำไรให้กับธุรกิจ สร้างความความพึงพอใจ และตอบสนองความต้องการของลูกค้าอย่างแม่นยำ รวมถึงการเติบโตแบบยั่งยืนให้กับแบรนด์ของตนเอง   วันนี้เราจะมาพาดูกันกว่าบริษัทชั้นนำเหล่านี้ใช้ประโยชน์จากข้อมูลขนาดใหญ่ สำหรับธุรกิจเสื้อผ้าและแฟชั่นของตนเองอย่างไรกันบ้าง หนึ่งในองค์ประกอบสำคัญที่เป็นเบื้องหลังความสำเร็จของ Zara แบรนด์เสื้อผ้าแฟชั่นที่โด่งดังระดับโลก และเปิดให้บริการหลายสาขาทั่วโลก คือการที่ Zara นำข้อมูลขนาดใหญ่ที่มีมาวิเคราะห์อย่างต่อเนื่อง...

Sep 6, 2023 -
Movements

ความท้าทายในงานจดหมายเหตุเมื่อเข้าสู่ยุค Big Data: ตอนที่ 2 การทำให้เป็นดิจิทัลของเอกสารจดหมายเหตุ (Digitization)

ความท้าทายงานจดหมายเหตุเมื่อเข้าสู่ยุค Big Dataตอนที่ 1. ความหมายของจดหมายเหตุตอนที่ 2. การทำให้เป็นดิจิทัลของเอกสารจดหมายเหตุ (ท่านกำลังอ่านบทความนี้)ตอนที่ 3. การใช้ประโยชน์ข้อมูลงานจดหมายเหตุ ก่อนหน้านี้ในบทความ งาน "จดหมายเหตุ" ความท้าทายเมื่อเข้าสู่ยุค Big Data เราได้รู้จักคำจำกัดความของงาน "จดหมายเหตุ" และการคัดแยกระหว่างสิ่งที่เป็นเอกสารจดหมายเหตุและสิ่งที่ไม่ใช่เอกสารจดหมายเหตุ ซึ่งจะเห็นได้ว่ารูปแบบของเอกสารจดหมายเหตุเปลี่ยนไปตามกาลเวลาดังภาพที่ 1 ภาพที่ 1 ภาพประกอบในบทความก่อนที่จำแนกระหว่างสิ่งที่เป็นจดหมายเหตุและสิ่งที่ไม่เป็นจดหมายเหตุ การจัดการเอกสารจดหมายเหตุในปัจจุบันสมัยจึงเป็นสิ่งที่ท้าทายมากยิ่งขึ้นทั้งในปัจจัยทางรูปแบบเอกสารและปัจจัยทางการวิเคราะห์ข้อมูล ซึ่งในบทความนี้จะแบ่งความท้าทายในงานจดหมายเหตุออกเป็น 4 ประเด็นดังนี้ ข้อมูลมีความหลากหลายมากขึ้นในยุค Big...

Sep 6, 2023 -
Movements

ความท้าทายในงานจดหมายเหตุเมื่อเข้าสู่ยุค Big Data: ตอนที่ 3 การใช้ประโยชน์ข้อมูลงานจดหมายเหตุ (Data Utilization)

ความท้าทายงานจดหมายเหตุเมื่อเข้าสู่ยุค Big Dataตอนที่ 1. ความหมายของจดหมายเหตุตอนที่ 2. การทำให้เป็นดิจิทัลของเอกสารจดหมายเหตุตอนที่ 3. การใช้ประโยชน์ข้อมูลงานจดหมายเหตุ (ท่านกำลังอ่านบทความนี้) จาก 4 ประเด็นความท้าทายในงานจดหมายเหตุ ข้อมูลมีความหลากหลายมากขึ้นในยุค Big Data หากต้องการใช้ข้อมูลเก่าในการวิเคราะห์ การแปลงข้อมูลให้อยู่ในรูปแบบดิจิทัล (Digitization) กับข้อมูลชุดนั้นจึงมีบทบาทที่สำคัญ ข้อมูลที่มีมากขึ้นในปัจจุบันทำให้เทคนิคในการหาข้อมูลเชิงลึก (Insights) และการจัดการเอกสารที่ซับซ้อนยิ่งขึ้นจึงเป็นเรื่องที่สำคัญ ข้อมูลมีบริบทที่หลากหลายทำให้คนที่ตีความข้อมูลและผลการวิเคราะห์ต้องมีความรู้รอบด้าน ในบทความตอนที่ 2 ได้พูดถึงประเด็นความท้าทาย 2 ประเด็นแรกเป็นที่เรียบร้อยแล้ว ซึ่งเกี่ยวข้องกับการทำเอกสารให้อยู่รูปแบบดิจิทัล...

May 9, 2023 -
Big Data 101

Reinforcement Learning from Human Feedback (RLHF) เทคนิคเบื้องหลัง ChatGPT

คงเถียงไม่ได้เลยว่าเวลานี้ ChatGPT เป็นที่พูดถึงกันอย่างมากตั้งแต่มีการเปิดตัวโดย OpenAI ให้คนเข้าไปทดลองเล่นกัน ซึ่งมีการทดลองนำไปประยุกต์ใช้ในงานด้านต่าง ๆ มากมาย ไม่ว่าจะเป็น การสรุปเนื้อหาที่สนใจ การสร้างตัวอย่างซอร์สโค้ดเพื่อตอบโจทย์งานต่าง ๆ ถ้าใครมีโอกาสได้เข้าไปลองเล่นแล้วก็จะพบว่า ChatGPT สามารถพูดคุยโต้ตอบกับเราได้อย่างเป็นธรรมชาติมากจนน่าตกใจ โดยเบื้องหลังของ ChatGPT ที่ทำให้ข้อความที่สร้างออกมานั้นดูสมเหตุสมผลและเป็นธรรมชาตินั้น ได้มีการใช้เทคนิคที่เรียกว่า Reinforcement Learning from Human Feedback (RLHF) ในกระบวนการฝึกฝนโมเดล ซึ่งบทความนี้จะพาท่านผู้อ่านไปรู้จักกับเทคนิค RLHF กันว่ามีหลักการการทำงานอย่างไร RLHF...

Mar 2, 2023 -
Big Data 101

9 วิธีการสร้าง Mobile Friendly Dashboard ให้ใช้งานง่าย

Mobile Friendly Dashboard ในยุคปัจจุบัน เราไม่สามารถปฏิเสธได้เลยว่าความนิยมในการใช้มือถือนั้นเป็นที่แพร่หลายไปทั่วโลก ทั้งการท่องอินเตอร์เน็ต ทำธุรกรรมทางธนาคาร รวมไปถึงการทำงาน ด้วยเทคโนโลยีที่ก้าวไกลทำให้การทำงานสามารถทำได้อย่างง่ายดายแม้กระทั่งการทำงานด้วยโทรศัพท์มือถือ การสร้างแดชบอร์ดสำหรับโทรศัพท์มือถือให้ใช้งานง่าย (Mobile Friendly Dashboard) นั้น คือการออกแบบรูปแบบการแสดงผล องค์ประกอบต่าง ๆ ให้ออกมาอยู่ในรูปแบบที่ง่าย เข้าถึงได้อย่างสะดวก และที่สำคัญผู้ใช้จะต้องสามารถเข้าใจในเนื้อหาได้อย่างมีประสิทธิภาพ เนื่องจากแดชบอร์ดสำหรับโทรศัพท์มือถือนั้นมีพื้นที่ที่จำกัด ดังนั้นการออกแบบ แสดงผลจึงจำเป็นจะต้องก่อให้เกิดประสิทธิผลที่ดี แล้วแดชบอร์ดในคอมพิวเตอร์ต่างจากในโทรศัพท์มือถืออย่างไร ไม่สามารถปฏิเสธได้เลยว่าจุดประสงค์ของแดชบอร์ดสำหรับหน้าจอคอมพิวเตอร์ และแดชบอร์ดสำหรับโทรศัพท์มือถือนั้นแตกต่างกัน การใช้งานในหน้าจอคอมพิวเตอร์อาจถูกออกแบบให้แสดงผลในรูปแบบของภาพรวมที่มีปุ่มคัดกรองผล (Filter) หรือมีกราฟซับซ้อนจำนวนมากสำหรับเหล่าผู้บริหาร ในขณะที่แดชบอร์ดสำหรับโทรศัพท์มือถืออาจถูกใช้โดยพนักงานให้ส่งอีเมล์หรือการแจ้งเตือนเท่านั้น...

Nov 16, 2022 -
Data for Business

ประกัน Data ของบริษัทประกัน - ไม่ใช่แค่ชีวิตกับสุขภาพ... เราต้องดูแลไปจนถึง Privacy

“Data is new Oil” น้ำมันคือสสารจากซากสิ่งมีชีวิตที่นอนหลับไหลใต้ผืนโลกแสนนาน ของเหลวสีดำ ๆ ที่มนุษย์เมื่อหลายร้อยปีที่แล้วจินตนาการไม่ออกเลยว่ามันมีค่ายังไง แต่ทุกวันนี้ ทรัพยากรตัวนี้สร้างความตื่นตาตื่นใจ มันกลายเป็นแหล่งพลังงานให้พวกเราดำเนินชีวิตที่ดีและสบายขึ้นทุก ๆ วัน และก็เพราะน้ำมันสีดำ ๆ นี่แหล่ะ ที่ส่งมนุษย์ไปถึงดวงจันทร์ ( ประโยชน์ของข้อมูล ) ทุกคนในยุคนี้ก็ต่างเชื่อว่า ข้อมูลที่หลับไหลอยู่มากมาย ทั้งในโซเชียล ในฐานข้อมูลองค์กรต่างๆ น่าจะยิ่งมีค่าเป็นทวีคูณยิ่งกว่าน้ำมัน และถ้าเป็นข้อมูลส่วนบุคคลยิ่งจะกลายเป็นทรัพยากรที่สำคัญมาก ๆ ผู้เขียนขอไม่ลงรายละเอียดว่า จะต้องเอาข้อมูลไปทำยังไงถึงสร้างความตื่นตาตื่นใจได้ แต่วันนี้เราจะพุดถึง...

Nov 15, 2022 -
Data for Business

การวิเคราะห์ Social Listening: ความคิดเห็นของผู้บริโภค

ในยุคปัจจุบันที่เป็นยุคแห่ง Big Data หรือข้อมูลขนาดใหญ่ ผู้บริโภคได้รับอิทธิพลจากข้อมูลที่พวกเขาได้รับตลอดเวลาและพฤติกรรมของผู้บริโภคก็กลายมาเป็นข้อมูลสำหรับแบรนด์ เป็นวงจรวนเช่นนี้ไปเรื่อย ๆ ดังนั้นการเข้าใจข้อมูลเชิงลึก ของผู้บริโภคจึงใช่แค่ตัวเลือกในการดำเนินธุรกิจแล้ว แต่กลับเป็นสิ่งจำเป็นสำหรับแบรนด์ เพื่อที่จะดึงลูกค้าไว้กับเรา แต่อย่างไรก็ตามก็ยังเป็นเรื่องยากสำหรับบริษัท โดยเฉพาะบริษัทขนาดเล็กและขนาดกลางที่จะสร้างทีมข้อมูลขนาดใหญ่ บริษัทเหล่านี้จึงมองหาบริการวิเคราะห์ข้อมูลที่ทำโดย AI ที่เป็นตัวช่วยให้บริษัทได้รับข้อมูลเชิงลึก จากข้อมูลมหาศาลในตลาด และปรับปรุงประสิทธิภาพการดำเนินการโดยที่ค่าใช้จ่ายไม่สูง ซึ่งบริการแบบนี้มีชื่อว่า Social-Listening ทำไมเราจึงต้องมี Social Listening? แพลตฟอร์มอีคอมเมิร์ซรายใหญ่ในประเทศจีนอย่างเช่น Tmall ได้มีการเปลี่ยนแปลงประสบการณ์ในการช็อปปิ้งใน Flagship Store ของแบรนด์ต่าง ๆ...

Jul 31, 2022 -
Movements

เมื่อ Google Analytics ผิดกฎหมาย GDPR กับปัญหาที่ซ่อนอยู่ระหว่างสหรัฐอเมริกาและสหภาพยุโรป แล้ว PDPA จะได้รับผลกระทบหรือไม่?

Designed by pch.vector / Freepik เมื่อปลายปีที่แล้ว สำนักงานคุ้มครองข้อมูลแห่งหนึ่งในยุโรปได้แถลงการณ์ถึงการใช้บริการติดตามผู้ใช้งานออนไลน์อย่าง Google Analytics ว่าขัดกับกฎหมายคุ้มครองข้อมูลส่วนบุคคลยุโรป (General Data Protection Regulation: GDPR) สิ่งนี้ไม่เพียงแต่ส่งผลกระทบต่อธุรกิจที่กำลังใช้งาน Google Analytics เท่านั้น แต่ยังส่งผลถึงการตัดสินใจเลือกใช้งานบริการออนไลน์บนแพลตฟอร์มที่อยู่ในประเทศสหรัฐอเมริกา และยังไม่รวมถึงการส่งข้อมูลระหว่างยุโรปและสหรัฐอีกด้วย มีอะไรที่ซ่อนอยู่ในปัญหาดังกล่าวและเราจะถอดบทเรียนอะไรได้จากแถลงการณ์ดังกล่าวกับกฎหมายคุ้มครองข้อมูลส่วนบุคคลของเราได้บ้าง? รายละเอียดของแถลงการณ์ รูปที่ 1 NOYB – European Center for...

Jul 29, 2022 -
Big Data 101

แนวทางการปฏิบัติที่ดีที่สุด สำหรับการวัดความสำเร็จในการลงทุนด้านดิจิทัล (Digital Transformation)

ในยุคปัจจุบันที่แต่ละองค์กรต่างโฟกัสที่การลงทุนในการเปลี่ยนองค์กรแบบเดิม ๆ ให้กลายเป็นองค์กรดิจิทัล สิ่งสำคัญที่ควรให้ความสนใจเป็นอย่างยิ่งคือการสร้างโครงร่างที่ชัดเจนสำหรับการวัดผลความสำเร็จของ การลงทุนด้านดิจิทัล การเปลี่ยนแปลงสู่ดิจิทัล (Digital-Transformation) นั้นมีด้วยกันหลายองค์ประกอบ อาจเริ่มตั้งแต่การเปลี่ยนแปลงด้านกระบวนการและโมเดลธุรกิจไปจนถึงการเปลี่ยนแปลงด้านวัฒนธรรมและพัฒนาองค์กร การวิเคราะห์เพื่อวัดระดับความสำเร็จการลงทุนด้านดิจิทัลนั้นคำนวณจากดัชนีชี้วัดความสำเร็จ (KPI) ซึ่งบ่งชี้การทำกำไรที่เกิดขึ้นสืบเนื่องจากการลงทุนเพื่อการเปลี่ยนแปลงสู่ดิจิทัลเป็นหลัก ซึ่งการวิเคราะห์เหล่านี้จะช่วยรับรองได้ว่าการลงทุนดังกล่าวจะได้รับผลตอบแทนไม่ต่ำกว่าที่ได้คาดการณ์ไว้ในตอนแรก อย่างไรก็ตาม เมื่อไม่นานมานี้ได้มีการจัดทำแบบสำรวจผู้บริหารระดับ C ทั่วโลกโดย EY-Parthenon ซึ่งได้เปิดเผยว่าในขณะที่บริษัทต่าง ๆ ลงทุนด้านเทคโนโลยีมากขึ้นเป็นสองเท่า แต่พวกเขากลับประสบปัญหาในการวางแผนกลยุทธ์การลงทุนด้านดิจิทัลที่ชัดเจน วิธีการกำกับดูแลแบบศูนย์กลาง ในบรรดาผู้ที่ประสบความสำเร็จนั้น พวกเขามักเลือกใช้วิธีกำกับดูแลแบบเข้าสู่ศูนย์กลางในการจัดการกับผลประโยชน์และค่าใช้จ่ายที่เกี่ยวข้อง อีกทั้งกลุ่มผู้นำเหล่านี้ยังได้พัฒนาโปรแกรมทางการเพื่อใช้ระบุ วัดค่า และรายงานผลลัพธ์การลงทุนทางด้านดิจิทัลอีกด้วย “ปัญหาหลักที่คุณต้องคำนึงคือคุณจะจัดสรรเงินทุนเพื่อทำการเปลี่ยนแปลงสู่ดิจิทัลได้อย่างไร และคุณจะวัดผลตอบแทนการลงทุนได้อย่างไร”...

Jun 29, 2022 -
Big Data 101

เทคโนโลยี Remote Sensing (Geospatial Big Data) กับงานประยุกต์ด้านต่าง ๆ

เทคโนโลยี Remote Sensing (Geospatial Big Data) กับงานประยุกต์ด้านต่าง ๆ Remote Sensing หรือ การสำรวจระยะไกล เป็นกระบวนการในการตรวจจับและตรวจสอบลักษณะทางกายภาพของพื้นที่โดยการวัดรังสีที่สะท้อน และที่ปล่อยออกมาจากระยะไกล (โดยทั่วไปมาจากดาวเทียมเครื่องบิน หรือ Drone) กล้องที่มีคุณสมบัติพิเศษจะทำการถ่ายภาพจากระยะไกล ซึ่งช่วยให้เราทราบสิ่งต่าง ๆ ที่เกิดขึ้นบนโลกได้ เพราะกล้องบนดาวเทียม สามารถถ่ายภาพพื้นที่บริเวณกว้าง ทำให้มองเห็นอะไรได้มากกว่าการยืนอยู่บนพื้น และนี่คือตัวอย่างของการนำข้อมูลภาพดาวเทียมไปใช้ในงานประยุกต์ต่าง ๆ เช่น ติดตามไฟป่า ข้อมูลภาพดาวเทียม ทำให้เจ้าหน้าที่ป่าไม้บริหารจัดการพื้นที่บริเวณกว้างได้...

Jun 14, 2022 -
Big Data 101

สร้าง Automated Workflow ในการส่ง Spark Job ขึ้นไปรันบน Amazon EMR Cluster โดยใช้ Apache Airflow

ในปัจจุบันนี้การใช้งานข้อมูลในธุรกิจต่าง ๆ เป็นเรื่องที่จำเป็นอย่างมาก การนำเอาข้อมูลมาใช้ และ การประมวลผลข้อมูล จะช่วยให้เรามีการตัดสินใจในการดำเนินธุรกิจได้อย่างมีประสิทธิภาพมากขึ้น และที่สำคัญคือ ถ้าธุรกิจไหนสามารถนำข้อมูลลูกค้า และที่ได้จากลูกค้า มาช่วยให้เข้าใจลูกค้ามากยิ่งขึ้น ตอบสนองความต้องการของลูกค้าได้ดีขึ้นแล้ว ธุรกิจนั้นจะมีพลังในการแข่งขันในตลาดสูงมากขึ้นอีกด้วย ปัญหาที่พบเจอปัญหาหนึ่งคือว่า เนื่องจากว่าข้อมูลที่เราได้มาในปัจจุบันเริ่มมีมาจากหลายช่องทาง และมีขนาดใหญ่ขึ้นเรื่อย ๆ จนที่เราไม่สามารถที่จะนำมาคำนวณใส่ Excel หรือเขียน Code เพื่อประมวลผลข้อมูลบนเครื่องโน้ตบุ๊กที่เราใช้งานอยู่ได้แล้ว เครื่องมือที่เป็นตัวเลือกแรก ๆ ที่มีความสามารถในการประมวลผลข้อมูลขนาดใหญ่ คือ Apache Spark นั่นเอง แต่ทีนี้การที่จะใช้งานกับข้อมูลที่มีขนาดใหญ่นั้น...

May 17, 2022 -
Movements

ว่าด้วยเรื่องปัญหาด้านความปลอดภัยใน Metaverse (Metaverse Security)

Metaverse Security ว่าด้วยเรื่องปัญหาด้านความปลอดภัยใน Metaverse (Metaverse Security) เนื้อหาโดยย่อ (Metaverse Security) เรื่องการแฮ็กหรือการกลั่นแกล้งทางอินเทอร์เน็ตที่จะส่งผลกระทบใน Metaverse วิธีการแก้ปัญหาที่เสนอมานั้นยังไม่มีประสิทธิภาพมากพอ การเข้ารหัสแบบ End-to-end Encryption (การเข้ารหัสจากต้นทางถึงปลายทาง) จะถูกเลิกใช้ในอีกไม่นานนี้ การไม่เข้าเข้าสู่ Metaverse อาจเป็นทางออกที่ดีที่สุด การกําเนิดขึ้นของ Metaverse หรือที่คนไทยเรียกกันว่าจักรวาลนฤมิตนั้น สร้างความกังวลด้านความปลอดภัยที่มีอยู่ออกมาเป็นลิสต์ยาวเป็นหางว่าว การเพิ่มอีกมิติหนึ่งให้กับ Web 2.0 นํามาซึ่งโอกาสที่จะทำสิ่งที่ไม่ดี ไม่เหมาะสม ไม่ว่าจะเป็นการกลั่นแกล้งทางอินเทอร์เน็ต...

Apr 20, 2022 -
Movements

สิ่งที่คุณต้องรู้ว่าด้วยเรื่องจริยธรรม AI

สิ่งที่คุณต้องรู้ว่าด้วยเรื่องจริยธรรม AI ความซื่อสัตย์เป็นนโยบายที่สำคัญที่สุด และกับปัญญาประดิษฐ์ก็เป็นจริงตามนั้นด้วยเช่นกัน ดังนั้นเรานำความรู้เรื่องจริยธรรม AI มาฝากกัน ( AI จริยธรรม ) AI หรือปัญญาประดิษฐ์ กำลังเปลี่ยนแปลงวิธีการทำงานขององค์กรและการมีส่วนร่วมของผู้คน เทคโนโลยีนี้ช่วยเพิ่มความสามารถในการทำงานที่ง่ายและซ้ำ ๆ ได้โดยอัตโนมัติ ปลดล็อกข้อมูลเชิงลึกที่ซ่อนอยู่ภายใต้ข้อมูลอีกที และช่วยให้เราตัดสินใจได้ดียิ่งขึ้น และมีข้อมูลมากขึ้น แต่ในวันที่ AI ได้เริ่มฝังรากลึกลงในกระแสหลักของไอที ความกังวลที่จะใช้ AI ไปในทางที่ผิดก็มีเพิ่มมากขึ้นเช่นกัน เพื่อแก้ไขปัญหาทางจริยธรรมที่อาจเกิดขึ้นซึ่งเป็นการวิเคราะห์ข้อมูลและการตัดสินใจที่ไม่ได้มาจากมนุษย์เอง มีองค์กรจำนวนมากเริ่มหันมาให้ความสนใจว่าเราจะสามารถป้องกันไม่ให้ AI ทำการตัดสินใจที่อาจเป็นอันตรายได้หรือไม่...

Mar 28, 2022 -
Showroom

การตรวจสอบคำขอสิทธิบัตรที่ใกล้เคียงกันโดยใช้เทคนิคการประมวลผลภาษา (Investigation of similar patent using NLP)

Patented Brand Identity License Product Copyright Concept ปัจจุบันมีนักวิจัยและนักประดิษฐ์มากมายทำงานกันอย่างหนักเพื่อสร้างผลงานวิจัยและสิ่งประดิษฐ์ใหม่ๆ หลายครั้งผลงานเหล่านี้หากเป็นผลงานใหม่ที่ไม่เคยมีมาก่อน สามารถนำไปสู่การขอสิทธิบัตร (Patent) ได้ โดยสิทธิบัตรนั้นถือเป็นเครื่องแสดงทรัพย์สินทางปัญญารูปแบบหนึ่งที่ให้ความคุ้มครองการประดิษฐ์ ไม่ให้ผู้อื่นใดทำการลอกเลียนหรือจำหน่ายสิ่งประดิษฐ์นั้นๆ หากยังอยู่ในระยะเวลาการคุ้มครอง กรมทรัพย์สินทางปัญญา นำโดย กองสิทธิบัตร เป็นหน่วยงานหลักที่มีภารกิจในการกำกับและให้บริการจดทะเบียนสิทธิบัตร โดยมีการตรวจสอบคำขอรับสิทธิบัตรที่ยื่นเข้ามาใหม่ว่ามีความซ้ำซ้อนหรือใกล้เคียงกับผลงานหรือสิ่งประดิษฐ์ที่มีมาก่อนหน้านี้หรือไม่ ซึ่งกระบวนการตรวจสอบนี้อาจต้องใช้เจ้าหน้าที่ที่มีประสบการณ์ในการแยกความแตกต่างของรายละเอียดการประดิษฐ์ รวมถึงอาจต้องใช้เวลาในการอ่านค่อนข้างมาก กระบวนการตรวจสอบคำขอรับสิทธิบัตรแบบเดิม เดิมทีนั้นการตรวจสอบคำขอรับสิทธิบัตรสามารถทำได้โดยผ่านการสืบค้นด้วยคำค้นหาผ่านระบบสืบค้นข้อมูลสิทธิบัตรออนไลน์ (Search Patent System) หรือเว็บไซต์สืบค้นข้อมูลสิทธิบัตรสากลอื่นๆ ซึ่งวิธีการเหล่านี้มีข้อจำกัดในการค้นหา เนื่องจากรายการคำขอรับสิทธิบัตรที่ถูกเลือกมานำเสนอจะเป็นรายการที่จำเป็นต้องมีข้อความที่ตรงกับข้อความค้นหาอยู่ภายในรายละเอียดของคำขอนั้นในลักษณะที่ต้องตรงตามทุกตัวอักษร...

Mar 7, 2022 -
Movements

ฟุตบอลในยุคสงครามข้อมูล

ข้อมูลเรียลไทม์สำหรับฟุตบอล (Genderen, 2019) กีฬาฟุตบอลเป็นหนึ่งในกีฬาที่มีความเก่าแก่และได้รับความนิยมที่สุดในโลก ซึ่งเราจะเห็นพัฒนาการของกีฬานี้ไม่ว่าจะเป็นเทคนิคการเล่น ยูนิฟอร์มของนักฟุตบอล รวมไปถึงเทคโนโลยีการถ่ายทอดสด ที่มีการพัฒนาในแต่ละยุคสมัย ณ ปัจจุบันโลกได้เข้าสู่ถึงยุคของสงครามข้อมูล ไม่ว่าจะเป็นอุตสาหกรรมอะไรใครที่ถือครองข้อมูลและใช้ให้เกิดประโยชน์สูงสุด จะสามารถช่วงชิงความได้เปรียบในอุ9สาหกรรมนั้น โดยบทความนี้จะเล่าเกี่ยวกับการใช้ข้อมูลของวงการฟุตบอลเมื่อเข้าสู่ยุคสงครามข้อมูล การใช้ข้อมูลเพื่อคัดเลือกนักเตะ ในวงการกีฬาฟุตบอล นักฟุตบอลที่เก่งกาจเปรียบเสมือนดั่งขุมทรัพย์ที่ทีมฟุตบอลต่าง ๆ ต้องการทาบทามเพื่อเข้าทีมของตัวเอง โดยเฉพาะนักฟุตบอลดาวรุ่งที่มีแววความสามารถที่จะเป็นสตาร์ดังระดับโลกในอนาคต ดังนั้นการที่ทีมฟุตบอลได้นำเอาศาสตร์ของการวิเคราะห์ข้อมูลเข้ามาช่วยในการคัดเลือกนักเตะ จะสามารถช่วยพวกเขาหาขุมทรัพย์เหล่านั้นได้อย่างมีประสิทธิภาพ การแต่งตั้ง Michael Edwards ของ Liverpool Michael Edwards ผอ. กีฬาของลิเวอร์พูล...

Feb 28, 2022 -
Movements

ประชาธิปไตยข้อมูล (Data Democratization) เทรนที่องค์กรควรสนใจ

คำถามเหล่านี้เป็นคำถามเกี่ยวกับความเสมอภาคในการเข้าถึงและใช้ประโยชน์ของข้อมูลในองค์กร ซึ่งเป็นคนละประเด็นกับสิทธิ์ในการเข้าถึงข้อมูลบางประเภท (User Type) ทำให้หลายๆองค์กรเริ่มมองถึงความไม่เสมอภาคนี้และเป็นที่มาของการทำข้อมูลให้เป็นประชาธิปไตย หรือ Data Democratization ประชาธิปไตยข้อมูล (Data Democratization) ไม่ใช่แค่เรื่องของ การเข้าถึงข้อมูล (Data Access) การทำข้อมูลให้เป็นประชาธิปไตยนั้นมักจะถูกเข้าใจว่าเป็นการให้ทุกคนสามารถเข้าถึงข้อมูลได้อย่างทั่วถ้วนเท่านั้น ซึ่งไม่ถูกเสียทั้งหมด เพราะผู้บริหารก็คงไม่อยากให้พนักงานเห็นข้อมูลความลับของบริษัท หรือฝ่ายบุคคลก็คงไม่อยากให้เราเห็นเงินเดือนของเพื่อนร่วมงานด้วยเช่นกัน ซึ่งหลักการใหญ่ๆในการทำข้อมูลให้เป็นประชาธิปไตย สรุปได้ดังนี้ มีเครื่องมือที่เหมาะสมกับความสามารถของบุคคลในการเข้าถึงและใช้งานข้อมูล สร้างบรรยากาศให้พนักงานรู้สึกผ่อนคลายในการใช้ข้อมูลและตั้งคำถามที่ตอบด้วยข้อมูล ทำเรื่องนี้ให้เป็นกระบวนการต่อเนื่องจนเกิดเป็นวัฒนธรรมขององค์กรในที่สุด เกิดขึ้นเพื่อ แก้ ปัญหาความท้าทายของการใช้ข้อมูล ทำไมองค์กรถึงควรให้ความสำคัญกับเรื่องนี้ ก็เป็นเพราะว่าเรื่องนี้เพื่อจะช่วยแก้ปัญหาที่คนในองค์กรต้องเผชิญเกี่ยวกับการใช้ข้อมูลในวันต่อวัน ซึ่งเป็นอุปสรรคใหญ่ที่ทำให้องค์กรไม่เป็น...

Feb 10, 2022 -
Movements

ค้นหาเวลาและสถานที่ที่ดีที่สุด เพิ่มโอกาสพบทางช้างเผือก ด้วยข้อมูล

ในคืนที่ฟ้ามืดไร้เมฆและปราศจากแสงรบกวน เราจะมองเห็นแถบฝ้าสีขาวคล้ายเมฆพาดยาวข้ามขอบฟ้า ไม่ว่าลมจะพัดแรงเพียงใดแถบฝ้าขาวก็ยังคงอยู่ เราเรียกแถบฝ้าสว่างนี้ว่า "ทางช้างเผือก" หรือ "ทางน้ำนม" (Milky way) ในฐานะที่ผมและคุณผู้อ่าน ต่างก็เป็นคนที่เล่นสนุกกับข้อมูล และผมก็เชื่อว่าท่านผู้อ่านไม่น้อยที่ฝันจะได้เห็นทางช้างเผือกผ่านสายตาของตัวเองสักครั้ง ดังนั้นในบทความนี้ก็จะขอออกนอกจากแนวทางเดิม ๆ แล้วมาลองใช้การวิเคราะห์ข้อมูลเพื่อมาเพิ่มโอกาสพบทางช้างเผือกด้วยตาตนเองกันนะครับ สำหรับการตามหาทางช้างเผือก สิ่งที่ข้อมูลสามารถช่วยหาคำตอบได้มีอยู่สองส่วน สถานที่ใดที่จะสามารถมองเห็นทางช้างเผือกได้ดีที่สุด (Where should you go to see the Milky Way?) ในการหาคำตอบในเรื่องนี้เราก็ต้องทำการค้นหาสถานที่ท้องฟ้ามืดที่สุดหรือสถานที่ที่ไม่ถูกรบกวนจากมลภาวะทางแสง (Light pollution)...

Sign up to join Big Data Community Thailand

Make comments, write articles, and contribute to our community.