Data Fabrics

Data Fabrics

ข่าวและบทความที่เกี่ยวข้อง

Related news and articles

PostType Filter En

บทความ

เปรียบเทียบ Data Fabric, Data Mesh และ Knowledge Graph
เป็นเวลาเกือบหนึ่งทศวรรษหรือมากกว่านั้นแล้วที่เวนเดอร์ ผู้ให้คำปรึกษา ตลอดไปจนถึงลูกค้าของพวกเขาได้พูดคุยกันในแง่ของโครงสร้างข้อมูลหรือ Data Fabric ถ้าหาก “Big Data (ข้อมูลขนาดใหญ่)” เป็นปัญหาที่ต้องแก้ไข Data Fabric ก็แนะนำทางแก้ไว้เสร็จสรรพแล้ว John Mashey (จอห์น แมชีย์) หัวหน้านักวิทยาศาสตร์ที่ Silicon Graphics ใช้ศัพท์คำว่า “Big Data” เพื่อบรรยายถึงชุดข้อมูลขนาดใหญ่ที่ไม่มีโครงสร้างและผลกระทบที่ของมันมีต่อโครงสร้างพื้นฐานในสไลด์นำเสนอในปี 1998 อีกทั้ง Apache Hadoop ได้รับความนิยมขึ้นมาหลังจากวิศวกรคนหนึ่งที่ New York Times ได้เขียนบล็อกในปี 2009 เกี่ยวกับการผสมผสาน PDF แบบอัตโนมัติโดยใช้ Hadoop ( Big Data และทางเเก้ไข ) ศัพท์คำว่า “Data Lake” เริ่มมาเป็นที่นิยมในต้นทศวรรษ 2010 เพื่อบรรยายถึงวิธีที่ไม่เป็นทางการในการทำให้ทีมวิเคราะห์สามารถเข้าถึงข้อมูลหลายประเภทได้ Data Lake ช่วงแรก ๆ เกี่ยวข้องกับคลังแบบกระจายตามแนวทางของ Hadoop สำหรับการวิเคราะห์ที่เรียบง่าย (10000 โหนดคลัสเตอร์ของ Yahoo ซึ่งได้แรงบันดาลใจจากการเก็บข้อมูลแบบกระจายภายในช่วงแรก ๆ ของ Google ) แต่เมื่อองค์กรเพิกเฉยต่อ Data Lake ของพวกเขา นักวิจารณ์จึงรีบเรียกมันว่า “Data Swamp” แต่การใช้ Data Lake ยังคงมีต่อไปไม่น้อยลงเลย อาจเพราะว่า Data warehouse ก็มักไม่ได้รับการดูแลอย่างดีเช่นกัน Data Fabric ในปี 2014 SAP ใช้ “In-memory Data Fabric” เพื่ออธิบายถึงคลังข้อมูลออนไลน์ ซึ่งเป็นองค์ประกอบหลักของสายผลิตภัณฑ์ “360-degree Customer View ” จาก HANA ทุกวันนี้ Gartner ก็ใช้ศัพท์คำว่า “Data Fabric” เพื่อหมายถึงวิธีครบวงจรของการผสมผสานข้อมูลที่ต่างชนิดกัน  เมื่ออ้างอิงจากโพสต์ในปี 2021 เรื่องสถาปัตยกรรม Data Fabric: “[Data Fabric] คือแนวความคิดซึ่งทำหน้าที่เป็นข้อมูลหลายระดับชั้น (Fabric) ซึ่งผสมผสานกันและเป็นกระบวนการที่เชื่อมโยงกัน Data Fabric ใช้ประโยชน์จากการวิเคราะห์ Metadata Asset ที่มีอยู่ ค้นพบได้ อนุมานได้ อย่างต่อเนื่อง เพื่อสนับสนุนการออกแบบ การจัดสรร และการใช้ข้อมูลที่ผสมผสานและใช้ซ้ำใหม่ในเงื่อนไขต่าง ๆ ได้ ซึ่งรวมไปถึงแพลตฟอร์มไฮบริดและ Multi-cloud อีกด้วย “Data Fabric ใช้ประโยชน์จากศักยภาพของทั้งมนุษย์และเครื่องจักรเพื่อเข้าถึงข้อมูลที่มีอยู่ อีกทั้งยังระบุและเชื่อมโยงข้อมูลจากการใช้งานที่แตกต่างกันเพื่อค้นพบความสัมพันธ์เชิงธุรกิจใหม่ ๆ ระหว่าง  Data Point ที่มีอยู่” Gartner เผยแพร่รายงานเรื่องการบริหารข้อมูลของ “AI-enabled” และทิศทางการเปลี่ยนแปลงของการบริหารข้อมูล “Data Fabric” จึงกลายมาเป็นวิธีลัดสำหรับเทคนิคการบริหารข้อมูลที่สมัยใหม่ที่มีศักยภาพมากกว่า Data Mesh Zhamak Dehghani (ซามัค เดคานี) ผู้อำนวยการฝ่ายเทคโนโลยีอุบัติใหม่ที่ Thoughtworks กับทีมงานของเธอ คิดค้นแนวคิดของ “Data Mesh” ขึ้นมาว่าเป็นอีกทางเลือกหนึ่งของคลังข้อมูลและ Data Lake ซึ่งเชื่อมกับโดเมนและเป็นแบบกระจาย ี่ Thoughtworks เปรียบเปรยว่าการใช้งานนั้นเป็นเหมือน Data Plane สองอัน-อันหนึ่งเป็นฝ่ายปฏิบัติการและอีกอันเป็นฝ่ายวิเคราะห์ แนวคิดเรื่อง Data Mesh ของ Thoughtworks มุ่งเน้นที่วิธีที่ใช้โดเมนมากกว่าวิธี Monolithic ของสถาปัตยกรรมเชิงวิเคราะห์ เจ้าของ Domain Data ต้องรับผิดชอบต่อการมอบข้อมูลที่กลายเป็นผลิตภัณฑ์ให้กับผู้ใช้งาน  “ข้อมูลในฐานะผลิตภัณฑ์” หมายความว่าข้อมูลที่ให้นั้นต้องมีคุณภาพ สมบูรณ์ สภาพพร้อมใช้งานและอื่น ๆ ที่จำเป็นสำหรับผู้ใช้ที่จะสามารถพึ่งพามันได้ ตามมุมมองนี้ ผลิตภัณฑ์ข้อมูลคือ “Architectural Quantum หรือควอนตัมคอมพิวเตอร์เชิงสถาปัตยกรรม” ผลิตภัณฑ์นี้เป็นหน่วยสถาปัตยกรรมที่เล็กที่สุดที่สามารถทำงานด้วยกันได้ดีด้วยตัวมันเอง ด้วยเหตุผลนี้แต่ละผลิตภัณฑ์จึงมีรหัส ข้อมูล Metadata และโครงสร้างพื้นฐานรวมอยู่ด้วย เป้าหมายที่ครอบคลุมของแพลตฟอร์ม Data Mesh ซึ่งประกอบด้วยควอนตัมคอมพิวเตอร์เฉพาะโดเมนเหล่านี้คือการวิเคราะห์ตนเองแบบที่สามารถวัดได้ แต่ละแพลตฟอร์มจะมี 3 เพลน (Plane) ได้แก่ เพลนสำหรับการจัดสรรโครงสร้างพื้นฐาน เพลนสำหรับประสบการณ์ของผู้พัฒนา และเพลนสำหรับการดูแลงาน นอกจากนี้ Thoughtworks ยังมีวิสัยทัศน์ถึงระบบการกำกับดูแลแบบศูนย์รวมที่ซับซ้อนในการบริหารนโยบายต่าง ๆ ตลอดทั่วแพลตฟอร์ม แนวคิดเรื่อง Data Mesh ยังอยู่ในระยะเริ่มต้น วิสาหกิจผู้ทำความเข้าใจเรื่อง Data Mesh บอกว่า Data Mesh ไม่ใช่จุดหมายปลายทางแต่เป็นการเดินทางมากกว่า ความพยายามในช่วงแรกมักใช้ไปกับการค้นคว้า หาวิธีที่จะนำไปใช้ให้เกิดประโยชน์ที่สุด และจัดสรรทรัพยากรที่ Data Mesh จำเป็นต้องใช้ Tareq Abedrabbo (ทาเรค อะเบดรับโบ) หัวหน้าวิศวกรข้อมูลหลักของผู้ให้บริการแพลตฟอร์มแลกเปลี่ยน CMC Markets อธิบายในการสัมภาษณ์กับ InfoQ ถึงความท้าทายของการค้นหาข้อมูลที่ CMC ต้องเผชิญเมื่อใช้ Data Mesh ตัวอย่างเช่น ตามหลักการแล้วข้อมูลต้องกระจายออกจากศูนย์กลาง แต่วิธีการอย่างเช่น SQL กลับจำเป็นต้องมีการรวมข้อมูลสู่ศูนย์กลาง Knowledge Graph ศัพท์คำว่า Knowledge Graph เริ่มได้รับความนิยมตั้งแต่เมื่อ Google บัญญัติขึ้นมาในปี 2012 ตลอดทศวรรษที่ผ่านมา มากกว่า 90 เปอร์เซ็นต์ของบริษัททางเทคโนโลยียักษ์ใหญ่ของโลกได้สร้างและใช้ Knowledge Graph ตั้งแต่ผู้นำในวงการเภสัช รัฐบาล บริการการเงิน การผลิต และร้านค้าออนไลน์ต่างก็ใช้ Knowledge Graph การใช้ Knowledge Graph ที่พบบ่อยและโดนเด่นที่สุดคือการใช้วิวัฒนาการของเทคโนโลยี Semantic Web Stack (การซ้อนกันของเว็บความหมาย) ซึ่งถูกพัฒนาและปรับปรุงมามากกว่าสองทศวรรษ แรงบันดาลใจดั้งเดิมของ Tim Berners-Lee สำหรับ Semantic Web คือให้เป็น “Web of Data (เครือข่ายข้อมูล)” โดยมีเนื้อหา, การนิยามความหมาย (ontologies) และข้อมูลเชิงสัมพันธ์รวมไว้อยู่ใน Entity เดียวกัน + ความสัมพันธ์หรือลักษณะที่มีภาคประธาน ภาคแสดง ภาคกรรมพ่วงมา  นอกจากนี้ยังมีการวางกรอบความคิดอื่น...
30 July 2022

บทความ

6 แนวทางยอดนิยมของการใช้งาน Data Fabrics
วันนี้เราจะมาพูดถึงสถาปัตยกรรม การจัดการ Data Fabric ที่เป็นเสมือนกล่องวิเศษช่วยเพิ่มประสิทธิภาพการเข้าถึงข้อมูลที่กระจัดกระจาย อีกทั้งยังช่วยดูแลจัดระเบียบข้อมูลได้อย่างชาญฉลาดไปด้วยในตัว และบทความนี้จะพูดถึงเรื่อง 6 แนวทางยอดนิยมของการใช้งาน Data Fabrics ที่จะมาช่วยเพิ่มประสิทธิภาพให้กับองค์กรของคุณได้ โดยปกติแล้วทุก ๆ องค์กรจะมีข้อมูลกระจายตามหน่วยงานที่เกี่ยวข้อง ซึ่งแต่ละหน่วยงานมีหน้าที่ละความรับผิดชอบในการจัดการข้อมูลของตัวเอง การจัดสรรข้อมูลลักษณะนี้เรียกว่าการจัดการข้อมูลแบบไซโล หรือ Data Silo โดย Silos ในที่นี้คือ ปัญหาที่มีข้อมูลบางอย่างที่ถูกเก็บอยู่แต่ในเฉพาะกลุ่ม คนในองค์กรส่วนอื่น ๆ ไม่เคยได้รับการแชร์หรือได้ใช้ประโยชน์เลย หรือพูดอีกนัยหนึ่งคือมีข้อเสียตรงที่การบูรณาการข้อมูลระหว่างกันจะเป็นไปได้ยาก ซึ่ง Data Fabrics จะมาช่วยสร้างระบบที่ให้ข้อมูลพวกนี้มาเรียงร้อยถักทอกันออกมาเป็นข้อมูลที่เป็นระบบระเบียบ จึงเป็นที่มาของคำ ๆ นี้นั่นเอง ดังนั้น Data Fabrics จึงเปรียบได้กับโครงสร้างที่ช่วยจัดการข้อมูลแบบรวมศูนย์ ที่อนุญาตให้องค์กรเข้าถึงข้อมูลของตนจากที่ไหนก็ได้ภายในสภาพแวดล้อม Hybrid Cloud  “การใช้เทคโนโลยีและบริการเหล่านี้ มันเพิ่มคุณค่าให้กับข้อมูลและให้ประโยชน์มากขึ้นสำหรับผู้ใช้” David Proctor, Senior Database Manager จาก Everconnect บริษัทที่ทำธุรกิจให้บริการระบบจัดการฐานข้อมูลระยะไกล อ่านเพิ่มเติมเรื่อง Data Fabric เป็นหนึ่งใน 12 เทรนด์เชิงกลยุทธ์ในปี 2022 Data Fabric กำลังเป็นที่นิยมมากขึ้นเรื่อย ๆ เมื่อองค์กรหันมาใช้วิธีการจัดเก็บแบบดิจิทัล เพราะเมื่อบริษัทเติบโตขึ้น ทำให้การจัดเก็บข้อมูลอาจซับซ้อนมากขึ้น เพราะข้อมูลถูกจัดเก็บไว้ในตำแหน่งต่าง ๆ ที่บางทีหลาย ๆ ส่วนงานอาจไม่สามารถเข้าถึงได้ Proctor จึงตั้งข้อสังเกตว่า “Data Fabric ได้สร้างมาตรฐานใหม่ของการเก็บข้อมูลและทำให้ทุกคนเข้าถึงข้อมูลได้โดยไม่ว่าพวกเขาจะอยู่ที่ไหนก็ตามบนโลก” Sean Knapp ผู้ก่อตั้งและ CEO ของ Ascend.io บริษัทที่ให้บริการระบบ Dataflow แบบอัตโนมัติกล่าวโดยสรุปว่า เทคโนโลยี Data Fabric เป็นเหมือนกาวที่เชื่อมโยงระบบข้อมูลขององค์กรทั้งหมดเข้าด้วยกัน ให้ทุกส่วนของข้อมูลสอดคล้องกัน ซึ่งจะช่วยให้ Data Engineer สร้าง, ขยายสเกล, และพัฒนา Data Pipeline อย่างต่อเนื่องที่อยู่บน Apache Spark โดยไม่ต้องเขียนโค้ดมาก “Data Fabric ช่วยองค์กรให้รักษาระบบข้อมูลที่ซับซ้อนและแตกต่างกันได้ และยังช่วยให้ผู้ใช้งานเข้าถึงข้อมูลที่ต้องการได้อย่างรวดเร็วด้วยตนเอง ไม่ว่าพวกเขาจะอยู่ที่ใดหรือก่อนหน้านี้ระบบเคยถูกจัดเก็บไว้อย่างไรก็ตาม” Sean Knapp กล่าว การนำ Data Fabrics มาใช้สามารถช่วยองค์กรของคุณได้อย่างไร นี่คือ 6 แนวทางยอดนิยมของการใช้งาน Data Fabric: 1.นวัตกรรมองค์กร “เทคโนโลยี Data Fabric ช่วยเปิดเส้นทางใหม่สู่การสร้างนวัตกรรมผู้ชนะจากไอเดีย AI, ML ใหม่ ๆ ได้ง่ายขึ้น โดยเฉพาะด้านการเร่งความเร็ววงจรการวิเคราะห์ข้อมูล (Data and Analytics Lifecycle) ” Knapp กล่าว “มันหมดคำถามแล้วว่า มันจะดีแค่ไหนถ้าองค์กรสามารถใช้สถาปัตยกรรม Data Fabric รวมแหล่งข้อมูลทั้งระบบ Cloud เครื่องมือคำนวณ โดเมนต่าง ๆ มาใช้ร่วมกัน แต่ต้องถามว่าจะเริ่มทำเมื่อไหร่เท่านั้นเอง” 2. ป้องกันและบำรุงรักษาระบบ เทคโนโลยี Data Fabric สามารถใช้ทำการวิเคราะห์หาจุดอ่อนเพื่อป้องกันการล่มของระบบได้ ซึ่งจะช่วยลดช่วงเวลา Downtime เนื่องจากมันสามารถเข้าถึงข้อมูลเชิงลึกจากจุดข้อมูลต่าง ๆ และคาดการณ์ล่วงหน้าถึงรอบการบำรุงรักษา เรียกว่าเป็นการ “กันก่อนแก้” นอกจากนี้ Jared Stern ซีอีโอของ Uplift Legal Funding ยังกล่าวอีกว่า ” Data Fabric จะช่วยวางแผนในการเตรียมเครื่องมือ อะไหล่ ทรัพยากรบุคคล และสำรองสิ่งที่จำเป็นได้อย่างเป็นระบบระเบียบ” 3.กำจัดปัญหา Silos (ไซโล) บอกลากับปัญหา Data Silo ไปได้เลย Dan DeMers ซีอีโอและผู้ร่วมก่อตั้ง Cinchy กล่าวว่า “วิธีการถักทอร้อยเรียงฐานข้อมูลต่าง ๆ ของ Data Fabric ทำให้มันได้ชื่อว่าเป็นเทคโนโลยีแรกที่สามารถทำลาย เรื่อง Data Silo ได้อย่างแท้จริง” “เราทุกคนรู้ถึงข้อเสียของการเก็บข้อมูลแบบไซโล” DeMers กล่าว “ถึงแม้จะมีข้อดี แต่ Data Silo ขัดขวางประสิทธิภาพการทำงาน รวมถึงยังไม่มีวิธีการทำงานรูปแบบอื่นที่แทนที่ได้ เนื่องจากไม่มีทางเลี่ยงฐานข้อมูลที่ผูกติดกับแอปพลิเคชัน” แต่ต้องเข้าใจว่าจริง ๆ แล้วองค์กรต้องทำงานด้วยข้อมูล ไม่ใช่แอปพลิเคชัน “นั่นเป็นเหตุผลที่การบูรณาการแบบจุดต่อจุดยังคงเป็นปัญหาใหญ่ในสถาปัตยกรรมข้อมูล ยิ่งเราคิดจะทำลาย Data Silo โดยไปหาที่รวมให้มัน กลับนำไปสู่ปัญหา Data Silo ที่ใหญ่ขึ้น ตรงกันข้ามเรากลับไม่ทำอะไรเลยเพื่อแก้ไขสาเหตุของปัญหาจริง ๆ  ซึ่งอยู่ที่เราโฟกัสกันเองว่าฐานข้อมูลต้องขึ้นอยู่กับแอปเป็นหลัก” เขาอธิบาย ”Data Fabric จะแยกข้อมูลออกจากแอปพลิเคชัน นี่แหละคือสิ่งที่ทำให้ หลักการที่ว่าเน้นข้อมูลเป็นศูนย์กลางเกิดขึ้นได้จริง เราจะได้จบวังวนในการซื้อโปรแกรม / สร้างโปรแกรม / และเอามาเชื่อมต่อกับระบบที่มีอยู่ได้ซักที” 4.  ได้ข้อมูลเชิงลึกของลูกค้า Data Fabrics ช่วยบอกองค์กรให้เห็นถึงวิธีที่ลูกค้าใช้บริการ โดย Proctor กล่าวว่า “ด้วยวิธีนี้ พวกเขาสามารถรวบรวมชุดข้อมูลที่เกี่ยวข้องกับลูกค้าที่แตกต่างกัน วิเคราะห์ และใช้เพื่อสร้างกลยุทธ์ที่ปรับปรุงประสบการณ์โดยรวมของลูกค้า” นอกจากนี้ Szymon Klarman หัวหน้าสถาปนิกด้านการจัดการความรู้ในองค์กรของ BlackSwan Technologies อธิบายการใช้ Data Fabric เพื่อให้ได้มุมมองหรือข้อมูลที่แท้จริงของลูกค้า “องค์กรสามารถใช้ Data Fabric เพื่ออ้างอิงข้อมูลระหว่างกันและใช้ในการสรุปผลได้ ทำให้เห็นมุมมองตามความเป็นจริงและความสัมพันธ์ต่าง ๆ ระหว่างเครือข่ายของหน่วยธุรกิจที่เกี่ยวข้องกับหน่วยงาน และช่วยปรับรูปแบบความสัมพันธ์ของหน่วยงานที่มีให้กับหน่วยธุรกิจนั้น ๆ “มุมมอง ‘ลูกค้า 360' นี้ครอบคลุมความต้องการของแผนกต่าง ๆ ตั้งแต่การปฏิบัติตามนโยบายการตลาด / การจัดกลุ่มลูกค้า และความเสี่ยง / การจัดการกับความเสี่ยง” 5. ให้การช่วยเหลือการทำตามกฎระเบียบข้อบังคับของข้อมูล ข้อกำหนดสำหรับความเป็นส่วนตัวและความปลอดภัยของข้อมูลมีความสำคัญมากขึ้นเรื่อย ๆ และได้กลายเป็นความเสี่ยงสุดสำคัญขององค์กรที่ต้องหาวิธีลดความเสี่ยงให้ได้ โดย John Wills, CTO ภาคสนามของ Alation บริษัทที่นำเสนอเทคโนโลยี Machine Learning ที่ช่วยให้ผู้ใช้ค้นหา เข้าใจและเชื่อถือข้อมูลในข้อมูล ได้กล่าวว่า “เรื่องการลดความเสี่ยงในองค์กร ที่จริงแล้วมันขึ้นอยู่กับว่า องค์กรจัดการความเสี่ยงเรื่องการกำกับดูแลข้อมูล Data Governance ได้ดีแค่ไหน”...
18 March 2022
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.