programming in R

programming in R

ข่าวและบทความที่เกี่ยวข้อง

Related news and articles

PostType Filter En

บทความ

ภาษา R สำหรับงาน Data Science เบื้องต้น ครบจบในบทความเดียว
อยากอัพสกิล Data Science แต่เลือกไม่ถูกว่าจะเริ่มเรียน R หรือ Python ดี ภาษาไหนเหมาะกับอะไร และ R ใช้งานง่ายจริงมั้ย มาอ่านได้ในบทความนี้เลยครับ What is R ? R คือ Statistical Programming language พัฒนาต่อยอดมาจากภาษา S โดยนักสถิติชื่อ Ross Ihaka และ Robert Gentleman ที่ประเทศนิวซีแลนด์ในช่วงปี 1990s โดยเป้าหมายแรกของทั้งสองคนคือการสร้างโปรแกรม หรือเครื่องมือสำหรับสอนวิชาสถิติให้กับนักศึกษา และถูกใช้อย่างแพร่หลายในกลุ่มนักสถิติ Data Miners และนักวิชาการทั่วโลก R version 1.0 เปิดให้ดาวน์โหลดใช้งานวันที่ 29 ก.พ. 2543 อัพเดทตอนเดือน เม.ย. 2565 ที่ผ่านมา R เดินทางมาถึงเวอร์ชัน 4.2.0 แล้ว มีฟีเจอร์ใหม่ ๆ เพิ่มขึ้นอย่างต่อเนื่อง อ้างอิงจาก Tiobe Index (พ.ค. 2565) R ได้รับความนิยมอยู่ในอันดับที่ 13 ของภาษาคอมพิวเตอร์ทั่วโลก ส่วนตัวผู้เขียนเองคิดว่าเราจะเอา R มาเทียบกับภาษาอื่น ๆ ยากหน่อย เพราะ Scope ของ R จะโฟกัสที่การวิเคราะห์ข้อมูลเป็นหลักแตกต่างจากภาษาคอมพิวเตอร์อื่น ๆ จากผลสำรวจหลาย ๆ ที่ เราจะเห็น Python, R, SQL ติดสามอันดับแรกของสายงาน Data อยู่เสมอ ๆ โดย Python เป็น General Purpose Language ที่สามารถใช้ทำงานได้หลายประเภท ตั้งแต่ Web Development, Software, API ไปจนถึงงาน Machine Learning & Deep Learning ส่วน R จะเน้นหลัก ๆ ที่งานสถิติ และการวิเคราะห์ข้อมูล Getting Started เราสามารถเริ่มเขียน R ได้ง่าย ๆ สองวิธี สำหรับเพื่อน ๆ ที่สนใจแบบที่หนึ่ง รันใน Local Computer ของเรา สามารถดาวน์โหลด R และ RStudio Desktop IDE มาใช้งานได้ฟรี  ในตัวอย่างบทความนี้ เราจะสอนเขียน R บน RStudio Cloud โดยเราสามารถสมัครใช้งานฟรี 25 ชั่วโมงต่อเดือน ผ่าน Web Browser แนะนำเป็น Google Chrome, Microsoft Edge, Safari Great Books to Learn R สำหรับหนังสือที่ R Programmers นิยมอ่านกัน มีดังต่อไปนี้ เล่มที่ได้รับความนิยมสูงที่สุดคือ R for Data Science เขียนโดย Hadley Wickham ผู้บุกเบิก Modern R ในช่วง 10 ปีที่ผ่านมา อ่านหนังสือ อ่านบทความนี้ และเปิด RStudio Cloud มาเขียนโปรแกรมพร้อม ๆ กันเลยนะครับ Hello World เปิด Web Browser ไปที่ Rstudio Cloud สมัครบัญชีฟรี เมื่อเข้าไปที่หน้า Dashboard แล้วให้เรากดปุ่ม New Project ทางด้านขวาบนของหน้าจอ แล้วเลือก Option New RStudio Project ไปที่หน้าต่าง Console และพิมพ์คำสั่งนี้ กด Enter หนึ่งครั้ง R (เหมือนกับ Python) เป็นภาษาแบบ Interpreted Language => REPL => Real, Evaluate, Print, Loop สามารถเขียนคำสั่ง กดรัน และเห็นผลลัพธ์ได้ทันที เบื้องต้นเราสามารถใช้ R เป็นเครื่องคิดเลขได้เลย ถ้าเราต้องการ Clear หน้าจอ Console ให้กด Shortcut CTRL+L บนคีย์บอร์ด Comment เวลาเขียนโปรแกรมเราสามารถใส่ Comment ให้กับโค้ดไลน์นั้น ๆ ของเราได้ด้วย เพื่ออธิบายการทำงานของโปรแกรมเบื้องต้น ใน R เราใช้ # และตามด้วย Comment ที่ต้องการ Data Types ประเภทข้อมูลพื้นฐานใน R ที่เราใช้กันบ่อย ๆ จะมี Numeric, Character และ Logical ตามลำดับ สำหรับงานสถิติจะมีตัวแปรประเภท Factor เพิ่มขึ้นมาด้วย i.e. ตัวแปรกล่มสามารถแบ่งได้เป็น Nominal และ Ordinal ฟังก์ชันใน Code Block นี้ใช้ตรวจสอบประเภทข้อมูลของค่า หรือตัวแปรที่เราสร้างขึ้นมา ทั้งสามบรรทัดด้านบนจะได้คำตอบเป็น TRUE ทั้งหมดเลย ถ้าต้องการเปลี่ยน Data Type ใน R เราจะใช้ฟังก์ชันที่ขึ้นต้นด้วย as._() เช่น as.numeric(“100”) หรือ as.character(5525) เป็นต้น Operators R มี operators ที่เราใช้เหมือนในภาษาอื่นๆ ไว้เทียบค่าสองฝั่งของสมการ โดย == คือเท่ากัน และ !=...
25 May 2022

บทความ

การคำนวนผลที่ได้จากนโยบายด้วย Causal Impact Analysis
ไม่ว่าจะเป็นองค์กรของรัฐบาลหรือบริษัทเอกชน ผู้ที่มีอำนาจตัดสินใจย่อมต้องการวัดผลที่ได้รับจากนโยบายหรือโครงการที่ได้นำมาใช้เพื่อประเมินว่าผลที่ได้รับนั้นคุ้มค่ากับค่าใช้จ่ายในการดำเนินนโยบายหรือไม่ โดยวันนี้เราจะมาทำความรู้จักกับการทำ Causal Impact Analysis ตัวอย่างในวันนี้เราจะทำการวิเคราะห์ผลกระทบต่อราคาหุ้นของเครือ Volkswagen หลักจากที่ถูกฟ้องร้องเรื่องละเมิดกฎหมายควบคุมมลพิษ เหตุการณ์ครั้งนี้เป็นที่รู้จักกันในชื่อว่า Volkswagen Emission Scandal โดยปกติแล้ว คำถามประเภทนี้เราจะนำข้อมูลจากกลุ่มตัวอย่างที่ไม่ได้รับผลกระทบมาเปรียบเทียบ แต่ในกรณีนี้นั้นเป็นไปไม่ได้ ดังนั้นเราจะใช้ข้อมูลที่มีก่อนเกิดเหตุการณ์เพื่อมาใช้ทำนายค่าชี้วัดหลังจากเกิดเหตุการณ์ และนำผลมาเปรียบเทียบ Causal Impact Analysis: Simple Model เราจะใช้ R programming เพื่อทำการวิเคราะห์ในบทความนี้ เราจะเริ่มโดยการ plot ข้อมูลราคาปิดตลาดต่อหุ้นของ Volkswagen เพื่อพิจารณา ก่อนอื่นเราจะโหลด packages ที่จำเป็นแล้วก็เริ่มทำการ plot (หากยังไม่เคยติดตั้ง packages เหล่านี้ ให้ใช้คำสั่งที่ถูก commented ไว้นะครับ) จะเห็นได้ว่า หลังจากเส้นประที่ขีดไว้ ราคาปิดตลาดต่อหุ้นนั้นลดลงอย่างรวดเร็วมาก เราต้องการประเมินว่าผลกระทบนี้เป็นเท่าไหร่  เบื้องต้นเราอาจจะใช้วิธีการ Time Series แบบมาตรฐานเพื่อนำมาใช้ประเมิน จะได้ผลการวิเคราะห์ดังนี้ จะเห็นได้ว่าการประเมินในรูปแบบนี้ไม่สามารถใช้ได้ในระยะยาว เนื่องจากค่าความไม่แน่นอนจะสูงขึ้นอย่างรวดเร็ว ซึ่งค่อนข้างสมเหตุสมผล เนื่องจากว่าข้อมูลราคาในอดีตอาจจะบอกข้อมูลได้ไม่สมบูรณ์ ดังนั้นเราจะเลือกนำ Time Series ชุดอื่นที่มีพฤติกรรมคล้าย ๆ กัน และไม่ได้รับผลกระทบจากเหตุการณ์นี้ ในกรณีนี้เราจะนำเอาราคาปิดตลาดของผู้ผลิตรถยนต์รายอื่น เช่น BMW และ Allianz มาพิจารณาเปรียบเทียบกัน จะพบว่าแนวโน้มของทั้งสามราคามีค่าใกล้เคียงกัน แต่ว่า BMW และ Allianz ไม่ได้รับผลกระทบกับคดีความครั้งนี้ เราจึงมีแนวคิดที่ว่าจะใช้ Time Series ของราคา BMW และ Allianz เพื่อมาทำนายราคาในกรณีที่การฟ้องร้องครั้งนี้ไม่เกิดขึ้น Bayesian Structural Time Series Bayesian Structural Analysis จะนำเอาการ Regression มารวมกันกับเทคนิคทาง Time Series โดยจะสรุปได้ในโดยสมการ เราจะใช้ Package ใน software R และหลักการทาง Bayesian Inference เพื่อประมาณค่าของ  และค่าความคลาดเคลื่อนที่เป็นไปได้ของการประมาณ โดยผลลัพธ์ที่ได้สามารถนำมาแสดงผลได้ดังแผนภาพข้างล่างนี้ โดยที่ตัวแปร series ในโค้ดข้างล่างนี้เป็นตัวแปรเดียวกันกับโค้ดที่ใช้สร้าง Figure 3 ข้างบน  จะเห็นได้ว่า confidence interval นั้นไม่ได้กว้างขึ้นในระยะยาว ทำให้การทำนายระยะยาวพอมีความเป็นไปได้มากขึ้น นอกจากนี้เรายังสามารถดู Summary Statistics เพื่อประเมินความมั่นใจของค่าประมาณของเราได้ References
29 June 2021
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings