บทความนี้ แปลและดัดแปลงมาจากบทความบน LinkedIn ที่เขียนโดย Peter Hafez ซึ่งเป็น Chief Data Scientist บริษัท RavenPack ผู้แปลไม่มีส่วนได้ส่วนเสียกับผู้เขียนและ RavenPack แต่อย่างใด ในงาน “Battle of the Quants” ปี 2017 ที่ New York นั้นผู้เขียน (Peter Hafez) ได้บรรยายเรื่อง “Exploiting Alternative Data in the Investment Process” ข้อเสนอแนะที่ได้รับจากงานนั้น ทำให้ผู้เขียนอยากที่จะแชร์ความเห็นเพิ่มเติมว่า มีอะไรบ้างที่จะช่วยให้ประสบความสำเร็จในการลงทุนแบบ quant ในยุคปัจจุบัน Quant ย่อมาจากคำว่า Quantitative Analysis หรือ Quantitative Analyst เป็นชื่อที่ใช้เรียกวิธีการลงทุนหรือกลุ่มนักลงทุน ที่ใช้การวิเคราะห์เชิงปริมาณ อาทิ การวิเคราะห์และค้นหารูปแบบการเคลื่อนไหวของตลาดที่ซ่อนอยู่ภายใต้ข้อมูลจำนวนมหาศาล เพื่อการลงทุน RavenPack (บริษัทที่ Peter Hafez ทำงานอยู่) เป็นหนึ่งในบริษัทที่คลุกคลีอยู่ในวงการการลงทุนแบบ quant มาเกือบ 15 ปี และได้ตระหนักเห็นในจุดเด่นของการลงทุนแบบ quant มาโดยตลอด รายงานของ TABB Group กล่าวว่ากองทุน hedge funds ที่เน้นการลงทุนแบบ quant (quantitative hedge funds) ในยุคปัจจุบันนี้นั้นโดยรวมแล้วมีปริมาณการเทรด (ซื้อ ขาย) หุ้นเป็นสัดส่วนที่สูงถึง 27% ของมูลค่าทั้งหมด ซึ่งสูงกว่านักลงทุนและกองทุนสถาบันการลงทุนประเภทอื่น ๆ เมื่อนำปัจจัยนี้มาผนวกร่วมกันกับการเติบโตของปริมาณข้อมูล digital อย่างมหาศาล และปริมาณเงินที่ไหลเข้ามาลงทุนในกองทุน quants ที่เพิ่มมากขึ้นเรื่อย ๆ ด้วยแล้วนั้น ยิ่งทำให้เห็นว่า วงการการลงทุนได้มีการเปลี่ยนแปลงไปแล้วอย่างมีนัยสำคัญ ส่งผลให้มีแรงกดดันต่อผู้ที่ยังใช้วิธีการลงทุนแบบเดิม ๆ (traditional quantitative investors) ให้ต้องปรับตัว ปรับเปลี่ยนวิธีการลงทุนกันขนานใหม่ให้ประสบความสำเร็จ ปริมาณข้อมูลกำลังเติบโตขึ้นอย่างรวดเร็วมหาศาล 90% ของข้อมูล digital ทั่วโลกทั้งหมดที่มีอยู่ ณ วันนี้เพิ่งถูกสร้างขึ้นใน 2 ปีที่ผ่านมานี้เอง จากรายงานของ IDC (International Data Corporation) กล่าวว่า 90% ของข้อมูล digital ทั่วโลกทั้งหมดที่มีอยู่ ณ วันนี้เพิ่งถูกสร้างขึ้นใน 2 ปีที่ผ่านมานี้เอง ซึ่งในข้อมูลเหล่านี้ 80% เป็นข้อมูลแบบไม่มีโครงสร้าง (unstructured content) จึงทำให้เกิดโอกาสอย่างมหาศาลสำหรับนักลงทุนในการหาสิ่งใหม่ ๆ มาสร้างผลตอบแทน (new alpha sources) ให้เหนือตลาดได้มากกว่าการลงทุนแบบที่ใช้กันในอดีตหลายปีที่ผ่านมา ที่ใช้เพียงปัจจัยเชิงพื้นฐานและข้อมูลตลาดแบบดั้งเดิม ซึ่งเริ่มมีประสิทธิภาพที่ลดลงเรื่อย ๆ แหล่งข้อมูลทางเลือกใหม่ ๆ นี้มีตั้งแต่ ข้อมูลธุรกรรมบัตรเครดิต ข้อมูลดาวเทียม ข้อมูลสาธารณะที่สร้างขึ้นจากกลุ่มคนจำนวนมาก ข้อมูลตำแหน่งการเดินทาง และ ข้อมูลอารมณ์ความรู้สึก (sentiment) ของผู้คนใน social media ฯลฯ ในสมัยก่อนนั้น กองทุนส่วนใหญ่ที่มีวิสัยทัศน์ มักจะทำให้ตัวเองได้เปรียบเหนือคู่แข่งในด้านข้อมูลด้วยวิธีการจ้างทีมตามล่าหาข้อมูลใหม่ ๆ ที่น่าสนใจรอบโลก เพื่อนำมาใช้ประกอบการตัดสินใจลงทุน อย่างไรก็ดี เมื่อวันเวลาผ่านไป ตลาดนี้เริ่มพัฒนาขึ้นมาจนถึงจุดอิ่มตัว มีงานวิจัยและบทความมากมายตีพิมพ์นำเสนอข้อมูลต่าง ๆ ที่ครอบคลุมรอบด้านมากขึ้น ผู้ลงทุนทุกคนเข้าถึงข้อมูลได้เหมือน ๆ กัน จึงทำให้เกมการลงทุนนั้นแทบไม่มีความได้เปรียบในด้านการเข้าถึงข้อมูลอีกต่อไป การซื้อข้อมูลที่ไม่เปิดเผยต่อสาธารณะนั้นจะทำให้เราอยู่เหนือชั้นนักลงทุนคนอื่นมั้ย ? ในปัจจุบันนี้ ความเหนือชั้นนั้นไม่สามารถเกิดขึ้นได้จากการที่เราเพียงแค่มีข้อมูลชุดใดชุดนึงที่คนอื่นไม่มีอีกต่อไปแล้ว แต่ความเหนือชั้นนั้นจะเกิดขึ้นจาก ความสามารถในการประมวลผลของข้อมูลต่าง ๆ ที่ทุกคนมีอยู่เหมือนกัน ได้อย่างมีประสิทธิภาพเหนือผู้อื่น ความคิดที่ว่า ถ้าคุณมีข้อมูลบางอย่างอยู่เพียงผู้เดียว แล้วจะทำให้คุณจะได้เปรียบคู่แข่งนั้น เป็นความคิดที่ตกยุคไปเสียแล้ว (เว้นเสียแต่ว่าคุณเป็นหนึ่งใน Alphabet Facebook Amazon Apple และ Microsoft) เพราะถึงแม้ว่าเราจะสามารถเข้าถึงชุดข้อมูลใดชุดหนึ่งที่ไม่เปิดเผยต่อสาธารณะได้ แต่ก็อาจจะยังมีข้อมูลสาธารณะอื่น ๆ อีกมากมายที่สามารถสกัดเอาความรู้ที่เหมือนกันออกมาได้อยู่ดี ยกตัวอย่างเช่น ทั้งข้อมูลการใช้บัตรเครดิต ข้อมูลการเคลื่อนที่และสถานที่ของผู้คนต่างก็สามารถนำมาใช้พยากรณ์รายได้ของบริษัทได้ เป็นต้น สุดท้ายแล้วข้อมูลต่าง ๆ ที่ใช้สำหรับการลงทุนส่วนใหญ่นั้น จะเน้นไปที่ชุดข้อมูลที่สามารถสกัดเอาปัจจัยเชิงพื้นฐานออกมาได้ ความเหนือชั้นนั้นจะเกิดขึ้นจาก ความสามารถในการประมวลผลของข้อมูลต่าง ๆ ที่ทุกคนมีอยู่เหมือนกัน ได้อย่างมีประสิทธิภาพเหนือผู้อื่น วิธีเอาชนะตลาด (alpha) นั้นได้เปลี่ยนไปแล้ว! ตามที่ได้กล่าวไปข้างต้น ชี้ให้เราเห็นได้ว่า big data และการปฏิวัติวงการ quant นั้นได้เปลี่ยนแปลงวิธีการเอาชนะตลาดไปอย่างมีนัยสำคัญ ดังที่แสดงให้เห็นถึงปริมาณข้อมูลและจำนวนชุดข้อมูลที่มีการเพิ่มขึ้นอย่างรวดเร็วในรูปข้างล่างนี้ เมื่อเทียบกับยุคปี 1950-1970s ที่ในขณะนั้นการลงทุนให้ชนะตลาด (alpha) สามารถอธิบายได้ด้วยปัจจัยแค่เพียงไม่กี่ปัจจัยที่มักไม่ค่อยเปลี่ยนแปลง แต่ในวันนี้กลับมีหลายร้อยหลายพันปัจจัยที่มีผลต่อการขับเคลื่อน alpha (ผลตอบแทนที่เหนือตลาด) และปัจจัยส่วนใหญ่ก็มักจะเกิดขึ้นแค่ในระยะสั้น ๆ เท่านั้น สิ่งเหล่านี้สร้างแรงกดดันให้แก่กองทุนต่าง ๆ อย่างมากมาย เพราะ มันทำให้พวกเขาต้องเปิดรับข้อมูลในปริมาณที่มากขึ้นเพื่อที่จะยังคงสามารถเติบโตต่อไปได้ หรืออย่างน้อยก็ขอเพียงแค่ยังรักษาผลตอบแทนให้เหมือนเดิมได้ก็ดีพอแล้ว แต่ที่กดดันยิ่งไปกว่านั้นก็คือ การที่ปัจจัยต่าง ๆ แต่ละปัจจัยมีผลต่อ alpha น้อยลง แต่มีจำนวนหลายปัจจัย หลายชุดข้อมูลมากขึ้น ทำให้กองทุนเหล่านี้ต้องหาวิธีสกัดเอาสัญญาณ alpha ออกมาให้ได้ด้วยต้นทุนในอัตรา (ราคาต่อหนึ่งชุดข้อมูล) ที่ถูกลง เพราะจะต้องใช้จำนวนชุดข้อมูลที่มากขึ้นเพื่อให้ได้ alpha ที่เท่าเดิม สงครามแก่งแย่งคนเก่งนั้นจะยังคงดำเนินต่อไป… การจะลงทุนให้ประสบความสำเร็จได้นั้น กลายเป็นเกมเชิงตัวเลขไปเสียแล้ว ถ้าจะพูดในภาษาที่คนทั่วไปใช้กันก็คือ เราจำเป็นที่จะต้องใช้พลังการคำนวณของคอมพิวเตอร์ที่สูงขึ้น พื้นที่เก็บข้อมูลที่ใหญ่ขึ้น และที่ขาดไม่ได้เลยก็คือ data scientists ที่มีฝีมือ แต่เราก็ยังไปไม่ถึงจุดที่ง่ายสุด ๆ ขั้นที่เพียงแค่โยนข้อมูลเข้า AI ปุ๊บก็จะได้สัญญาณ alpha ออกมาปั๊บ (ผู้เขียนเองก็ยังไม่คิดว่าเราจะไปถึงจุดนั้นในเร็ว ๆ นี้ครับ) จึงทำให้เกิดความท้าทายเพิ่มขึ้นมาอีกหนึ่งอย่าง คือ กองทุนต่าง ๆ จะต้องทำยังไงให้สามารถรวบรวม data scientists ได้เพียงพอที่จะสามารถสกัดเอา alpha ออกมาจากข้อมูลได้ ซึ่งแน่นอนว่ามันไม่ใช่แค่ในวงการการเงินเท่านั้นที่ต้องการจ้าง data scientists เป็นจำนวนมาก อุตสาหกรรมอื่น ๆ ก็อยากใช้ data scientists เช่นกัน ทำให้สงครามแก่งแย่งคนเก่งนั้นมีความดุเดือดจริง ๆ เราจำเป็นที่จะต้องใช้พลังการคำนวณของคอมพิวเตอร์ที่สูงขึ้น พื้นที่เก็บข้อมูลที่ใหญ่ขึ้น และที่ขาดไม่ได้เลยก็คือ data scientists ที่มีฝีมือ ในทุกวันนี้...