เทรนด์หนึ่งที่เข้ามามีบทบาทสำคัญอย่างมากในโลกปัจจุบันที่เป็นโลกของระบบเครือข่าย อินเทอร์เน็ตและการเชื่อมต่อและเป็นโลกที่ทุกคนสามารถผลิตข้อมูลกันเองได้อย่างหลากหลายและสังคมล้วนถูกขับเคลื่อนด้วยข้อมูลที่มีปริมาณมหาศาล ทั้งบนโลกออนไลน์และออฟไลน์นั้น ในส่วน ของชุดซีรีส์ “9 เทรนด์” นี้คงหนีไม่พ้นกาพูดถึงเทรนด์ในเรื่องของ “Big Data” หรือที่ราชบัณฑิตยสภาได้แปลเป็นไทยว่า “ข้อมูลมหัต” ซึ่งได้มีการให้คำจำกัดความ หมายถึง เซตข้อมูลขนาดใหญ่ที่มีความซับซ้อนมาก ประกอบด้วยลักษณะอย่างน้อย 3 ประการ คือ
1. มีปริมาตร (volume) มาก
2. มีการเปลี่ยนแปลงอยู่ตลอดเวลาอย่าง ต่อเนื่อง (velocity)
3. มีความหลากหลายในโครงสร้างข้อมูล (variety) นอกจากนี้ อาจมีองค์ประกอบอื่นเพิ่มเติม เช่น มีความแปรผันสูงและมีความซับซ้อนมาก เนื่องจากอยู่ในรูปแบบต่าง ๆ ทั้งที่มีโครงสร้างที่แน่นอน เช่น เมทริกซ์ข้อมูลหรือไม่มีโครงสร้าง เช่น ข้อความ อีเมล วีดีทัศน์ หรือรวบรวมมาจากหลายแหล่ง
ดังนั้นเพื่อให้เกิดความเข้าใจในลักษณะของข้อมูลที่เรา เรียกว่า Big data มากขึ้นนั้น ผู้เขียนจะขออธิบายเพิ่มเติม ดังนี้ Big Data นั้นหมายถึง ข้อมูลขนาดใหญ่ ซึ่งโดยนิยามมีความหมายที่พิจารณาจากลักษณะของข้อมูลใน 4 ลักษณะที่เรียกว่า 4V คือ
1. Volume หมายถึง ขนาดของข้อมูลที่จะต้องมีการเพิ่มขนาดอย่างต่อเนื่อง หรือหมายถึงปริมาณที่สามารถขยายตัวเองได้ตลอดเวลา เช่น ข้อมูลจากอุปกรณ์เซ็นเซอร์ไอโอทีที่มีการเก็บรายละเอียดได้ในหลักวินาที ซึ่งส่งผลให้ในแต่ละวันมีข้อมูลไหลเข้าออกจากระบบเป็นจำนวนมาก มีขนาดของข้อมูลที่ไม่หยุดนิ่งอยู่กับที่
2. Velocity หรือ ลักษณะของข้อมูลที่มีการส่งผ่านและนำไปใช้ประโยชน์ได้อย่างรวดเร็ว ดังนั้นในการทำแบบสอบถามเพียงครั้งเดียว ไม่เรียกว่าเป็น Big Data เพราะถือว่าข้อมูลไม่มีการเติบโต เช่นเดียวกับการดึงข้อมูลและนำไปวิเคราะห์ใน Excel เพื่อรอนำเสนอต่อ ถือว่าไม่เป็น Big Data เพราะการนำเสนอข้อมูลเข้าโปรแกรมและวิเคราะห์อาจต้องใช้เวลาในการทำงาน เพราะโปรแกรม Excel สามารถรองรับข้อมูลได้เพียง 1,048,576 rows และ 16,384 columns เท่านั้น
3. Variety หมายถึง ลักษณะของข้อมูลที่มีความหลากหลายไม่ว่าจะเป็นในด้านของแหล่งที่มาของข้อมูลซึ่งมีโครงสร้างและไม่มี โครงสร้างของข้อมูล (structured data and unstructured data) ซึ่งหมายความว่า ข้อมูลที่จะเป็น Big Data ไม่จำเป็นที่จะต้องเป็นข้อมูลที่มาจากอินเทอร์เน็ตหรือเป็นเพียงข้อมูลตัวเลขเสมอไป
4. Veracity เป็นข้อมูลที่มีความไม่ชัดเจน ซึ่งเป็นผลมาจากขนาดที่มีจำนวนมากความเร็วและความหลากหลายของข้อมูล
ดังนั้นการจะใช้ข้อมูลจึงควรมีการตรวจสอบความถูกต้องเพื่อให้ได้ข้อมูลที่มีคุณภาพมากพอ ยิ่งไปกว่านั้นจากการที่ Big Data นั้น หมายถึง ข้อมูลจำนวนมากที่ถูกสร้างขึ้นมาแล้วกระจายหรือเก็บอยู่ทุกหนทุกแห่งทั่วไป ซึ่งข้อมูลบางอย่างอาจจะเป็นสิ่งที่ประชาชนทั่วไปเข้าไม่ถึงหรือบางอย่างก็สามารถเข้าไปใช้ได้ โดยทั่วไปมีการจำแนกแหล่งที่มาของข้อมูลได้ออกเป็น 4 แหล่ง คือ
1. ข้อมูลที่เกิดจากคนสู่คน ที่มีการสื่อสารกับโลกดิจิทัลผ่านสมาร์ทโฟน ในรูปแบบต่าง ๆ เช่น การส่งอีเมลหรือส่งข้อความ การโพสภาพถ่ายถึงกันหรือแม้แต่การทำข่าวให้เราได้ดูจากทั่วทุก มุมโลก ซึ่งไม่ใช่เพียงแค่ตัวอักษร รูปภาพ แต่อาจเป็นวิดีโอเคลื่อนไหวเกิดเป็นกิจกรรมการไลฟ์สด (Live chat) ณ สถานที่จริงเวลาจริงที่เกิดขึ้น ซึ่งข้อมูลเหล่านั้นที่เราทำการโพสหรือแชร์ไปนั้นไม่ได้ถูกลบ แต่มันจะถูกนำไปเก็บไว้ที่ไหนสักแห่งหนึ่งที่เราไม่รู้ขึ้นอยู่กับแพลตฟอร์มที่เราเลือกใช้ในการแชร์ แลกเปลี่ยน หรือส่งออกไป
2. ข้อมูลที่เกิดจากคนสู่อุปกรณ์ ในปัจจุบันจะพบว่านอกจากผู้คนจะเชื่อมโยงข้อมูลถึงกันเองแล้วเรายังมีการสื่อสารกับอุปกรณ์ดิจิทัลด้วย ทั้งในรูปแบบ Machine device หรือเซ็นเซอร์ ตัวอย่างง่าย ๆ เช่น Siri ใน iPhone หรือ Cortana ใน Microsoft หรือ Google Now ของมือถือ Samsung Android เพื่อใช้ในการสืบค้นข้อมูลจาก Google ซึ่งเป็นลักษณะของข้อมูลที่เกิดจากคนสู่อุปกรณ์ในกลุ่มที่เป็นเหมือน Machine ซึ่งจะช่วยให้ Machine เหล่านั้นเกิดการเรียนรู้หรือถ้าเป็นตัวอย่างของ device ก็เช่น Apple watch หรือ fitbit ซึ่งเป็นอุปกรณ์ในกลุ่ม smart watch ที่เราจะส่งข้อมูลอัตราการเต้นของหัวใจ จำนวนก้าวการเดิน รูปแบบ วิธีการออกกำลังกายของเรา ซึ่งเมื่ออุปกรณ์ต่าง ๆ เหล่านั้นได้ทำการเชื่อมต่อกับ อินเทอร์เน็ต ผู้ผลิตก็จะดึงข้อมูลจากอุปกรณ์นาฬิกา fitbit หรือ Apple watch ไปเก็บเพื่อที่จะเอาข้อมูลเหล่านั้นมาวิเคราะห์พฤติกรรมและสร้างเป็นโอกาสทางการตลาดต่อไปได้
3. ข้อมูลที่เกิดจากอุปกรณ์สู่อุปกรณ์ (M2M) ข้อมูลในส่วนนี้ส่วนใหญ่จะเกิดจากเทคโนโลยีตัวจับเซ็นเซอร์ที่ทำหน้าที่ในการวัดค่าบางอย่างจากจุดที่ติดตั้งอยู่แล้ว ส่งตำแหน่งและข้อมูลจำเพาะออกไปหาตัวรับ ตัวอย่างเช่น การติด Easy Pass ไว้ ที่หน้ารถเพื่อให้ส่งสัญญาณเพื่อจ่ายค่าผ่านทางในเวลาที่เราขับผ่านทางด่วนหรือ แม้กระทั่งการติดเซ็นเซอร์ไว้ในกล้องในลิฟท์หรือที่ประตูรถไฟฟ้าเพื่อใช้ตรวจจับ การเคลื่อนไหวของคนที่ผ่านเข้าออกประตูเพื่อให้แน่ใจว่าไม่มีใครแล้วประตูจะทำการปิดอย่างปลอดภัย
4. ข้อมูลที่เป็นแบบ internet of things ความแตกต่างของ IoT เป็นระบบที่นำความสามารถของ M2M ออกมาขยายความให้ได้รับประโยชน์จากข้อมูลที่ M2M ผลิตนั้นแทนที่จะใช้แค่สื่อสารระหว่างกันเองเท่านั้น แต่เราจะมีการนำข้อมูลเหล่านั้นมาเชื่อมต่อเข้าสู่ระบบเครือข่ายอินเทอร์เน็ตเพื่อให้ผู้ใช้สามารถเรียกดูข้อมูลต่าง ๆ จากสมาร์ทโฟนหรืออุปกรณ์อื่น ๆ ได้ทันที ตัวอย่างเช่น เซ็นเซอร์ในระบบรถยนต์ถ้าความดันลมยางมีค่าต่ำกว่ามาตรฐานตัวเซ็นเซอร์นั้นก็จะส่งข้อมูลไปที่ตัวประมวลผลกลางของระบบเครื่องยนต์และส่งผลต่อให้รถสตาร์ทไม่ติดซึ่งลักษณะดังกล่าวแบบนี้จะเป็นเหมือนข้อมูลที่อุปกรณ์มีการสื่อสารระหว่างกันเอง เราเรียกว่าเป็นอุปกรณ์ หรือ M2M แต่ในกรณีของข้อมูลที่เป็นแบบ IoT นั้นจะมีลักษณะที่ว่าถ้าความดันลมยางเริ่มมีค่าต่ำตัวเซ็นเซอร์ก็จะมีการประมวลข้อมูลและส่งข้อมูลมาเตือนอยู่ในสมาร์ทโฟนเพื่อให้ผู้ใช้ได้เข้าไปตรวจสภาพในตัวรถซึ่งลักษณะแบบนี้จะ เรียกว่าเป็นข้อมูลแบบ internet of things
จากรายละเอียดข้างต้นจะเห็นได้ว่า สิ่งที่อยู่รอบตัวเราสามารถที่จะเป็นแหล่งที่มาของ ข้อมูล Big Data ได้ทั้งหมด ไม่ว่าจะเป็น smart watch มือถือ Application ต่าง ๆ แต่อย่างไรก็ตามเมื่อพูดถึงคำว่า “Big Data” นั้น เราจะพบว่าข้อมูลขนาดใหญ่ที่เราเรียกว่า Big Data นั้นจะไม่มีคุณค่าเลยถ้าเราไม่มีการนำข้อมูลนั้นมาวิเคราะห์เพื่อทำการดึงข้อมูลเชิงลึก (insight) เพื่อนำไปใช้ให้เกิดประโยชน์ต่อไป ทั้งนี้ ดร.รัชพร วงศาโรจน์ ได้ทำการกล่าวถึงแนวโน้มของการประยุกต์ใช้ Big Data ไว้ใน 4 แนวทางได้แก่
1. การคาดการณ์จากข้อมูลปัจจุบัน (Nowcasting) จากวิธีการเดิมเราใช้ข้อมูลในอดีตมาทำนายถึงสิ่งที่จะเกิดขึ้นในอนาคต (Forecasting) แต่การวิเคราะห์ข้อมูล แบบ Big Data จะเปลี่ยนเป็นการใช้ข้อมูลปัจจุบันหรือข้อมูลที่รวดเร็วแทนเพื่อทำให้สามารถคาดการณ์ได้รวดเร็วขึ้น
2. การคาดการณ์จากพฤติกรรมการค้นหา (Search Behavior) โดยการใช้ข้อมูลจากคำที่มีการค้นหาในอินเทอร์เน็ตในแต่ละช่วงเวลาเพื่อนำมาวิเคราะห์เพื่อให้สะท้อนถึงพฤติกรรมที่แท้จริงของผู้บริโภค เพื่อเพิ่มความได้เปรียบในการแข่งขันและเพิ่มประสิทธิภาพในการวางแผน
3. การคาดการณ์จากข้อมูลเชิงลึก (Information Insight) เกิดจากการใช้เทคโนโลยีการวิเคราะห์ข้อมูลขนาดใหญ่เพื่อหาความสัมพันธ์และความเชื่อมโยงของข้อมูลทำให้ทราบข้อมูลเชิงลึกของแต่ละภาคส่วนที่เกี่ยวข้องได้
4. การคาดการณ์จากการทุจริต (Fraud Detection / Prevention) เป็นการต่อยอดผลลัพธ์ที่ได้จากความสัมพันธ์ข้อมูลเชิงลึก โดยการสังเกตพฤติกรรมการเดินทางของข้อมูลทำให้ตรวจสอบความผิดปกติที่เกิดขึ้นและหาวิธีป้องกันได้ทันเวลา
สำหรับในส่วนของการศึกษาเรามีระบบฐานข้อมูลขนาดใหญ่อยู่แล้ว โลกเรามีฐานข้อมูลด้านการศึกษาที่ทางยูเนสโกเก็บข้อมูลจากทั่วโลกเพื่อพัฒนาการศึกษาหรือถ้าเอาในประเทศไทยก็มีฐานข้อมูล iSEE ซึ่งได้รับการพัฒนาและวิจัยโดย กสศ. จะเห็นได้ว่าข้อมูลที่เรามีทางด้านการศึกษาไม่ว่าจะเป็น ฐานข้อมูลนักเรียน ฐานข้อมูลสถานศึกษา ฐานข้อมูลบุคลากรทางการศึกษา สถานะครัวเรือน สภาพปัญหาต่าง ๆ ถ้าเรามีการเชื่อมโยงระบบฐานข้อมูลหรือมีการจัดการฐานข้อมูลและให้ความสำคัญกับการคิดวิเคราะห์อย่างเป็นระบบจะสามารถนำไปใช้ในการวางแผนในเชิงนโยบายเพื่อยกระดับการจัดการศึกษาของประเทศ ได้อย่างมีประสิทธิภาพมากขึ้น ตัวอย่าง เช่น ฐานข้อมูลอยู่ของโรงเรียนประชารัฐในโครงการ CONNEXT ED ซึ่งหน่วยงานภาคเอกชนได้ดำเนินการมาจัดเป็นฐานข้อมูลขนาดใหญ่ที่สามารถนำไป เป็นแนวทางในการวางแผนหรือกำหนดนโยบายเพื่อการพัฒนาและสนับสนุนให้ ยกระดับการจัดการศึกษาให้กับกลุ่มโรงเรียนประชารัฐได้อย่างมีประสิทธิภาพต่อไป นอกจากนี้ในส่วนของข้อมูลระดับห้องเรียนหรือระดับโรงเรียน มีระบบฐานข้อมูลเรียกว่า Q-info ซึ่งเป็นฐานข้อมูลที่ออกแบบมาเพื่อให้ครูผู้สอนเก็บข้อมูลต่าง ๆ ของนักเรียนผ่านแอปพลิเคชันในโทรศัพท์มือถือได้เกือบเรียลไทม์ซึ่งเป็นหนึ่งในนวัตกรรมทางเทคโนโลยีที่ออกแบบมาเพื่อช่วยในการพัฒนาคุณภาพทางการศึกษาและพัฒนาผู้เรียนในการลดความเหลื่อมล้ำทางการศึกษาของไทยเรา โดย Q-info จะจัดเก็บข้อมูลและประมวลผลเป็นสถิติว่าในแต่ละสัปดาห์ แต่ละเดือน แต่ละภาคการศึกษา แต่ละปีการศึกษานักเรียนแต่ละคนมีอัตราการเข้าเรียนมากน้อยเพียงใด มีการขาดเรียนในช่วงเวลาใด หรือคะแนนสอบมีแนวโน้มเป็นอย่างไร เป็นต้น เมื่อครูผู้สอนได้ทราบข้อมูลแบบทันท่วงทีก็จะสามารถวิเคราะห์พฤติกรรมและคุณภาพของผู้เรียน ทั้งในลักษณะของภาพรวมและรายบุคคลเพื่อนำมาปรับปรุงแก้ปัญหาและต่อยอดการศึกษาให้กับนักเรียนได้หลากหลายมิติและมีคุณภาพมากขึ้น
ซึ่งถือเป็นรูปแบบหนึ่งของการใช้ Big Data เพื่อเพิ่มคุณภาพการศึกษาและพัฒนาผู้เรียน กล่าวโดยสรุปสำหรับในส่วนของการเข้ามาของเทรนด์โลกของข้อมูลขนาดใหญ่ Big Data นั้นจะส่งผลกระทบต่อการจัดการศึกษาดังนี้
1. ฐานข้อมูลขนาดใหญ่สามารถนำไปเป็นแนวทางในการวางแผนหรือกำหนดนโยบายเพื่อการพัฒนาและสนับสนุนให้ยกระดับการจัดการศึกษาให้กับกลุ่มโรงเรียนได้อย่างมีประสิทธิภาพต่อไป
2. ระบบฐานข้อมูลเรียกว่า Q-info ซึ่งเป็นฐานข้อมูลที่ออกแบบมาเพื่อให้ ครูผู้สอนเก็บข้อมูลต่าง ๆ ของนักเรียนผ่านแอปพลิเคชันในโทรศัพท์มือถือได้เกือบเรียลไทม์ซึ่งเป็นหนึ่งในนวัตกรรมทางเทคโนโลยีที่ออกแบบมาเพื่อช่วยในการพัฒนาคุณภาพการศึกษาและพัฒนาผู้เรียนในการลดความเหลื่อมล้ำทางการศึกษาของไทยเรา
3. เมื่อครูผู้สอนได้ทราบข้อมูลปัญหาของผู้เรียนได้แบบทันท่วงทีก็จะสามารถวิเคราะห์พฤติกรรมและคุณภาพของผู้เรียน ทั้งในลักษณะของภาพรวมและรายบุคคลเพื่อนำมาปรับปรุงแก้ปัญหาและต่อยอดการศึกษาให้กับนักเรียนได้หลากหลายมิติและมีคุณภาพมากขึ้น เรื่องของ big data เป็นเรื่องที่เราต้องนำมาใช้ประโยชน์ เพราะเป็นการอยู่กับข้อมูลเป็นสิ่งที่กลมกลืนอยู่ในวิถีชีวิตที่ทันสมัยของคนในปัจจุบันนี้ไปแล้ว อย่างไรก็ตามตัวเทคโนโลยี Big Data มีทั้งข้อดีสิ่งที่คือการนำไปเพื่อใช้พัฒนาสิ่งใหม่ ๆ ที่ดีขึ้นแต่มันก็มีข้อเสียเช่นกัน ไม่ว่าจะเป็นเรื่องของ คุณสมบัติเมื่อมีจำนวนมากเกินไป
เนื่องจากข้อมูลสามารถเกิดขึ้นมาจากได้หลายแหล่งหลายทางที่ผสมปนเปกันก็ย่อมเชื่อถือได้ยาก ดังนั้นเราจึงไม่ควรพุ่งความสนใจไปที่จำนวนของข้อมูลเป็นหลัก เพราะ Big Data จะใช้ได้ดีหรือมีประสิทธิภาพก็ขึ้นอยู่กับความสามารถของผู้ที่จะใช้โดยการนำ Big Data มาบริหารจัดการและวิเคราะห์