ผู้เชี่ยวชาญระบุว่า ปรากฏการณ์เว็บไซต์หลายร้อยแห่งทั่วโลกล่มลงเมื่อวานนี้ (18 พ.ย.) อันเนื่องจากปัญหาขัดข้องในระบบของ Cloudflare ซึ่งเป็นบริษัทเทคโนโลยีที่ให้บริการด้านความปลอดภัย ความเร็ว และความเสถียรของเว็บไซต์บนอินเทอร์เน็ต ถือเป็นสัญญาณเตือนอันน่าวิตกอีกครั้งที่ว่า ระบบอินเทอร์เน็ตของโลกกำลังพึ่งพาผู้ให้บริการโครงสร้างพื้นฐานด้านอินเทอร์เน็ตเพียงไม่กี่ราย
การขัดข้องในระบบของ Cloudflare เมื่อวานนี้ ส่งผลให้แพลตฟอร์มสำคัญอย่าง X, ChatGPT, Spotify, Canva หรือแม้แต่ DownDetector ไม่สามารถใช้งานได้เป็นเวลาหลายชั่วโมง
นายเมห์ดี ดาอูดี ประธานเจ้าหน้าที่บริหารของ Catchpoint ซึ่งเป็นแพลตฟอร์มมอนิเตอร์ประสิทธิภาพอินเทอร์เน็ต กล่าวว่า 'นี่เป็นเพียงเหตุการณ์ล่าสุดในห่วงโซ่แห่งความล้มเหลวที่เพิ่มจำนวนมากขึ้นเรื่อย ๆ สิ่งเหล่านี้ควรเป็น "สัญญาณปลุก" ให้กับบริษัทต่าง ๆ ทั่วโลก'
'ภาคธุรกิจกำลังเอาไข่ทั้งหมดไว้ในตะกร้าเพียงใบเดียว แล้วก็ตกใจทุกครั้งเมื่อไข่แตก'
'บริษัทต้องทำให้ระบบของตัวเองมีความยืดหยุ่นและทนทานต่อความผิดพลาด'
'คุณจะบ่นทุกครั้งที่ Cloudflare จามหรือ? หรือคุณจะสร้างระบบให้ทนทานต่อเหตุการณ์แบบนี้?' นายดาอูดีกล่าว
เหตุการณ์ของ Cloudflare เกิดขึ้น หลังจากที่ Microsoft Azure และ Amazon Web Services (AWS) ประสบปัญหาคล้ายกันก่อนหน้านี้ ซึ่งทำให้เว็บไซต์ส่วนใหญ่ที่พึ่งพาแพลตฟอร์มเหล่านั้นต้องหยุดชะงักลง
Cloudflare เปิดเผยว่า ทราฟฟิกเว็บทั่วโลกราว 20% ไหลผ่านเครือข่ายของบริษัทในปีที่แล้ว นอกจากนี้ Cloudflare ยังให้บริการแก่บริษัทใน Fortune 500 ถึง 35% รวมถึงลูกค้าอื่น ๆ อีกหลายล้านราย
ประสิทธิภาพสูงและความปลอดภัยที่เชื่อถือได้ ทำให้ Cloudflare เป็นตัวเลือกยอดนิยม แต่เหตุการณ์ล่าสุดนี้ชี้ให้เห็นเว็บไซต์ต่าง ๆ กำลังพึ่งพาผู้ให้บริการโครงสร้างพื้นฐานอินเทอร์เน็ตเพียงไม่กี่ราย
หลัง AWS ประสบปัญหาในเดือนที่แล้วจนส่งผลให้แอปส่งข้อความ Signal ใช้งานไม่ได้ นางเมเรดิธ วิทเทเกอร์ ประธานของ Signal ระบุว่าบริษัทไม่มีทางเลือกอื่น นอกจากยังคงต้องใช้บริการจากบริษัทรายใหญ่เหล่านี้
'บริษัทเทคโนโลยีในปัจจุบันแทบทั้งหมดอยู่ในมือของบริษัทผู้ให้บริการเพียง 3 หรือ 4 แห่งเท่านั้น' นางวิทเทเกอร์กล่าว
แม้อาจเป็นไปไม่ได้ที่บริษัทต่าง ๆ จะหลีกเลี่ยงการพึ่งพาผู้ให้บริการเหล่านี้ แต่เหตุขัดข้องล่าสุดชี้ให้เห็นถึงความจำเป็นเร่งด่วนของการวางแผนสำรอง
'เหตุขัดข้องจะยังคงเกิดขึ้น และเกิดบ่อยขึ้น ขณะที่ผลกระทบก็จะเกิดในวงกว้างขึ้นด้วย คำถามคือ คุณเตรียมรับมืออย่างไร?' นายดาอูดีกล่าว
ในขณะที่ปัญหาของ AWS และ Azure ถูกระบุว่ามาจาก DNS หรือระบบที่แปลงชื่อโดเมนเป็น IP addresses แต่ Cloudflare ระบุว่า สาเหตุปัญหาที่เกิดขึ้นวานนี้มาจากไฟล์เพียงไฟล์เดียว
โฆษกของ Cloudflare ระบุว่า ปัญหาเกิดจากไฟล์ configuration ที่ระบบสร้างขึ้นโดยอัตโนมัติ เพื่อจัดการกับทราฟฟิกที่เป็นอันตราย
'ไฟล์นั้นมีขนาดใหญ่กว่าที่คาดไว้ และทำให้ระบบจัดการทราฟฟิกในบริการอื่น ๆ ของ Cloudflare ล่มลง' โฆษกระบุ
แม้อาจฟังดูไม่น่าเชื่อว่า ไฟล์เพียงไฟล์เดียวจะสร้างความปั่นป่วนอย่างหนักต่อโลกอินเทอร์เน็ต แต่ด้วยขนาดของ Cloudflare ทำให้เหตุการณ์นี้สามารถเกิดขึ้นได้
'ในระดับโครงสร้างพื้นฐานแบบนี้ เพียงแค่ความผิดปกติเล็กน้อย ก็สร้างผลกระทบมหาศาลได้' นายรอบ ลี หัวหน้าฝ่าย AI จาก SANS Institute กล่าว
'ระบบเหล่านี้ถูกออกแบบมาให้ทำงานอย่างรวดเร็ว ดังนั้นอะไรก็ตามที่ชะลอการตัดสินใจเพียงเล็กน้อย ก็สามารถก่อให้เกิดปฏิกริยาลูกโซ่ได้ ซึ่งในสภาพแวดล้อมที่มีประสิทธิภาพสูง แค่ความล่าช้าเพียงเศษเสี้ยววินาทีก็สร้างภาวะติดขัดแบบคอขวดอย่างหนักได้' นายลีกล่าว และเสริมว่า ไฟล์ configuration ที่ Cloudflare กล่าวถึง ทำหน้าที่กำหนดนโยบายของการจัดเส้นทาง การตัดสินใจสร้างความสมดุลในการโหลดข้อมูล และการกระจายทราฟฟิกในระดับโลก
'หากไฟล์ดังกล่าวขยายใหญ่ขึ้นอย่างกะทันหัน อาจทำให้การประมวลผลช้าลง เกิดข้อผิดพลาดในหน่วยความจำ เกิดการแย่งใช้งาน CPU หรือการทำงานผิดพลาดของระบบที่พึ่งพาไฟล์ดังกล่าว' นายลีกล่าว