ไมโครซอฟท์รายงานถึงปัญหาใน log collector ภายใน แต่ระหว่างการแก้ไขเกิดปัญหาต่อเนื่องจนกระทบกับการเก็บล็อกของลูกค้าในบางบริการ ปัญหาที่กระทบผู้ใช้มากสักหน่อยคือ Microsoft Entra ที่เป็นบริการล็อกอินของไมโครซอฟท์ทำให้ล็อกบางส่วนหายไป ผลกระทบต่อเนื่องไปจนถึงบริการ Microsoft Sentinel ที่อาจจะแจ้งเตือนไม่ครบ
ช่วงเวลาที่ล็อกไม่ครบนี้เกิดในช่วงวันที่ 5 กันยายนจนถึง 3 ตุลาคมที่ผ่านมา หลังจากนั้นก็แก้ปัญหาได้ทั้งหมด
ต้นเหตุของปัญหานี้เกิดจากบั๊กของตัวมอนิเตอร์ log collector อีกทีหนึ่งกระทบจน log collector ส่งต่อข้อมูลไม่ได้ ทีมงานพยายามแก้ปัญหาแต่ก็ไปกระตุ้นบั๊ก dead lock จนอัพโหลดค่า telemetry ไม่ได้แม้ว่ากระบวนการส่งล็อกยังทำงานดีอยู่ ทีมงานพยายามแก้ปัญหาชั่วคราวด้วยการ restart แต่ก็ทำให้ล็อกหายไปเป็นช่วงๆ
บั๊กต้นเหตุถูกแก้ไขเรียบร้อยแล้ว และไมโครซอฟท์สัญญาว่าจะปรับปรุงระบบทดสอบให้เหมือนจริงขึ้น ป้องกันเกิดบั๊กแบบนี้ซ้ำอีก
ที่มา - M365 Admin