Olay Sonrası Analiz: Logto kimlik doğrulama hizmeti kesintisi
12 Haziran 2025'te, Cloudflare'da meydana gelen bir kesinti nedeniyle istek yönlendirmesini etkileyen bir sorun sonucu `logto.app` üzerindeki Logto hizmetlerinde kısa süreli bir aksaklık yaşandı. Sorun hızla çözüldü, veri güvenliği veya temel hizmetler üzerinde herhangi bir olumsuz etkisi olmadı.
Olay özeti
12 Haziran 2025'te 18:07 ile 18:58 UTC arasında, logto.app
alan adı (özel alan adları dahil) üzerinden Logto hizmetlerine erişen kullanıcılar hatalarla karşılaştı. Kesintinin nedeni, yönlendirme katmanımızı etkileyen Cloudflare Workers KV sisteminde meydana gelen bir arıza oldu. Doğrudan DNS çözümlemesi kullanan ve Cloudflare Workers'a bağlı olmayan Logto Cloud hizmetleri ve Logto Console etkilenmedi. Hizmet yaklaşık bir saat içinde eski haline getirildi ve veri güvenliğinde bir risk oluşmadı.
Zaman Çizelgesi (UTC)
- 18:07:
logto.app
aracılığıyla yapılan isteklerde Logto kimlik doğrulama servis API'larında 500 hataları dönmeye başladı. - 18:24: İnceleme sonucunda Azure altyapısının sağlıklı olduğu doğrulandı ve sorunun yalnızca Cloudflare Workers ve KV ile sınırlı olduğu belirlendi.
- 18:48: Cloudflare, Workers ve KV'yi etkileyen bir olayı resmen kabul etti.
- 18:58: Önbellek mantığı kaldırılarak geçici bir çözüm uygulandı, hizmet yeniden sağlandı ancak performansta hafif bir düşüş yaşanabilir.
- 21:00: Cloudflare hizmetleri istikrara kavuştuktan sonra, önbellek mantığı zarif bir yedekle tekrar devreye alındı. Tam performans geri döndü ve servis benzer KV kesintilerine karşı artık daha dayanıklı.
Temel neden
Bu olayın nedeni, Cloudflare Workers KV'de yaşanan erişilemezlikti. Cloudflare Worker'ımız, her müşteri ya da alan adına uygun olan Logto bölgesine istekleri yönlendirerek veri yerleşikliği ve uyumu sağlar. Performansı artırmak için Worker, bu bölge eşleşmelerini KV ile önbelleğe alır. KV kullanılamaz hale geldiğinde, önbellek işlemleri başarısız oldu ve Worker, önbelleksiz bir davranışa geçmek yerine hata fırlattı; bu da hizmette aksamalara yol açtı.
Doğrudan DNS çözümlemesi ve Cloudflare Workers kullanmayan Logto Cloud hizmetleri ile Logto Console bu kesintiden etkilenmedi.
Çözüm ve iyileştirmeler
- Worker üzerinden önbellek bağımlılığı kaldırıldı, hizmet geri yüklendi.
- Cloudflare KV normale döndüğünde, önbellek mantığına zarif bir yedekleme eklendi; önbellek kullanılamıyorsa, hizmet doğrudan yönlendirme ile kesintisiz olarak devam edecek.
- Altyapının dayanıklılığını ve erişilebilirliğini daha da artırmaya yönelik sürekli çalışmalar sürmektedir.
Etki
logto.app
üzerinden Logto'ya erişmeye çalışan kullanıcılar yaklaşık 50 dakika boyunca hata aldı.- Hiçbir müşteri verisi kaybolmadı veya güvenliği tehlikeye girmedi.
- Logto Cloud hizmetleri ve Logto Console tamamen operasyonel kaldı.
Sonraki adımlar
- Kenar altyapımızda hata yönetimimizi gözden geçirip iyileştireceğiz.
- Tek bir arıza noktası oluşmaması için altyapımızda birden fazla sağlayıcı kullanımını araştıracağız.
Sabır ve desteğiniz için teşekkür ederiz.