19 Temmuz 2024 tarihinde, global çapta Microsoft Azure kullanıcılarını etkileyen ciddi bir sorun yaşandı. Bu sorun, CrowdStrike güncellemesi ile ilişkiliydi ve dünya genelinde birçok şirketin bulut hizmetlerine erişimini etkiledi. Yaşanan sıkıntı bireysel kullanıcıları direkt olarak etkilememiş gibi görünse de uygulama ve hizmet bazlı yaşanan aksaklıklarda ciddi anlamda mağduriyetlere sebep olurken bu süreçte en önemli aksaklığı büyük çaplı kurumsal firmalar yaşadı. Bu analizde, etkilenen sektörler ve yaşadıkları sorunlar, yaşanan sıkıntının ana nedeni, olası bir siber saldırı ihtimali, bu tür olaylardan çıkarılması gereken dersler, gelecekte benzer sorunların önlenmesi için alınacak önlemler, yerli yazılım kullanımının önemi ve merkeziyetsiz sistemlerin alternatif çözümlerine değineceğiz.

Sorunun çıkış nedeni?

Sorunun ana çıkış noktası olarak Azure bulut sistemindeki bir yapılandırma değişikliğinden dolayı depolama ve bilgi işlem kaynakları arasında yaşanan kesintiye işaret edildi. Siber güvenlik alanında önde gelen bir şirket olan CrowdStrike, Microsoft Azure ile entegrasyon halinde çalışan birçok güvenlik çözümü sunuyor. Şirketin 19 Temmuz'da yayımladığı bir güncelleme, Azure altyapısında beklenmeyen sorunlara yol açtı. Windows sunucu bilgisayarlarını etkileyen bu sorundan Mac ve Linux sunucu bilgisayarları etkilenmedi. Sorunun temelinde, güncelleme sırasında ortaya çıkan bir uyumsuzluk veya hata bulunuyordu. Güncellemenin ardından bazı hizmetlerin durması veya yavaşlaması, kullanıcıların Azure platformuna erişimlerini kısıtladı.

Sektörel bazda yaşanan sıkıntılar

Özellikle hava yolları başta olmak üzere, finans, sağlık, e-ticaret, televizyon ve telekomünikasyon sektörleri bu kesintiden etkilendi. Birçok hava yolu şirketi, rezervasyon sistemleri, biletleme, müşteri hizmetleri ve uçuş takibi gibi kritik operasyonları için Azure altyapısını kullanıyor. Bu kesinti, rezervasyon ve biletleme sistemlerinin geçici olarak çökmesine neden oldu, bu da yolcuların bilet satın almasını ve değiştirmesini zorlaştırdı. Havalimanlarında check-in süreçleri aksadı ve uçuş bilgileri güncellenemedi, bu da uçuş gecikmelerine ve iptallere yol açtı. Müşteri hizmetleri sistemleri de etkilendiği için yolcular, uçuş durumları ve diğer hizmetlerle ilgili bilgi almakta zorlandı. Bu kesintiler, hava yolu şirketlerinin operasyonel verimliliğini azalttı ve yolcu memnuniyetsizliğine neden oldu, dolayısıyla hava yolu şirketlerinin marka itibarına zarar verdi.

Bankalar ve finansal kuruluşlar, bulut tabanlı hizmetlerde yaşanan aksaklıklar nedeniyle işlemlerinde gecikmeler yaşadı ve bazı hizmetleri geçici olarak durdurmak zorunda kaldı. Sağlık sektöründe hastane bilgi sistemleri ve hasta kayıtları erişilemez hale geldi, bu da hasta bakımında aksamalara neden oldu. E-ticaret platformları, sipariş işleme ve müşteri hizmetlerinde kesintiler yaşadı, bu da satışların düşmesine yol açtı. Televizyon altyapılarında yaşanan sıkıntılar, yayınlarda kesintiler ve yayın durmalarına varan olumsuz süreçlerin yaşanmasına neden oldu. Telekomünikasyon şirketleri, kullanıcılarına sundukları bulut tabanlı hizmetlerde aksaklıklar yaşadı, bu da müşteri memnuniyetsizliğine neden oldu.

Çözüm süreci

Microsoft, Microsoft 365 uygulama ve hizmetlerine erişimde aksaklık yaşandığını ancak sorunu hafifletici önlemler alınmaya devam edilirken hizmetlere erişimde iyileşme görüldüğünü bildirirken, CrowdStrike tarafından yapılan açıklamada da sorunun tanımlandığı, izole edildiği ve bir düzeltme ile sorunun giderilmesine ait çözümlerin uygulandığı belirtilmiştir.

İhmal nerede?

Bu tür teknik sorunlar, genellikle yazılım geliştirme ve dağıtım süreçlerinde yeterli testlerin yapılmamasından kaynaklanıyor. Güncelleme öncesi ve sonrası testlerin yeterince kapsamlı olmamasının bu tür büyük çaplı problemlere yol açabildiği gözlemlenmiştir. CrowdStrike ve Microsoft'un işbirliği yaptığı bir güvenlik güncellemesinin bu denli büyük bir kesintiye sebep olması, başta test süreçlerinin iyileştirilmesi gerektiğini gösteriyor.

Siber saldırı ihtimali

Global bazda yaşanan bu kadar kapsamlı etkileri olabilecek bir güncellemenin ardından böyle geniş çaplı bir kesinti yaşanması, akıllara siber saldırı ihtimalini de getiriyor. Ancak mevcut veriler ışığında, bu olayın bir siber saldırı sonucu değil, teknik bir hata sonucu gerçekleştiği değerlendiriliyor. Microsoft ve CrowdStrike, olayın ardından yaptıkları açıklamalarda, herhangi bir dış saldırı veya kötü niyetli bir müdahale tespit edilmediğini belirttiler. Ancak bu tür olaylar siber güvenlik açısından alarm zillerinin çalmasına neden olur ve şirketlerin güvenlik protokollerini gözden geçirmelerine vesile olabilir.

Çıkarılması gereken dersler

Bu süreçten çıkarılması gereken birçok önemli ders bulunuyor. Güncellemeler öncesi ve sonrası kapsamlı test süreçlerinin uygulanması, benzer sorunların önlenmesi açısından kritik öneme sahiptir. Uluslararası altyapı sağlayıcıların tüm bu süreçleri gözden geçirmesinin ve daha sıkı test protokolleri uygulamalarının önemi yeniden gözler önüne serilmiştir.

Gönüllü bir doktorun şahitliğinde Gazze'de sağlık hizmetlerinin çöküşü Gönüllü bir doktorun şahitliğinde Gazze'de sağlık hizmetlerinin çöküşü

Yaşanan sorun ne kadar büyük olursa olsun, etkilenen tüm paydaşlarla ve kullanıcılarla hızlı iletişim kurmanın ve şeffaf olmanın önemi bir kez daha ortaya çıkmıştır. Büyük kesintiler sırasında, kullanıcılarla etkili iletişim, olayın nedenleri ve çözüm süreçleri hakkında şeffaf bilgi paylaşımı, kullanıcı güvenini artıran ve panik havasını dağıtan en önemli unsurlardandır.

Geriye dönüş planları sayesinde, yapılan hatadan hızlıca geri dönülebilir olması zararı minimuma indirgeyecektir. Sistem güncellemeleri sırasında yaşanabilecek olası aksaklıklar için geri dönüş planlarının (rollback) hazırlanması, kesinti süresini minimize edecektir. Bulut hizmeti sağlayıcılarının, kesintilere karşı yedekleme ve felaket kurtarma planlarını sürekli güncellemesi ve test etmesi de bu tip sorunların hızlıca çözümünde son derece önemlidir.

Alınabilecek önlemler

Bu tür olayların tekrar yaşanmaması için yazılım entegrasyonu ve test süreçlerinin iyileştirilmesinde olası tüm senaryolar dikkate alınarak değerlendirilmelidir. Güncelleme süreçlerinde siber güvenlik önlemleri gözden geçirilmeli ve mümkün olduğunca bağımsız güvenlik denetimleri artırılmalıdır. Gelişmiş izleme sistemleri aracılığıyla sistemlerdeki anormallikleri hızlıca tespit edebilecek izleme sistemleri kurulmalı ve bu sistemlerin etkinliği düzenli olarak test edilmelidir. Olası kesintiler için kriz yönetim protokolleri oluşturulmalı ve bu protokoller periyodik olarak simülasyonlarla test edilmelidir.

Yerli yazılım kullanımının önemi

Bu olay, yerli yazılım kullanımının önemini bir kez daha gündeme getiriyor. Yerli yazılımlar, ulusal güvenliğin sağlanması ve dışa bağımlılığın azaltılması açısından kritik öneme sahiptir. Ayrıca, yerli yazılım şirketleri, yerel ihtiyaçlara daha hızlı ve etkili çözümler sunabilir. Türkiye gibi teknoloji alanında hızla büyüyen ülkelerde, yerli yazılım geliştirme süreçlerine daha fazla yatırım yapılmalı ve bu alandaki yetkinlik artırılmalıdır.

Yerli yazılımlar güvenlik amacıyla ulusal güvenlik standartlarına daha uygun şekilde geliştirilebilir ve dış tehditlere karşı daha korunaklı olabilir. Esneklik ve özelleştirme sayesinde yerli yazılım geliştiricileri, yerel kullanıcıların ihtiyaçlarına göre özelleştirilmiş çözümler sunabilir. Ekonomiye katkı boyutunda yerli yazılım şirketlerine yapılan yatırımlar, ekonomimize katkı sağlar ve yeni istihdam alanları oluşturur.

Merkeziyetsiz sistemlerin avantajları

Merkeziyetsiz yapılar, merkezi yapılarda yaşanan bu gibi global sorunlara karşı çeşitli avantajlar sunarak daha güvenli ve dayanıklı çözümler sağlayabilir ve verilerin ve işlemlerin tek bir noktada toplanmasını engeller. Bu sayede, bir noktadaki kesinti veya saldırı tüm sistemi etkileyemez. Veriler ve hizmetler, dünya genelinde dağıtılmış düğümler aracılığıyla sağlanır, bu da genel sistem güvenilirliğini artırır.

Merkezi sistemler, tek bir hata noktasına sahip oldukları için siber saldırılara karşı daha savunmasızdır. Merkeziyetsiz yapılar ise verilerin şifrelenmesi ve doğrulanması için blockchain gibi güvenli protokoller kullanarak saldırılara karşı daha dirençli hale gelir. Her bir düğüm, sistemin güvenliğini ve bütünlüğünü korur. Merkeziyetsiz yapılar sayesinde herhangi bir düğümde yaşanan bir arıza veya kesinti sistemin tamamını etkilemez. Bu sayede hizmetler kesintisiz olarak devam edebilir ve kullanıcılar aksaklık yaşamaz. Örneğin, bir düğüm çalışmaz hale gelse bile diğer düğümler hizmet vermeye devam eder.

Merkeziyetsiz yapılar, merkezi sistemlere göre daha kolay ölçeklenebilir. Yeni düğümler ekleyerek sistemin kapasitesi artırılabilir ve bu da talep artışlarına hızlıca yanıt verilmesini sağlar. Bu sayede bu yapılar yüksek trafiğe sahip dönemlerde daha iyi performans gösterebilir. Blockchain tabanlı merkeziyetsiz sistemler, işlemleri şeffaf bir şekilde kaydeder ve bu kayıtlar tüm ağ tarafından doğrulanır. Bu şeffaflık, güvenin artmasını sağlar ve herhangi bir manipülasyon girişimini zorlaştırır. Kullanıcılar, sistemdeki verilerin ve işlemlerin doğruluğundan emin olabilir. Merkeziyetsiz yapılar, yerel kontrol ve veri egemenliği sağlar. Veriler belirli bir coğrafi bölgeye bağlı kalmak zorunda kalmaz ve bu da yerel düzenlemelere ve veri koruma yasalarına daha kolay uyum sağlar. Kullanıcılar, verilerinin nerede saklandığını ve kimlerin erişebileceğini kontrol edebilir.

19 Temmuz 2024'te yaşanan Microsoft Azure ve CrowdStrike güncelleme sorunu, teknoloji dünyasında önemli dersler çıkarmamıza vesile olmuştur. Bu olay, yazılım geliştirme süreçlerinde daha dikkatli olunması gerektiğini ve siber güvenlik önlemlerinin artırılması gerektiğini göstermiştir. Ayrıca, yerli yazılım kullanımının önemi bir kez daha vurgulanmıştır. Gelecekte benzer sorunların yaşanmaması için alınacak önlemler, teknoloji dünyasında daha güvenli ve sürdürülebilir bir altyapı sağlanmasına katkı sağlayacaktır.

[Devrim Danyal, Blockchain & Yapay Zeka Akademi Kurucusu ve Gelecek Teknolojileri Eğitmeni]

*Makalelerdeki fikirler yazarına aittir ve Orta Doğu Haber'in editöryal politikasını yansıtmayabilir.