21 fev 2026 · Müəllif: Netspare komandası
7/24 texniki dəstək modelini dayanıqlı qurma yolları
7/24 mövcudluq yandırılmadan ağır cəza tələb edir: prioritet matriksi, əl dəyişmə qeydləri və infrastruktur günah oyunlarını azaldan alətlər.
Müştərilər status səhifəsində düzgün və ritmik yenilənmə olduqda tez bağışlayır.
Bu playbook hosting/SaaS üçün: təsnifat, kommunikasiya, kök səbəb ardıcıllığı.
Pager yorğunluğu səssiz imtina yaradır: yanlış müsbətlərdən sonra mühəndislər bildirişləri söndürür. SLO xəta büdcəsi ilə siqnal həddini tənzimləyin və həftəlik səs-küy iclası keçirin.
Yuxarı axın şəbəkələri üçün vendor SLA-ları müştəriyönümlü SLA ilə uyğunlaşmalıdır, yoxsa idarə olunmayan quyruq riski daşıyırsınız.
Prioritet matriksi
P1 tam dayanma və ya məlumat itkisi riski; P2 əsas pisləşmə; P3 tək kirayəçi; P4 sual. Hər səviyyə üçün iki cümlə nümunə.
P1 N dəqiqədə həll olunmazsa avto eskalasiya.
Növbə və yorğunluq limiti
Follow-the-sun yalnız real saat qurşağı örtüyü varsa. Əsas/ikinci, həftə dəyişimi. Ardıcıl gecə limiti və kompensasiya.
Əl dəyişmə: aktiv insident, flaky alert, dəyişiklik dondurma.
Alətlər və runbook
- Siqnal sahibi olmayan poçt siyahısına getməsin.
- Runbook alertdən linklənsin.
- Dashboard: gecikmə, trafik, xəta, doyma.
- İnsidentdən sonra avtomatik ticket + zaman xətti.
Müştəri SLA
P1/P2 üçün ilk ictimai yenilənmə X dəqiqə. Sadə dil; qismən təsir varkən “hər şey yaxşı” deməyin.
Həftəlik post-mortem
Sistemlər: monitor çatışmazlığı, yavaş rollback. Aksiyaları bağlayın; 90 gündə təkrarlanırsa yenidən açın.
Siqnal səs-küy büdcəsi
Siqnalları simptom vs səbəbə ayırın; yalnız runbook-u olan müştəri təsirləri simptomlarında zəng edin.
MTTA və MTTR-i ayrı izləyin — tez təsdiq düzəliş olmadan etimada zərər verir.
Yuxarı asılılıq SLA-ları
Daşıyıcı və bulud provayderi texniki xidmət pəncərələrini ümumi təqvimdə yazın; üst-üstə düşmə tək iplik cavab riski yaradırsa on-call avtomatik dəyişin.
Vendor eskalasiyası əvvəlcədən səlahiyyətli texniki əlaqə tələb edir — ümumi satış xətti yox.
Tez-tez verilən suallar
Ne qədər on-call?
Həftədə mühəndis başına neçə səhifə sağlamdır?
Netspare komandası
Bu müəllifin digər yazılarıBəyənə bilərsiniz
- Strukturlaşdırılmış loglar, JSON Lines və saxlama: grep-dən mərkəzləşmiş axtarışa
Struktursuz log panelləri və siqnalları sındırır. Sorğu ID, səviyyə, PII redaksiya və saxlama xərci.
- SLA, SLO, SLI və xəta büdcəsi: mühəndis komandaları üçün izah
Müqavilə (SLA) daxili hədəf (SLO) deyil. SLI ölçülə bilən olmalıdır; xəta büdcəsi prioritetləri müəyyən edir.
- DNS yayılması və TTL: sayt sahiblərinin bilməli olduğu praktik məqamlar
DNS qeydlərini paneldə dəyişmək ani görünür, amma resolver-lər TTL qədər cavabı keşləyir. Keçidi necə planlamaq olar.
- Video, backup və böyük fayllar üçün obyekt saxlama və ya yerli VPS diski
Yerli SSD verilənlər bazası üçün sürətlidir; S3 tipli obyekt saxlama isə miqyas və dayanıqlılığı başqa cür hesablayır.