Incident Evidence Uptime + Eyeball Proof
Incident Evidence е комбинирана услуга, която свързва Uptime Monitoring с Eyeball Monitoring. Когато сайтът даде DOWN или влезе в нестабилно състояние, системата автоматично активира Eyeball и прави скрийншотове за доказателство – за да се вижда какво реално е видял потребителят по време на инцидента.
Какво получаваш
- Incident log (start/end + duration)
- Скрийншотове по време на инцидента
- „Recovery proof“ screenshot след възстановяване
- Multi-confirm (по избор) за по-малко фалшиви аларми
- Идеално за SLA, спорове с хостинг, QA и DevOps
Защо това е важно
Uptime не е достатъчно
Сайт може да връща HTTP 200, но да показва „Maintenance“, CAPTCHA, празна страница или грешен редирект. Uptime само по себе си може да пропусне тези случаи.
Реално потребителско преживяване
Eyeball показва какво вижда потребителят, а не само какъв е HTTP статуса. Това дава сигурност при инциденти.
Доказателство и отчетност
Скрийншотовете и timeline-ът са доказателство за хостинг/доставчик, за вътрешни екипи и за SLA отчетност.
Как работи Incident Evidence
1) Uptime checks
Системата прави проверки на URL по интервал и следи статус, latency, timeouts и TLS проблеми.
2) Incident trigger
При поредица от fail проверки се отваря инцидент. По избор: multi-confirm от втори регион/нод.
3) Eyeball доказателство
Автоматично се пускат 2–3 Eyeball проверки със screenshots, които документират как изглежда проблемът.
4) Timeline
Системата записва старт/край, duration, статуси, и прикачва доказателството като част от инцидента.
5) Recovery proof
При възстановяване се прави финален screenshot, който доказва, че сайтът е отново достъпен и работи.
6) Аларми
При инцидент изпращаме известия и даваме директен линк към инцидента + доказателствата.
Trigger Rules (Автоматично задействане)
За да има качествени доказателства и минимални false positives, Incident Evidence използва правила за задействане. Те са конфигурируеми според SLA и чувствителност.
| Условие | Действие |
|---|---|
| DOWN (1 check) | По избор: игнорира се като временен glitch или се маркира “suspect” |
| DOWN ≥ 2 последователни | Отваря инцидент и задейства Eyeball → първи доказателствен скрийншот |
| DOWN от ≥ 2 региона/ISP | Потвърден инцидент → серия от скрийншотове + “confirmed” статус |
| HTTP 500 / blank page | Eyeball прави capture за визуална диагностика (дори да има HTTP отговор) |
| Recovery (UP) | Финален “recovery proof” скрийншот → end time + duration |
Препоръчителни настройки
За да избегнем false positives и да имаме качествени доказателства:
- Interval: 5 мин (бизнес стандарт)
- Trigger: 2–3 последователни fail проверки
- Confirm (по избор): втори нод/регион
- Evidence shots: 2–3 screenshots в рамките на 1–2 мин
- Recovery shot: 1 screenshot след възстановяване
Идеално за
- eCommerce (checkout / плащания)
- SaaS системи (login / dashboard)
- Медии и новинарски сайтове
- Финтех / корпоративни приложения
- SLA и отчетност към клиенти
Примерен incident flow
Какво ще видиш в системата при реален проблем:
- Uptime check отчита 502/timeout → следва повторна проверка
- Инцидентът се потвърждава → записва се start time
- Автоматично се активира Eyeball evidence (2–3 screenshots)
- Алармата съдържа линк към incident + доказателства
- При възстановяване се прави recovery screenshot → end time + duration
Quick win
Тази услуга често “спестява часове” дебъг и спорове, защото показва истината: какво е било на екрана, не само какъв е бил статуса.