<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Observability on Practical SRE &amp; DevOps guides. Linux debugging. Lifestyle</title><link>https://andriipylypenko.cloud/tags/observability/</link><description>Recent content in Observability on Practical SRE &amp; DevOps guides. Linux debugging. Lifestyle</description><generator>Hugo</generator><language>en-us</language><lastBuildDate>Sat, 02 May 2026 00:00:00 +0300</lastBuildDate><atom:link href="https://andriipylypenko.cloud/tags/observability/index.xml" rel="self" type="application/rss+xml"/><item><title>Four Golden Signals</title><link>https://andriipylypenko.cloud/blog/four-golden-signals/</link><pubDate>Sat, 02 May 2026 00:00:00 +0300</pubDate><guid>https://andriipylypenko.cloud/blog/four-golden-signals/</guid><description>Це концепція з книги &amp;ldquo;Site Reliability Engineering&amp;rdquo; (Google SRE Book).
Основна ідея: замість того щоб моніторити все підряд (сотні метрик), фокусуйся лише на тому, що безпосередньо відображає досвід користувача.
1. Latency — час відповіді Час обробки запиту від отримання до відповіді.
Важливо розділяти успішні запити від помилкових — помилка за 1ms не означає що система швидка.
Треба трекати перцентилі, а не середнє — середнє приховує аномалії:
Перцентиль Що показує p50 Медіана — &amp;ldquo;типовий&amp;rdquo; користувач p95 95% запитів вкладаються в цей час p99 Найгірший досвід 1% користувачів 2.</description></item></channel></rss>