SLI, SLO, and SLA in SRE에 대해 알아보자

DevOps/Google Cloud Platform

SLI, SLO, and SLA in SRE에 대해 알아보자

숄구-ml 2022. 12. 16. 18:19

SRE - Site Reliability Engineering

사이트 신뢰성 엔지니어링은 IT 운영에 대한 소프트웨어 엔지니어링 접근방식이다.

SRE는 확장 가능하고 신뢰성이 높은 소프트웨어 시스템을 생성할 때 유용한 방법이다. 코드를 통해 대규모 시스템을 관리할 수 있으므로 수천 대에서 수십만대에 이르는 머신을 관리하는 시스템 관리자에게 더 큰확장서과 지속가능성을 제공한다.

SLI - Service Level Indicators

서비스의 측정 가능한 특성을 의미한다.

A carefully defined quantitative measure of some aspect of the level of service that is provided.

Example:

Request Latency - How long it takes to return a response to a request
Failure Rate - A fraction of all rates received (unsuccessful requests/all requests)
Batch Throughput - Proportion of time = data processing rate > than a threshold

SLO - Service Level Objectives

주어진 SLI로 성취하고 싶은 목표나 숫자 지표를 의미한다.

SLO specify a target level for the reliability of your service.

SRE에서는 100%의 reliability를 목표로 설정하는 것은 좋지않다고 본다. 100%를 유지하기 위해서는 많은 자원이 들어가고 기술적으로 어렵다. 하지만 유저들이 만족하는 범위까지 설정을 한다면 그 이상으로는 의미가 없다.

SLA - Service Level Agreements

만약 서비스가 특정 기대를 못 미쳤을 때 고객 보상을 제공해주는 구속력있는 계약을 의미한다. SLA에는 만약 서비스가 특정 가용성을 또는 퍼포먼스 기준을 유지하지 못했을 때 제공자에 가해지는 Penalty에 대해 적는다. 그리고 SLA가 깨지면 고객은 제공자로부터 보상을 받는다.

728x90

'DevOps > Google Cloud Platform' 카테고리의 다른 글

Traffic Splitting에 대해 알아보자 (0)	2023.01.15
Big Data Migration Flowchart (1)	2023.01.12
Cloud DNS에 대해 알아보자 (0)	2022.12.05
ETL, ELT, Data Warehouse, Data Lake에 대해 알아보자 (0)	2022.11.30
Cloud VPN에 대해 알아보자 (0)	2022.11.28

현재글SLI, SLO, and SLA in SRE에 대해 알아보자

머신러닝 숄구