SRE - Site Reliability Engineering
사이트 신뢰성 엔지니어링은 IT 운영에 대한 소프트웨어 엔지니어링 접근방식이다.
SRE는 확장 가능하고 신뢰성이 높은 소프트웨어 시스템을 생성할 때 유용한 방법이다. 코드를 통해 대규모 시스템을 관리할 수 있으므로 수천 대에서 수십만대에 이르는 머신을 관리하는 시스템 관리자에게 더 큰확장서과 지속가능성을 제공한다.
SLI - Service Level Indicators
서비스의 측정 가능한 특성을 의미한다.
A carefully defined quantitative measure of some aspect of the level of service that is provided.
Example:
- Request Latency - How long it takes to return a response to a request
- Failure Rate - A fraction of all rates received (unsuccessful requests/all requests)
- Batch Throughput - Proportion of time = data processing rate > than a threshold
SLO - Service Level Objectives
주어진 SLI로 성취하고 싶은 목표나 숫자 지표를 의미한다.
SLO specify a target level for the reliability of your service.
SRE에서는 100%의 reliability를 목표로 설정하는 것은 좋지않다고 본다. 100%를 유지하기 위해서는 많은 자원이 들어가고 기술적으로 어렵다. 하지만 유저들이 만족하는 범위까지 설정을 한다면 그 이상으로는 의미가 없다.
SLA - Service Level Agreements
만약 서비스가 특정 기대를 못 미쳤을 때 고객 보상을 제공해주는 구속력있는 계약을 의미한다. SLA에는 만약 서비스가 특정 가용성을 또는 퍼포먼스 기준을 유지하지 못했을 때 제공자에 가해지는 Penalty에 대해 적는다. 그리고 SLA가 깨지면 고객은 제공자로부터 보상을 받는다.
728x90
'DevOps > Google Cloud Platform' 카테고리의 다른 글
Traffic Splitting에 대해 알아보자 (0) | 2023.01.15 |
---|---|
Big Data Migration Flowchart (1) | 2023.01.12 |
Cloud DNS에 대해 알아보자 (0) | 2022.12.05 |
ETL, ELT, Data Warehouse, Data Lake에 대해 알아보자 (0) | 2022.11.30 |
Cloud VPN에 대해 알아보자 (0) | 2022.11.28 |