[Real MySQL] 4. 아키텍처 - MySQL 엔진 아키텍처

2024. 2. 26. 15:43CS/Database

MySQL 서버는 크게 MySQL 엔진과 스토리지 엔진으로 구분할 수 있다. (MySQL 서버 = MySQL 엔진 + 스토리지 엔진)

 

MySQL 엔진은 클라이언트로부터 오는 요청 처리를 담당하고(SQL 분석, 최적화 등), 스토리지 엔진은 실제 데이터를 디스크에 저장하거나 조회하는 부분을 말한다. 

  • MySQL 엔진
    • 커넥션 핸들러: 클라이언트와의 접속(커넥션), 그리고 쿼리 요청 처리를 담당한다.
    • SQL 인터페이스: DML, DDL, Procedure, View 등 SQL 인터페이스 제공을 담당한다.
    • SQL 파서: 클라이언트가 보낸 SQL에 문법 오류가 있나 확인하고, MySQL이 처리하기 좋은 토큰 단위로 나눠서 트리 형태로 파싱한다.
    • SQL 옵티마이저: 쿼리의 최적화된 실행을 담당한다.
    • 캐시와 버퍼: 성능 향상을 위한 보조 저장소이다.
  • 스토리지 엔진
    • 스토리지 엔진은 MySQL 엔진과 플러그인 형태로 연동과 분리가 가능하고, 핸들러 API를 통해 스토리지 엔진에 읽기 및 쓰기 요청이 가능하다. 
    • 실제 데이터를 디스크 스토리지에 저장하거나 디스크 스토리지로부터 데이터를 읽어오는 부분은 스토리지 엔진이 담당한다.
    • MySQL 서버에서 MySQL 엔진은 하나지만 스토리지 엔진은 여러 개를 동시에 사용할 수 있다.
  • 핸들러 API
    • MySQL 엔진의 쿼리 실행기에서 데이터를 쓰거나 읽어야 할 때 각 스토리지 엔진에 쓰기 또는 읽기를 요청하는데, 이러한 요청을 핸들러 요청이라 하고, 여기서 사용되는 API를 핸들러 API라고 한다. 

MySQL 스레딩 구조

MySQL 서버는 프로세스 기반이 아니라 스레드 기반으로 작동하며, 크게 포그라운드 스레드와 백그라운드 스레드로 구분할 수 있다.

 

  • 포그라운드 스레드(클라이언트 스레드)
    • 클라이언트가 MySQL 서버에 접속하면 MySQL 서버는 그 클라이언트의 요청을 처리해 줄 스레드를 생성해 클라이언트에게 할당한다. 이 스레드는 DBMS의 앞 단에서 사용자(클라이언트)와 통신하기 때문에 포그라운드 스레드라고 한다.
    • 최소한 MySQL 서버에 접속된 클라이언트의 수만큼 존재하며, 주로 각 클라이언트가 요청하는 쿼리 문장을 처리한다. 
    • 클라이언트가 작업을 마치고 커넥션을 종료하면 해당 커넥션을 담당하던 스레드는 다시 스레드 캐시로 되돌아간다. 그런데 이때 이미 스레드 캐시에 일정 개수 이상의 대기 중인 스레드가 있으면 스레드 캐시에 넣지 않고 스레드를 종료시켜 일정 개수의 스레드만 스레드 캐시에 존재하게 한다. 이때 스레드 캐시에 유지할 수 있는 최대 스레드 개수는 thread_cache_size 시스템 변수로 설정한다. 
      • * 스레드 캐시란?
        • 스레드 캐시는 MySQL 서버가 스레드를 관리하는 데 사용하는 메모리 구조이다. 클라이언트와 연결되면 스레드 캐시의 스레드가 재사용되고, 연결이 끊기면 스레드는 스레드 캐시로 반환된다. 따라서 새로운 클라이언트 연결이 발생할 때마다 스레드를 생성하는데 필요한 오버헤드를 줄일 수 있다. 
        • 스레드 캐시는 MySQL 서버 작동 중에 동적으로 할당되고 해제되는 메모리 구조이다. 즉, 상황에 따라 스레드가 많이 생성되거나 해제된다. 단, 최대 thread_cache_size 만큼만 생성될 수 있다.
        •  스레드 캐시는 MySQL 서버의 메인 메모리(RAM)에 존재한다. 
  • 백그라운드 스레드
    • InnoDB는 다음과 같이 여러 작업이 백그라운드로 처리된다.
      • 인서트 버퍼를 병합하는 스레드
      • 로그를 디스크로 기록하는 스레드
      • InnoDB 버퍼 풀의 데이터를 디스크에 기록하는 스레드
      • 데이터를 버퍼로 읽어 오는 스레드
      • 잠금이나 데드락을 모니터링하는 스레드

메모리 할당 및 사용 구조

MySQL에서 사용되는 메모리 공간은 크게 글로벌 메모리 영역과 로컬 메모리 영역으로 구분할 수 있다. 

  • 글로벌 메모리 영역
    • 글로벌 메모리 영역의 모든 메모리 공간은 MySQL 서버가 시작되면서 운영체제로부터 할당된다. 
    • 포그라운드(클라이언트) 스레드 수와 무관하게 하나의 메모리 공간만 할당된다. (필요에 따라 2개 이상의 메모리 공간을 할당받을 수도 있음)
    • 모든 스레드에 의해 공유된다. 
    • 대표적인 글로벌 메모리 영역은 다음과 같다.
      • 테이블 캐시
      • InnoDB 버퍼 풀
      • InnoDB 어댑티브 해시 인덱스
      • InnoDB 리두 로그 버퍼
  • 로컬 메모리 영역(= 세션 메모리 영역, 클라이언트 메모리 영역)
    • 클라이언트가 MySQL 서버에 접속하면 MySQL 서버에서는 클라이언트 커넥션으로부터 요청을 처리하기 위해 포그라운드 스레드를 하나씩 할당하게 되는데, 이 포그라운드 스레드가 사용하는 메모리 공간이다. 
    • 로컬 메모리는 각 포그라운드 스레드별로 독립적으로 할당되며 공유되지 않는다.
    • 로컬 메모리는 각 쿼리의 용도별로 필요할 때만 공간이 할당되고 필요하지 않은 경우에는 MySQL이 메모리 공간을 할당조차 하지 않을 수도 있다. 소트 버퍼나 조인 버퍼가 그 예이다. 
    • 그리고 커넥션이 열려 있는 동안 계속 할당된 상태로 남아 있는 공간(커넥션 버퍼, 결과 버퍼)도 있고, 그렇지 않고 쿼리를 실행하는 순간에만 할당했다가 다시 해제하는 공간(소트 버퍼, 조인 버퍼)도 있다.
  1.  

Reference

  • 위키북스, Real MySQL 8.0