[Docker] What is Docker?

포스팅 작성하다가 도중에 한 번 날려먹어서 멘탈이 약간 흔들렸다..두 번 공부하고 좋지..^^

📕 목차
1. What is Container?
2. 기본적인 Docker 사용법

1. What is Container

Docker는 Container라는 경령 단위로 애플리케이션을 실행하는 기능을 제공하는 플랫폼이다.

빌드 서버, 테스트 환경, 운영 환경까지 모든 환경이 Docker로 동작할 수 있다.

📌 Cloud Environment

애플리케이션의 클라우드 환경 이주는 서버, 스토리지, 네트워크, 전원을 모두 Microsoft나 Amazon, Google에 맡겨버릴 수 있다.

전 세계에 존재하는 글로벌 데이터 센터에 우리의 애플리케이션을 배포하여 무제한의 확장성을 누릴 수 있고, 새로운 환경에 애플리케이션을 배포할 수 있으며, 사용한 만큼만 비용을 지불하면 된다.

그런데 클라우드 환경으로 이주하려면 어떻게 해야 할까? 기존 클라우드는 두 가지 환경이 있었다.

"서비스로서의 인프라(IaaS)"와 "서비스로서의 플랫폼(PaaS)"

쉽게 말해서, 어디까지 자동화가 되어 있고, 어디서부터 클라우드를 사용할 때 직접 손봐야 하는지 정도의 차이에 가깝다.

IaaS(Infrastructure as a Service)
- 서버, 스토리지, 네트워크를 가상화 환경으로 만들어 필요에 따라 인프라 자원을 사용할 수 있게 제공
- 애플리케이션의 각 컴포넌트를 가상 머신에서 독립적으로 동작시켜, 클라우드에 종속되지 않는다.
- 이주 과정은 쉬우나, 가상 머신 성능을 완전히 활용하지 못하며 운영비 비쌈
- (예시)웹 서버나 애플리케이션 서버로 사용할 리눅스, 윈도우 서버를 호스팅 업체에서 임대하는 것
- AWS(Amazon Web Servce), EC2(Elastic Computing Cloud), S3(Simple Storage Service) 등
PaaS(Platform as a Service)
- 애플리케이션의 각 컴포넌트를 하나씩 클라우드의 managed service로 옮기는 까다로운 작업
- 애플리케이션이 특정 클라우드에 종속
- 운영비가 저렴하고 관리가 쉬움

✒️ SaaS(Software as a Service)

http://dctalk.com.bd/what-is-software-as-a-service-saas/

IaaS와 PaaS 위에 올라가는 소프트웨어 (On-demand Software)
중앙에서 호스팅되는 소프트웨어를 웹 브라우저 등 클라이언트로 이용하는 서비스
(예시)IaaS에서 서비스되는 가상 인스턴스에 웹서버와 WAS를 설치하고 DB 서버를 연동해 사이트를 구축한 결과
클라우드 환경에서 동작하는 모든 애플리케이션이 SaaS
ex. google docs

도커를 도입하면 위에서 언급한 단점을 모두 상쇄할 수 있다.

각 컴포넌트를 컨테이너로 이주한 다음 Kubernetes나 Amazon Elastic Container Service(Amazon ECS) 혹은 직접 구축한 Docker Cluster에서 분산 애플리케이션을 실행할 수 있다.

애플리케이션의 각 컴포넌트는 컨테이너에서 동작한다. 컴포넌트는 가상 머신처럼 독립적이지만 경량이면서 PaaS의 managed service만큼 효율적이다.
Docker로 운영되는 애플리케이션은 이식성이 뛰어나다. 애저 쿠버네티스 같은 managed service나 AWS, 데이터센터로 별도의 수정없이 이주할 수 있다.

컨테이너로 애플리케이션을 이주하는 과정에 어느 정도 비용이 들기는 한다.

코드를 수정할 필요는 없다. 컨테이너화된 애플리케이션은 어떤 환경에서든 기존과 동일한 기술 스택에서 동작한다.
기존 설치 절차를 Dockerfile로 재작성해야 한다.
배포 관련 사항을 Docker compose나 Kubernetes의 application manifast로 재작성해야 한다.

📌 Legacy Application 현대화

[MSA] 1. What is Microservice Architecture?

김동욱님의 "마이크로서비스 아키텍처 구축 가이드"를 기반으로 공부한 내용입니다. 📕 목차 1. Definition 2. Overview 3. 대표적인 사례와 특징 4. 점진적 변환 vs 빅뱅 변환 1. Definition 📌 기존 방식의

jaeseo0519.tistory.com

Monolithic Architecture도 컨테이너에서 동작할 수는 있지만, 기민성에 제약이 따른다.

Docker로 이주하는 과정은 Application의 낡은 설계를 탈바꿈하는 첫걸음이다.

💡 Microservice Architecture로 바꾸는 것은 단순히 거대해진 시스템을 분할하는 것이 목적은 아니다

컨테이너(도커)로 이주하는 과정은 다음과 같다.

Docerfile 스크립트와 Docker compose 문법을 따라 애플리케이션을 단일 컨테이너로 옮긴다.
애플리케이션을 기능별로 별도의 컨테이너에 배치한다.
외부에서 들어오는 모든 요청은 라우팅 컴포넌트로 전달되며, 적절한 애플리케이션으로 연결한다.
내부 컨테이너끼리는 가상 네트워크를 통해 외부에 노출되지 않고 통신할 수 있다.

📌 Microservice Architecture

https://medium.com/aspnetrun/microservices-architecture-on-net-3b4865eea03f

꼭 MSA여야 할 필요는 없다. 다만, 모놀리식 아키텍처가 개발될 수록 CI/CD를 적용하는 데 무리가 있기 때문에 자연스레 MSA로 대체될 뿐이다.

실제로 Docker를 제외하더라도 클라우드 인프라에는 분산 애플리케이션이든 모놀리식 설계든 아키텍처에 무관하게 이주할 수는 있다.

다만, Docker를 사용하면 훨씬 간편하게 이주하고, 컴포넌트를 분할하여 새로운 설계로 전환하는 것이 너무나도 용이하다.

MSA가 궁금하다면 해당 깃허브를 참조해보는 것이 좋다.

각 컴포넌트는 자신만의 데이터를 가지고 API를 통해 외부에 데이터를 제공한다.
프론트 엔드는 API 서비스를 이용하는 웹 애플리케이션 형태다.
여러 가지 프로그래밍 언어와 서로 다른 데이터베이스 기술을 함께 사용하고 있다.
모든 컴포넌트는 공통적으로 Dockerfile을 통해 패키징되며 도커 컴포즈 파일 형태로 전체 애플리케이션이 정의된다.

📌 Serverless (FaaS)

중요한 것은 일관성이다.

모든 프로젝트에서 같은 도구, 같은 프로세스, 동일한 런타임을 사용해야 한다. 도커는 이를 가능케 한다.

도커 클러스터를 구축하면 모든 제품의 빌드, 배포, 운영을 같은 도구와 같은 방법으로 수행할 수 있다.

어떠한 형태의 애플리케이션이라도 Docker cluster의 Container에서 실행할 수 있다.
운영 환경 클러스터를 Linux나 Windows, 혹은 두 운영체제를 섞어 구상할 수도 있다.
컨테이너화된 애플리케이션 관리를 위한 Kubernetes API를 사용할 수 있도록 클러스터 설정 가능
Docker는 클라우드와 데이터센터 어디든 원하는 곳에서 운영할 수 있다.

Serverless(FaaS; Function as a Service)는 Container와 많이 비교되는 기술이다.

둘 다 분산 시스템 및 대규모 애플리케이션 개발에 특화되어 있고, 관리상의 번거로움을 제거하고 애플리케이션 비지니스 가치에 집중한다.

하지만 서버리스와 컨테이너는 차이가 있다.

서버리스의 기본 전제는 애플리케이션(모든 비지니스 로직)이 기능과 이벤트로 구현된다.
클라우드 제공사가 어떤 일이 있어도 기능을 사용할 수 있도록 보장한다.
AWS가 Lambda의 이벤트 소스로 API Gateway를 도임한 후, 서버리스 컴퓨팅으로 구동되는 전체 API를 만드는 것이 가능해졌다.
점점 더 많은 서비스가 Lambda 제품과 통합되어 복잡한 상황의 애플리케이션 구축이 가능해지고 있다.
서버 또는 가상머신을 프로비저닝하고 관리할 필요가 없다.
서버리스 개방형 표준이 아직 없어서 이식성이 없다.

Serverless vs. Container 선택 가이드

이번 글에서는 서버리스와 컨테이너에 대해서 설명하고자 한다.

giljae.medium.com

📌 DevOps 도입

소프트웨어 유지 보수를 위해 애플리케이션 전체 생애주기를 담당하는 DevOps를 도입할 수 있다.

운영: Bash, Nagios, Powershell 등
개발: Make, Maven, NuGet, MSBuild 등

서로 다른 기술을 사용하더라도 Dockerfile과 Docker compose script를 사용해 같은 기술과 도구로 팀을 통일할 수 있게 된다.

Jenkins나 CALMS라는 DevOps 프레임워크를 사용할 수도 있다.

Culture(문화) : 아래 기능을 공유하는 장소
Automation(자동화) : 컨테이너 환경의 핵심
Lean(린) : 분산 애플리케이션은 린 원칙에 따라 만들어짐
Metric(측정) : 배포 프로세스와 운영 로그로부터 얻은 측정치 활용
Sharing(공유) : 도커 허브는 이미 있는 것을 재사용 가능하게 하는 공유 기능 가능

✒️ 실습 환경 초기화 명령

도커는 컨테이너나 애플리케이션을 자동으로 정리해주는 기능이 없다.
데스크톱을 종료하거나 서비스를 정지시키면 모든 컨테이너가 종료되어 CPU나 메모리를 사용하지는 않지만, 없어지지는 않으므로 실습 환경을 초기화하는 것이 편리하다.

docker container rm -f $(docker container ls -aq)

다음 명령을 사용하면 내려받은 이미지가 차지한 디스크 용량을 모두 회수할 수 있다.

docker image rm -f $(docker image ls -f reference=''diamol/*' -q)

2. 기본적인 Docker 사용법

📌 컨테이너로 Hello World 실행하기

docker container run diamol/ch02-hello-diamol

run 명령을 실행하면 애플리케이션 패키지 'diamol/ch02-hello-diamol'로부터 컨테이너 실행
Host PC에 해당 패키지(이미지)가 없으므로 설치(Pull)한다.
패키지를 사용해 컨테이너를 실행한다. (로그는 애플리케이션이 출력한 내용)
- 컴퓨터 이름 : 여기선 'e32240490a23', Container id에 해당한다.
- 운영체제 종류 : Linux 5.10.102.1-microsoft-standard-WSL2 x86_64
- 네트워크 주소 : 172.17.0.2
- 해당 정보는 컨테이너를 실행할 때마다 바뀌며, 운영체제는 Host 운영체제를 따른다.

✒️ Docker의 핵심 워크 플로우

https://www.ahnlab.com/kr/site/securityinfo/secunews/secuNewsView.do?seq=30533

① 빌드 : 애플리케이션을 컨테이너에서 실행할 수 있도록 패키징
② 공유 : 다른 사람이 패키지를 사용할 수 있도록 공유
③ 실행 : 패키지를 내려받은 사람이 컨테이너를 통해 애플리케이션을 실행

아무리 복잡한 애플리케이션이라도 모두 위 과정을 거친다.
도커를 실행할 수 있는 환경이라면 어디서든 실행할 수 있도록 도커 이미지를 만들 수 있다.
이런 방법으로 도커의 핵심 이점인 이식성이 확보된다.

참고로 위의 컨테이너를 다시 실행하면 아래처럼 스크립트가 실행된다.

컴퓨터 이름(컨테이너 ID)과 IP 주소가 실행할 때마다 바뀔 확률이 굉장히 높다.

📌 Container

각 컨테이너는 가상의 호스트명, IP 주소, 파일 시스템을 가진다.
컨테이너 안에서는 밖의 환경을 볼 수 없다. 따라서 고립되어 있다.
하나의 컴퓨터에는 여러 개의 컨테이너를 실행할 수도 있다. 그리고 모든 컨테이너는 독립적이다.
컨테이너는 컴퓨터의 CPU와 메모리, 운영체제를 공유한다. → 리소스 경감
격리(isolation)와 밀집(density)를 동시에 만족한다.
- 격리 : 런타임 버전 차이, 호환되지 않는 버전의 라이브러리, 리소스 부족 등으로 인한 독립된 환경 필요
- 밀집 : 컴퓨터에 CPU와 메모리가 허용하는 한 되도록 많은 수의 애플리케이션을 실행하는 것

✒️ Virtual Machine 방식의 문제점

• 각각의 가상 머신은 자신만의 운영체제를 별도로 갖는다
• 애플리케이션이 사용할 CPU와 메모리 자원을 상당량 차지한다.
• 운영체제 라이선스와 업데이트 부담이 추가 발생한다.
• 따라서, 가상 머신은 격리는 달성할 수 있지만 밀집은 제공하지 못한다.

반면, 컨테이너는 호스트 컴퓨터의 운영체제를 공유하므로 리소스가 크게 경감된다.
그만큼 실행도 빠르고, 가상 머신에 비해 더 많은 수(일반적으로 약 5배)의 애플리케이션 실행이 가능하다.
또한 컨테이너는 외부와 독립된 환경이므로 밀집과 격리가 동시에 달성되는 것이다.

📌 컨테이너를 원격 컴퓨터처럼 사용하기

💡 run으로 애플리케이션을 실행하고, logs로 로그, top으로 프로세스 목록, inspect로 컨테이너 상세정보 확인

컨테이너를 실행하고 원격 컴퓨터에 접속하듯, 대화식 컨테이너를 실행할 수도 있다.

docker container run --interactive --tty diamol/base

--interactive : 컨테이너에 접속된 상태가 된다.
--tty : 터미널 세션을 통해 컨테이너를 조작한다.

컨테이너 내부에 접속된 터미널 세션의 명령 프롬프트가 뜬다.

접속한 컴퓨터는 현재 실행 중인 컨테이너다.
원격 컴퓨터의 터미널 세션은 로컬 운영체제에 따라 달라진다. (호스트 운영체제를 공유하므로)
- 호스트 컴퓨터가 리눅스 머신이라면 리눅스 쉘이 뜬다.
- 윈도우 머신이라면 윈도우 명령 프롬프트가 뜬다.

도커 자체는 호스트 컴퓨터의 아키텍처나 운영체제와 상관없이 동일하게 동작한다.

하지만 컨테이너에 들어 있는 애플리케이션은 운영체제나 아키텍처를 가릴 수 있다.

결국 컨테이너의 내용물이 무엇이든 컨테이너를 다루는 방법은 환경과 상관없이 동일하다.

✒️ 컨테이너는 Host의 운영체제를 공유하는데 독립적이라고?

이 부분이 정말 이해하는데 오래 걸렸다.
컨테이너를 구동하기 위해서 Host의 운영체제를 공유하고, 실제로 터미널 세션이 호스트 환경에 지배된다면 컨테이너가 독립적이라고 부를 수 있을까?

여기에 대한 정답은 "컨테이너가 Host Kernel의 기능(리소스 관리, 네트워킹, 프로세스 스케줄링)을 공유하는 것이지, 직접적으로 커널 자원을 공유하는 것은 아니기" 때문이다.

컨테이너는 애플리케이션 실행에 필요한 라이브러리, 실행 환경, 종속성 등을 포함하는 격리된 공간이다.
컨테이너 이미지에는 애플리케이션 실행을 위한 모든 구성 요소와 파일 시스템이 포함되어 있고,
패키징된 컨테이너 이미지는 호스트 컴퓨터에서 실행될 때 자체적으로 필요한 운영체제 및 아키텍처에 대한 의존성을 해결한다.

즉, 컨테이너는 고립된 파일 시스템, 네트워크, 프로세스 공간 등을 가지므로 격리는 성립한다.
하지만 동작하는데 있어 호스트 운영체제의 커널을 활용하여 애플리케이션을 실행하는 것이다.

1️⃣ 새로운 터미널 세션을 열고, 현재 실행 중인 모든 컨테이너에 대한 정보 확인

docker container ls

실행 중인 모든 컨테이너 정보를 볼 수 있다.
상태에 관계 없이 보고 싶다면 끝에 --all을 붙이면 된다.

2️⃣ 대상 컨테이너에서 실행 중인 프로세스 목록을 띄워라

docker container top (컨테이너 ID)

(밑에서부턴 현재 실행 중인 컨테이너 ID 기입)

3️⃣ 대상 컨테이너에서 수집된 모든 로그를 출력해라

docker container logs cd

도커는 애플리케이션 표준 출력으로부터 로그를 수집한다.
터미널 세션은 입력한 명령과 출력 내용을 모두 볼 수 있다.
실제 애플리케이션이 실행된 컨테이너에서는 애플리케이션이 출력하는 로그만 보인다.
- ex. HTTP 요청마다 로그를 생성하는 웹 애플리케이션이 동작 중이면, HTTP 요청에 대한 로그만 출력

4️⃣ 대상 컨테이너의 상세 정보를 출력해라

docker container inspect cd

애플리케이션에 발생한 문제를 추적하는 데 유용한 정보를 제공한다.
JSON 포맷으로 출력

📌 컨테이너를 사용해 웹 사이트 호스팅하기

✒️ 컨테이너는 자동으로 사라지지 않는다.

• 컨테이너 내부 애플리케이션이 실행 중이어야 컨테이너 상태도 실행 중이 된다.
∘ 애플리케이션 프로세스가 종료되면 컨테이너는 Exited가 된다.
• 컨테이너가 종료돼도 컨테이너는 사라지지 않는다.
∘ 컨테이너를 다시 실행하거나, 로그 확인, 컨테이너의 파일 시스템에 새로운 파일 복사 혹은 외부로 복사 가능
∘ 컨테이너 파일 시스템이 그대로 남아 있어, 컴퓨터 디스크 공간을 계속 점유한다.

그렇다면 컨테이너를 실행하고 백그라운드에서 계속 동작하게 만드는 방법은 무엇일까?

실제로 도커를 사용하는 주목적은 웹 사이트, 배치 프로세스, 데이터베이스 같은 서버 애플리케이션일 것이다.

docker container run --detach --publish 8088:80 diamol/ch02-hello-diamol-web

--detach : 컨테이너를 백그라운드에서 실행하며 컨테이너 ID를 출력한다.
--publish : 컨테이너 포트를 호스트 컴퓨터에 공개한다.

✒️ publish의 원리

컨테이너는 기본적으로 외부 환경에 노출되지 않는다.
컨테이너가 가지는 고유의 IP 주소는 도커가 관리하는 내부 가상 네트워크에 불과하다. (외부에서 접근 불가)
포트를 공개한다는 것은 도커가 호스트 컴퓨터의 Network Layer의 트래픽에 끼어들어 필요한 것을 가로챌 수 있다.
앞선 예제의 경우 Host PC 8088 포트로 들어온 트래픽을 Docker가 가로채서 컨테이너의 80번 포트로 전달한다.

http://localhost:8088에 HTTP 요청은 로컬 컴퓨터에서 보내고, 응답은 컨테이너로부터 나온 것이다.

컨테이너 하나만 실행하면 전체 애플리케이션(HTML부터 서버까지) 스택이 실행된다.

1️⃣ 실습1. 실행 중인 컨테이너 상태 확인

docker container stats 34

컨테이너 CPU, 메모리, 네트워크, 디스크 사용량을 실시간으로 확인할 수 있다.

2️⃣ 사용이 끝난 컨테이너 삭제

docker container rm --force $(docker container ls --all --quiet)

📌 도커가 컨테이너를 실행하는 원리

https://aidanbae.github.io/code/docker/docker-overview/

도커 엔진(Docker Engine)
- 도커 관리 기능을 맡는 컴포넌트
- 로컬 이미지 캐시 담당
- 호스트 운영체제와 함께 도커 리소스를 만드는 일 담당
- 항시 동작하는 백그라운드 프로세스
도커 API(Docker API)
- 도커 엔진은 도커 API를 통해 맡은 기능을 수행한다.
- 표준 HTTP 기반 REST API
- 도커 엔진 설정을 수정하면 해당 API를 네트워크를 경우해 외부 컴퓨터로부터 호출할 수 없도록 차단(default)하거나 허용할 수 있다.
- 도커 엔진과 상호작용할 수 잇는 유일한 방법은 API를 통하는 방법 뿐이다.
도커 명령행 인터페이스(Docker command-line interface, Docker CLI)
- 도커 API의 클라이언트
- 우리가 docker 명령을 사용(run, build, pull)할 때 호출하는 API가 도커 CLI에 해당한다.
- 원격 컴퓨터에서 실행 중인 도커를 조작할 수 있도록 CLI가 요청을 전달하는 곳을 변경할 수 있다.

도커 API는 명세가 공개되어 있기 때문에 도커 CLI 외의 다른 클라이언트를 사용할 수도 있다.

도커의 세부 구조를 알 필요는 없지만, 아래 내용 정도는 알아두면 좋다.

도커 엔진은 containerd라는 컴포넌트를 통해 컨테이너를 실제로 관리한다.
containerd는 호스트 운영체제가 제공하는 기능을 통해 컨테이너, 즉 가상 환경을 만든다.
containerd는 CNCF에서 관리하는 오픈 소스 프로젝트다.
컨테이너는 개방형 컨테이너 이니셔티브(Open Container Initiative, OCI)라는 이름으로 공개된 개방형 표준이다.

📌 연습 문제: 컨테이너 파일 시스템

웹 사이트 컨테이너를 실행하고 index.html 파일을 교체해 웹 페이지의 내용을 수정해라.
컨테이너도 자신만의 파일 시스템을 가지므로, 이 웹 페이지 파일 역시 컨테이너 파일 시스템 안에 담겨 있다.

• docker container 명령 사용 시, 컨테이너를 대상으로 할 수 있는 일의 목록을 볼 수 있다.
• 모든 docker 명령에 --help 플래그를 추가하면 명령의 도움말을 볼 수 있다.
• 도커 이미지 diamol/ch02-hello-diamol-web 안에서 웹 페이지 파일이 위치한 경로는 `/usr/local/apache2/htdocs`다.

1️⃣ 현재 실행 중인 컨테이너 ID 확인

docker ps -a

2️⃣ htdocs를 로컬 디렉토리로 복사

docker cp (컨테이너 ID):(파일경로) (호스트 경로)

3️⃣ 내용을 수정하고 역으로 cp 해주면 된다.

참고로 컨테이너 내부 디렉토리를 뒤져보고 싶다면 아래 명령어를 사용하면 된다.

docker container exec (컨테이너 id) ls (경로)

저작자표시 비영리

1. What is Container

2. 기본적인 Docker 사용법

티스토리툴바