Airflow 관련 용어 정리
Data Analyst

빅데이터 관련 자료

Airflow 관련 용어 정리

carpe08 2022. 4. 3. 18:42
320x100
320x100

Airflow

Scheduler : 모든 DAG와 Task에 대하여 모니터링 및 관리하고 실행해야 할 Task를 스케줄링

Task : 하나의 작업 단위를 Task라고 하며 하나 또는 여러 개의 Task를 이용해 하나의 DAG를 생성

DAG : Directed Acyclic Graph로 개발자가 Python으로 작성한 워크플로우. Task들의 dependency를 정의

Database : DAG와 Task들의 메타데이터를 저장하는 데이터베이스

Worker : 실제 Task를 실행하는 주체. Executor 종류에 따라 다양한 동작 방식

Web server : Airflow의 웹 UI 서버

Operator : Task를 생성 위해 사용되는 Airflow class,  BashOperator, PythonOperator 등 제외한 외부 서비스들과 연동을 웨해 제공되며 args를 이용해 동작 정의가 가능

320x100
320x100