AWS Athena를 사용할 때 데이터를 어떤 포맷으로 저장하느냐에 따라 쿼리 성능과 비용이 크게 달라집니다. 그중 가장 많이 비교되는 포맷이 바로 CSV와 Parquet입니다. 이번 글에서는 두 포맷의 차이점과, Athena 환경에서 어떤 포맷이 더 효율적인지 실무 중심으로 정리해보겠습니다.✅ 기본 개념 비교항목CSVParquet저장 방식텍스트 기반컬럼 기반 (Binary)용량큼작음 (최대 10배 압축 가능)스캔 효율낮음높음 (컬럼만 읽음)스키마없음명시적 스키마 포함읽기 속도느림빠름 (특히 일부 컬럼만 SELECT 시)Athena 비용상대적으로 높음낮음 (스캔 데이터 감소)🧠 Athena에서 Parquet이 더 유리한 이유컬럼 프루닝 가능Parquet은 컬럼 기반 저장이라 SELECT에 필요한 컬럼만..