
AWS Athena는 매우 유용하지만, 무턱대고 사용하면 느려지고 비용도 올라갑니다. Athena는 스캔한 데이터 양을 기준으로 과금하기 때문에, 성능을 최적화하는 것이 곧 비용을 절감하는 길입니다.이 글에서는 Athena의 쿼리 성능을 높이고, 비용까지 아낄 수 있는 실전 팁을 정리해보겠습니다.1. Parquet, ORC 같은 컬럼 기반 포맷 사용하기Athena는 CSV나 JSON도 읽을 수 있지만, Parquet 또는 ORC처럼 컬럼 저장 형식을 사용하면 훨씬 빠르고 경제적입니다.장점:필요한 컬럼만 읽기 때문에 데이터 스캔량 대폭 감소기본적으로 압축됨변환 방법:Glue ETL 또는 Spark, Pandas 등으로 변환 후 S3 저장2. 파티셔닝 전략 수립하기S3 내 데이터를 폴더 구조로 나누는 파티셔..