AWS Athena를 사용하다 보면 간혹 다음과 같은 에러 메시지를 접하게 됩니다:
HIVE_PARTITION_SCHEMA_MISMATCH: You are trying to write into an existing partition in a table. The table schema has changed since the creation of the partition. Inserting rows into such partition is not supported.
이번 글에서는 이 에러가 왜 발생하는지, 그리고 어떻게 해결할 수 있는지를 정리해보겠습니다.
✅ 에러 원인 요약
이 에러는 Athena 테이블 전체 스키마와 특정 파티션의 스키마가 서로 다를 때 발생합니다.
Glue Data Catalog에서는 각 파티션이 생성될 당시의 스키마를 따로 저장하기 때문에,
테이블의 스키마가 변경된 이후에도 기존 파티션은 옛날 구조를 유지합니다.
예를 들어, 다음과 같은 컬럼 구조 변경이 있었다고 가정합시다
테이블 현재 스키마 예시
array<struct<id:string, type:int, meta:array<struct<key:string, value:string, extra:string>>>>
기존 파티션 스키마 예시
array<struct<id:string, type:int, meta:array<struct<key:string, value:string>>>>
extra:string 컬럼이 새로 추가되었기 때문에, 기존 파티션(예: partition_date='2024-12-01')과 스키마가 달라져 에러가 발생하게 됩니다.
🛠 해결 방법
이 에러를 해결하려면 다음 2단계 작업이 필요합니다:
1. 문제 파티션 삭제
ALTER TABLE example_table DROP PARTITION (partition_date='2024-12-01');
- 이 명령은 Glue Data Catalog에서 해당 파티션의 메타데이터만 삭제합니다.
- S3 상의 실제 데이터는 삭제되지 않습니다.
2. 파티션 재등록
MSCK REPAIR TABLE example_table;
- 이 명령은 S3 경로에서 partition_date=2024-12-01과 같은 Hive-style 파티션 폴더를 찾아 다시 등록합니다.
- 이때 테이블의 최신 스키마를 기준으로 등록되므로 스키마 불일치 문제가 해결됩니다.
💡 참고 사항
- MSCK REPAIR TABLE은 Hive-compatible partitioning 구조 (key=value)가 필수입니다.
- 파티션 폴더가 S3에 존재하지 않으면 재등록되지 않습니다.
- 자주 스키마가 변경되는 경우라면 Glue Table을 drop 후 새로 등록하거나, 파티션을 자동 관리하는 Lambda + Glue API 방식을 고려해 볼 수 있습니다.
다음 글에서는 MSCK REPAIR TABLE 명령의 구조와 내부 동작에 대해 더 깊이 다뤄보겠습니다.
📚 빅데이터 관련 추천 책
빅 데이터가 만드는 세상:데이터는 알고 있다 - 인터넷 마케팅 | 쿠팡
쿠팡에서 빅 데이터가 만드는 세상:데이터는 알고 있다 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 인터넷 마케팅 제품도 바로 쿠팡에서 확인할 수 있습니다.
www.coupang.com
빅데이터 커리어 가이드북:빅데이터는 무엇이고 빅데이터 전문가는 어떤 일을 할까? - 클라우드/
쿠팡에서 빅데이터 커리어 가이드북:빅데이터는 무엇이고 빅데이터 전문가는 어떤 일을 할까? 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 클라우드/빅데이터 제품도 바로 쿠팡에서
www.coupang.com
통계학 빅데이터를 잡다 - 확률/통계학 | 쿠팡
쿠팡에서 통계학 빅데이터를 잡다 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 확률/통계학 제품도 바로 쿠팡에서 확인할 수 있습니다.
www.coupang.com
빅데이터 시대 성과를 이끌어 내는 데이터 문해력:그래프와 도표만 바라보는 당신에게 - 성공/경
쿠팡에서 빅데이터 시대 성과를 이끌어 내는 데이터 문해력:그래프와 도표만 바라보는 당신에게 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 성공/경력관리 제품도 바로 쿠팡에서
www.coupang.com
📘 AWS 관련 추천 책
그림과 작동 원리로 쉽게 이해하는AWS 구조와 서비스:AWS의 전체 구조와 기술이 한눈에 들어오는
쿠팡에서 그림과 작동 원리로 쉽게 이해하는AWS 구조와 서비스:AWS의 전체 구조와 기술이 한눈에 들어오는 아마존 웹 서비스 핵심 가이드 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른
www.coupang.com
그림으로 이해하는 AWS 구조와 기술:AWS 쉽고 재미있게 시작하자! - 프로그래밍 언어 | 쿠팡
쿠팡에서 그림으로 이해하는 AWS 구조와 기술:AWS 쉽고 재미있게 시작하자! 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 프로그래밍 언어 제품도 바로 쿠팡에서 확인할 수 있습니다.
www.coupang.com
AWS 교과서 - 학습자료/교구 | 쿠팡
쿠팡에서 AWS 교과서 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 학습자료/교구 제품도 바로 쿠팡에서 확인할 수 있습니다.
www.coupang.com
비전공자를 위한 AWS:클라우드 입문부터 자격증 취득까지 쉽게 배우는 AWS - 웹/네트워크 | 쿠팡
쿠팡에서 비전공자를 위한 AWS:클라우드 입문부터 자격증 취득까지 쉽게 배우는 AWS 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 웹/네트워크 제품도 바로 쿠팡에서 확인할 수 있습니
www.coupang.com
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.
'빅데이터 관련 자료' 카테고리의 다른 글
ALTER TABLE DROP PARTITION 파티션 메타데이터 삭제하기 (1) | 2025.05.25 |
---|---|
MSCK REPAIR TABLE 완전 정복: 동작 원리와 실무 활용법 (2) | 2025.05.24 |
숫자는 거짓말을 하지 않는다, 하지만 질문이 틀릴 수는 있다|데이터로 말하는 사고법 (1) | 2025.05.21 |
숫자가 의사결정의 기본이 될 때|데이터 기반 조직 문화란 무엇인가? (0) | 2025.05.20 |
데이터 실무에서 꼭 써먹는 통계 개념 10가지|기초부터 A/B 테스트까지 (1) | 2025.05.18 |