고객 명단에서 중복값을 지웠는데 나중에 보니 같은 이름의 다른 사람이 사라진 경우가 있습니다. 엑셀 중복값 정리는 “중복 제거” 버튼을 누르는 일이 아니라, 무엇을 중복으로 볼지 먼저 정하는 작업입니다.
주문번호는 한 번만 나와야 할 수도 있지만, 주문번호 하나에 상품이 여러 줄로 들어오는 파일도 있습니다. 이름은 중복일 수 있고, 휴대폰 번호는 가족이 같이 쓰는 경우도 있습니다. 그래서 삭제 전에 기준을 정해야 합니다.
원본 파일을 먼저 복사합니다
중복 제거는 되돌리기 어려운 작업입니다. 엑셀의 중복 제거 기능은 조건에 맞는 행을 실제로 삭제합니다. 작업 전 원본 시트를 복사하거나 파일을 별도 저장해 둬야 합니다.
파일명도 구분합니다. 고객명단_원본, 고객명단_중복확인, 고객명단_제출용처럼 나누면 나중에 문제가 생겼을 때 원본으로 돌아갈 수 있습니다.
중복 기준 열을 정합니다
중복을 어떤 열로 판단할지 먼저 정해야 합니다. 이름만 기준으로 삼으면 동명이인이 사라질 수 있습니다. 전화번호만 기준으로 삼으면 가족 계정이나 회사 대표번호가 문제될 수 있습니다.
| 업무 | 중복 기준으로 볼 열 | 주의할 점 |
|---|---|---|
| 주문 내역 | 주문번호 | 주문번호 하나에 상품 여러 줄이 있을 수 있음 |
| 고객 명단 | 휴대폰 + 이름 | 동명이인과 가족 번호 확인 필요 |
| 교육 신청 | 연락처 + 신청 과정 | 같은 사람이 다른 과정 신청 가능 |
| 송장 파일 | 송장번호 | 반품 송장과 출고 송장 구분 필요 |
| 회원 파일 | 회원번호 | 이름보다 고유번호 우선 |
공백과 표기부터 맞춥니다
중복값이 제대로 보이지 않는 이유는 값이 정말 달라서가 아니라 표기가 달라서인 경우가 많습니다. 이름 뒤에 공백이 있거나, 전화번호에 하이픈이 들어가거나, 이메일 대소문자가 섞이면 같은 값도 다르게 보입니다.
중복 확인 전에 정리용 열을 만듭니다. 이름은 앞뒤 공백을 지우고, 전화번호는 하이픈을 제거하고, 이메일은 소문자로 맞춥니다. 원본 열을 바로 고치지 말고 정리용 열에서 비교해야 안전합니다.
조건부 서식으로 먼저 표시합니다
삭제하기 전에 중복값을 눈으로 표시해 봅니다. 엑셀의 조건부 서식을 쓰면 중복 값을 색으로 볼 수 있습니다. 이 단계에서는 행을 지우지 않으므로 어떤 값이 중복으로 잡히는지 확인하기 좋습니다.
예를 들어 고객명단에서 휴대폰 번호 중복을 표시한 뒤, 같은 번호가 가족인지 같은 고객의 중복 입력인지 확인합니다. 중복 표시 결과를 보고 기준 열을 다시 바꿔야 할 수도 있습니다.
UNIQUE 함수는 목록 확인에 좋습니다
Microsoft 지원 문서에 따르면 UNIQUE 함수는 목록 또는 범위에서 고유 값의 목록을 반환합니다. 원본을 삭제하지 않고 고유값 목록만 따로 보고 싶을 때 유용합니다.
예를 들어 교육 신청자 명단에서 신청 과정별 고유 전화번호 목록을 보고 싶다면 UNIQUE 함수로 별도 목록을 만들 수 있습니다. 원본 행을 지우지 않기 때문에 확인용으로 쓰기 좋습니다. 다만 다른 팀원이 낮은 버전의 Excel을 쓰는 경우 함수 지원 여부를 확인해야 합니다.
중복 제거는 복사본에서 실행합니다
기준이 정해졌다면 복사본에서 중복 제거를 실행합니다. 열을 선택할 때는 반드시 머리글이 포함되어 있는지 확인합니다. 이름과 전화번호를 함께 기준으로 볼지, 회원번호 하나만 기준으로 볼지도 이 단계에서 정합니다.
중복 제거 후에는 삭제된 행 수를 기록합니다. 예를 들어 2,000행 중 138행이 제거됐다면, 왜 그 정도가 삭제됐는지 설명할 수 있어야 합니다. 숫자가 예상보다 크면 기준을 잘못 잡았을 가능성이 있습니다.
삭제하지 말아야 할 중복도 있습니다
모든 중복이 오류는 아닙니다. 주문 파일에서는 한 주문번호에 여러 상품이 들어갈 수 있습니다. 상담 파일에서는 같은 고객이 여러 번 문의할 수 있습니다. 출석 파일에서는 같은 사람이 오전과 오후에 각각 들어올 수 있습니다.
이런 파일에서 중복 제거를 잘못 실행하면 정상 데이터가 사라집니다. 중복을 제거할지, 최신 행만 남길지, 모든 행을 유지하되 대표값만 따로 뽑을지 먼저 정해야 합니다.
구글시트에서도 원리는 같습니다
Google Sheets 도움말은 텍스트 분할, 중복 데이터 삭제, 공백 제거 기능을 안내합니다. 구글시트에서도 중복 삭제 전에는 원본 탭을 복사하고, 기준 열을 먼저 정해야 합니다.
협업 중인 시트라면 더 조심해야 합니다. 다른 사람이 필터를 걸어둔 상태에서 삭제하거나, 원본 응답 시트에서 바로 중복을 지우면 기록이 꼬일 수 있습니다. 제출용 탭을 따로 만들어 처리하는 편이 안전합니다.
행 수와 합계를 다시 봅니다
중복 제거 후에는 행 수만 보면 부족합니다. 주문 금액, 신청 인원, 출석 인원처럼 합계가 필요한 열도 다시 확인해야 합니다. 행 수는 줄었지만 금액 합계가 예상보다 크게 줄었다면 정상 주문을 지운 것일 수 있습니다.
작업 전 행 수, 작업 후 행 수, 제거된 행 수, 금액 합계, 고유 고객 수를 함께 기록하면 나중에 설명하기 쉽습니다.
작업 순서
- 원본 파일을 복사합니다.
- 중복 기준 열을 정합니다.
- 공백, 하이픈, 대소문자를 정리합니다.
- 조건부 서식으로 중복을 먼저 표시합니다.
- 샘플 행을 눈으로 확인합니다.
- 복사본에서 중복 제거를 실행합니다.
- 제거된 행 수를 기록합니다.
- 금액, 인원, 주문 수 합계를 다시 봅니다.
- 제출용 파일에는 필요한 열만 남깁니다.
엑셀 중복값 정리는 빠르게 지우는 작업이 아닙니다. 기준을 잘못 잡으면 정상 데이터가 사라집니다. 표시하고, 기준을 정하고, 복사본에서 지우고, 숫자를 다시 보는 순서가 안전합니다.
참고한 공식 자료
- Microsoft 지원: UNIQUE 함수
- Microsoft 지원: Excel에서 범위 또는 테이블 데이터 정렬
- Google Docs 편집기 고객센터: 텍스트 분할, 중복 데이터 삭제, 공백 제거
- Google Docs 편집기 고객센터: 데이터 정렬 및 필터링
질문별 빠른 답
엑셀 중복값은 바로 삭제해도 되나요?
바로 삭제하면 위험합니다. 주문번호, 전화번호, 이름 중 무엇을 기준으로 중복인지 먼저 정해야 합니다.
중복 제거 전 꼭 해야 할 일은요?
원본 파일을 백업하고 조건부 서식으로 중복을 먼저 표시해야 합니다.