Pandas를 활용한 데이터 수정 기법 완벽 가이드
Pandas는 데이터 분석을 위한 강력한 도구로, 데이터 수정 기능은 매우 중요한 요소입니다. 데이터 수정은 데이터의 품질을 높이고, 분석 과정에서 발생할 수 있는 오류를 최소화하는 역할을 합니다. 이 글에서는 Pandas의 데이터 수정 기능에 대해 깊이 탐구하고, 다양한 방법을 소개하여 데이터 분석의 효율성을 높이는 데 기여하고자 합니다.

[목차여기]
▼ 아래 정보도 함께 확인해보세요.

데이터프레임 생성하기
데이터를 수정하기 위해서는 먼저 Pandas 라이브러리를 사용하여 데이터프레임을 생성해야 합니다. 데이터프레임은 2차원 배열 형태로 데이터를 저장할 수 있는 구조입니다. Pandas를 사용하기 위해서는 먼저 라이브러리를 설치하고 import해야 합니다.
다음은 Pandas를 설치하는 방법입니다.
- Python이 설치된 환경에서 터미널 또는 명령 프롬프트를 열고 다음 명령어를 입력합니다.
- pip install pandas
설치가 완료되면 아래와 같이 Pandas를 import하여 데이터프레임을 생성할 수 있습니다.
import pandas as pd
data = {
'이름': ['홍길동', '이순신', '강감찬'],
'나이': [25, 30, 35],
'도시': ['서울', '인천', '부산']
}
df = pd.DataFrame(data)
print(df)
위 코드를 실행하면 다음과 같은 데이터프레임이 생성됩니다.
이름 | 나이 | 도시 |
홍길동 | 25 | 서울 |
이순신 | 30 | 인천 |
강감찬 | 35 | 부산 |
📌 데이터프레임 생성에 대한 더 많은 정보를 원하신다면 아래 링크를 확인해보세요!

데이터 수정 기본 기법
데이터프레임의 데이터를 수정하는 방법에는 여러 가지가 있습니다. 가장 기본적인 방법은 인덱싱을 이용하는 것입니다. 데이터프레임의 특정 셀에 접근하여 값을 수정할 수 있습니다.
예를 들어, 두 번째 사람의 나이를 수정하고 싶다면 다음과 같이 할 수 있습니다.
df.at[1, '나이'] = 32
위 코드를 실행하면 데이터프레임의 이순신의 나이가 30에서 32로 수정됩니다.
또한, 조건을 이용하여 여러 개의 값을 동시에 수정할 수도 있습니다. 예를 들어, 나이가 30 이상인 사람의 도시를 '대전'으로 변경하고 싶다면 다음과 같이 할 수 있습니다.
df.loc[df['나이'] >= 30, '도시'] = '대전'
이 코드를 실행하면 이순신과 강감찬의 도시가 '대전'으로 변경됩니다.
📌 데이터 수정 기법에 대해 더 알고 싶으신 분들은 아래 링크를 참고해보세요.

새로운 열 추가하기
데이터프레임에 새로운 열을 추가하는 것은 매우 간단합니다. 새로운 열의 이름을 지정하고 해당 열에 들어갈 데이터를 리스트 형태로 제공하면 됩니다.
예를 들어, 각 사람의 직업을 추가하고 싶다면 다음과 같이 할 수 있습니다.
df['직업'] = ['의사', '장군', '명장']
위 코드를 실행하면 데이터프레임에 '직업'이라는 새로운 열이 추가되고, 각 사람의 직업이 설정됩니다.
수정된 데이터프레임은 다음과 같습니다.
이름 | 나이 | 도시 | 직업 |
홍길동 | 25 | 서울 | 의사 |
이순신 | 32 | 대전 | 장군 |
강감찬 | 35 | 대전 | 명장 |
📌 새로운 열 추가에 대해 더 알고 싶으신 분들은 아래 링크를 확인해보세요!

행 삭제 및 필터링
데이터프레임에서 특정 행을 삭제하고 싶을 때도 Pandas는 매우 직관적인 방법을 제공합니다. drop 메소드를 사용하여 특정 인덱스를 지정하면 해당 행이 삭제됩니다.
예를 들어, 첫 번째 사람인 홍길동의 데이터를 삭제하고 싶다면 다음과 같이 할 수 있습니다.
df = df.drop(0)
위 코드를 실행하면 데이터프레임에서 홍길동의 정보가 삭제됩니다. 또한, 필터링을 통해 특정 조건을 만족하는 행만 선택할 수도 있습니다.
예를 들어, 나이가 30 이상인 사람만 선택하고 싶다면 다음과 같이 할 수 있습니다.
filtered_df = df[df['나이'] >= 30]
이 코드를 실행하면 나이가 30 이상인 사람들로만 구성된 새로운 데이터프레임이 생성됩니다.
📌 행 삭제 및 필터링에 대한 더 많은 정보를 원하신다면 아래 링크를 확인해보세요!

데이터프레임 병합하기
여러 데이터프레임을 병합하여 하나의 데이터프레임으로 만드는 것도 Pandas의 강력한 기능 중 하나입니다. concat 또는 merge 메소드를 사용하여 데이터프레임을 병합할 수 있습니다.
예를 들어, 두 개의 데이터프레임을 수직으로 병합하고 싶다면 다음과 같이 할 수 있습니다.
df1 = pd.DataFrame({'이름': ['김철수'], '나이': [28], '도시': ['대구']})
df_combined = pd.concat([df, df1], ignore_index=True)
위 코드를 실행하면 df와 df1이 병합된 새로운 데이터프레임 df_combined이 생성됩니다. 여기서 ignore_index=True를 사용하면 인덱스가 재설정됩니다.
이 외에도 merge 메소드를 사용하여 공통 열을 기준으로 데이터프레임을 병합할 수 있습니다.
df2 = pd.DataFrame({'이름': ['홍길동', '이순신'], '국적': ['한국', '한국']})
merged_df = pd.merge(df, df2, on='이름')
위 코드를 실행하면 '이름' 열을 기준으로 df와 df2가 병합된 새로운 데이터프레임이 생성됩니다.
📌 데이터프레임 병합에 대한 자세한 정보는 아래 링크를 확인해보세요!
자주 묻는 질문 FAQs
질문 1. Pandas에서 데이터 수정은 어떻게 하나요?
Pandas에서는 데이터프레임의 특정 값을 수정하거나, 열을 추가 및 삭제하는 다양한 방법을 제공합니다. 예를 들어, loc, iloc, replace, drop 등의 메서드를 활용하여 데이터를 쉽게 수정할 수 있습니다.
질문 2. 데이터 수정 시 주의할 점은 무엇인가요?
데이터 수정 시 주의할 점은 원본 데이터의 손실을 방지하는 것입니다. 데이터를 수정하기 전에 백업을 만들어 두거나, 수정된 결과를 새로운 데이터프레임에 저장하여 원본을 보존하는 것이 좋습니다.
질문 3. Pandas의 데이터 수정 관련 자료는 어디서 찾을 수 있나요?
Pandas의 데이터 수정 관련 자료는 해당 블로그를 참고하시면 유용한 정보를 얻을 수 있습니다. 또한, 공식 Pandas 문서에서도 다양한 예제와 설명을 확인할 수 있습니다.
결론
Pandas를 활용한 데이터 수정 방법은 데이터 처리와 분석에서 필수적인 기술입니다. 데이터 수정 기술을 통해 사용자들은 더 정확하고 신뢰할 수 있는 분석 결과를 도출할 수 있습니다. 이 글에서 소개한 다양한 데이터 수정 기법들을 통해 여러분의 데이터 분석 여정이 한층 더 발전하기를 바랍니다.
댓글