본문 바로가기
반응형

머신러닝 & 딥러닝/Pandas3

데이터 입출력: CSV, Excel, JSON 파일 읽기/쓰기 Pandas는 다양한 형식의 데이터 파일을 다룰 수 있도록 강력한 입출력 기능을 제공합니다. 이번 글에서는 CSV, Excel, JSON 파일을 읽고 저장하는 방법을 살펴보겠습니다. 각 파일 형식별로 기본적인 사용법부터 다양한 옵션을 활용하는 고급 기능까지 다루겠습니다.1. CSV 파일 입출력CSV(Comma-Separated Values) 파일은 가장 일반적인 데이터 파일 형식으로, 데이터 분석에서 자주 사용됩니다.1.1. CSV 파일 읽는 법 (read_csv)CSV 파일을 읽어 DataFrame으로 변환하는 기본적인 방법입니다.import pandas as pd# CSV 파일 읽기df = pd.read_csv('data.csv')print(df.head()) # 처음 5개 행 출력CSV 파일 예시.. 2025. 3. 19.
인덱싱과 슬라이싱: loc, iloc 사용법 Pandas의 인덱싱과 슬라이싱 기능은 데이터프레임에서 원하는 데이터만 선택해 분석할 수 있도록 도와줍니다. 이번 글에서는 loc와 iloc를 활용하여 데이터를 라벨 또는 위치 기반으로 선택하는 방법을 살펴보고, 각 기능별 예제와 실행 결과를 함께 확인해 보겠습니다.1. loc 관련 기능loc는 라벨(label) 기반 인덱싱을 지원합니다. 즉, 행이나 열의 이름(또는 라벨)을 이용하여 데이터를 선택할 수 있습니다.loc로 라벨 기반 인덱싱하는 법먼저, 기본 DataFrame을 생성합니다.import pandas as pddata = { '이름': ['홍길동', '이순신', '강감찬', '유관순'], '나이': [30, 45, 27, 22], '직업': ['개발자', '디자이너', '데이터.. 2025. 3. 12.
기본 데이터 구조 이해하기: Series와 DataFrame Pandas는 데이터 분석에 매우 유용한 라이브러리로, 그 핵심 데이터 구조는 Series와 DataFrame입니다. 이 글에서는 이 두 가지 데이터 구조의 특징과 생성 방법, 그리고 기본적인 사용법을 코드 예제와 실행 결과를 통해 살펴보겠습니다.1. SeriesSeries는 일종의 1차원 배열과 같은 구조로, 값과 인덱스로 구성됩니다. 각 요소는 인덱스를 기반으로 접근할 수 있으며, 기본 인덱스는 정수형이지만 사용자가 직접 지정할 수도 있습니다. 1.1. Series 생성 예제다음 예제는 기본적인 Series를 생성하고 출력하는 코드입니다.import pandas as pd# 1차원 리스트를 사용하여 Series 생성data = [10, 20, 30, 40, 50]series = pd.Series(da.. 2025. 3. 6.