반응형
파이썬 DataFrame row로 subset 만들기(df.iloc, df.loc) 포스팅 썸네일 이미지

코딩

파이썬 DataFrame row로 subset 만들기(df.iloc, df.loc)

DataFrame에서 특정 row를 인덱싱하거나 row들을 선택하여 subset을 만드는 방법을 알아보겠습니다. df.iloc 또는 df.loc을 사용하여 DataFrame의 row별로 데이터를 가져올 수 있습니다. df.iloc과 df.loc의 가장 큰 차이점은 iloc은 숫자로 인덱싱을 하고 loc은 row명으로 인덱싱을 하는 것입니다. 아래 설명할 때 사용할 csv파일은 한국에 상장된 주식들의 종목명, 종가, EPS, PER 등 주식에 관련된 여러 데이터를 가지고 있습니다. csv파일의 윗부분만 보면 아래와 같습니다. import pandas as pd df = pd.read_csv("per_pbr_dividend.csv", encoding = 'cp949') df.head() df.iloc[ ] ..

2022.10.07 게시됨

파이썬 DataFrame 특정 column으로 subset만들기 (+df.filter) 포스팅 썸네일 이미지

코딩

파이썬 DataFrame 특정 column으로 subset만들기 (+df.filter)

DataFrame에서는 특정 column만 선택하여 새로운 DataFrame으로 만들 수 있습니다. DataFrame은 Series의 dictionary라고 생각했을 때 [ ]를 이용하여 인덱싱 하는 것처럼 column을 선택하여 subset을 만들게 됩니다. 아래 예제에서 사용한 csv파일은 한국에 상장된 주식들의 종목명, 종가, 주당배당금 등 가격과 관련된 데이터들을 가지고 있습니다. csv 파일의 head는 아래와 같습니다. import pandas as pd df = pd.read_csv("per_pbr_dividend.csv", encoding = 'cp949') df.head() 특정 column으로 subset 만들기 [ ]으로 인덱싱하듯 column을 선택하여 subset을 만들 수 있습니..

2022.10.04 게시됨

파이썬 DataFrame 정렬(df.nlargest, nsmallest, sort_values) 포스팅 썸네일 이미지

코딩

파이썬 DataFrame 정렬(df.nlargest, nsmallest, sort_values)

파이썬 DataFrame에서 정렬할 때 사용하는 df.nlargest, df.nsmallest, sort_values에 대해서 알아보겠습니다. 이를 통해 DataFrame에 있는 가장 큰 값들, 가장 작은 값들, 오름차순이나 내림차순으로 값들을 정렬할 수 있습니다. 아래 예제에서 사용한 csv파일은 주식 종목별 종목코드, 종목명, 종가, EPS, PER 등 가격과 관련된 정보가 들어있습니다. csv 파일의 head를 찍어보면 아래와 같이 나오는 것을 확인할 수 있습니다. import pandas as pd df = pd.read_csv("per_pbr_dividend.csv", encoding = 'cp949') df.head() df.nlargest(), df.nsmallest df.nlargest( ..

2022.09.28 게시됨

파이썬 DataFrame 고유값 확인 및 갯수(df.unique, df.nuique, df.value_counts) 포스팅 썸네일 이미지

코딩

파이썬 DataFrame 고유값 확인 및 갯수(df.unique, df.nuique, df.value_counts)

파이썬 pandas에서는 unique, nunique, value_counts를 통해서 DataFrame에 있는 고유 값을 확인하고 고유 값의 갯수를 쉽게 알 수 있습니다. 읽어온 csv파일은 한국에 상장된 주식의 기본 정보들입니다. 이 csv 파일에는 각 주식의 표준코드, 단축코드, 한글 종목명, 한글 종목약명, 영문 종목명, 상장일, 시장구분, 증권구분, 소속부, 주식종류, 액면가, 상장주식 수가 포함되어 있습니다. import pandas as pd df = pd.read_csv('stock_data.csv', encoding = 'cp949') df.head() 이 DataFrame의 head를 찍어보면 다음과 같습니다. df.unique() unique는 DataFrame의 특정 column이 ..

2022.09.20 게시됨