'코딩' 카테고리의 글 목록

코딩

파이썬 DataFrame row로 subset 만들기(df.iloc, df.loc)

DataFrame에서 특정 row를 인덱싱하거나 row들을 선택하여 subset을 만드는 방법을 알아보겠습니다. df.iloc 또는 df.loc을 사용하여 DataFrame의 row별로 데이터를 가져올 수 있습니다. df.iloc과 df.loc의 가장 큰 차이점은 iloc은 숫자로 인덱싱을 하고 loc은 row명으로 인덱싱을 하는 것입니다. 아래 설명할 때 사용할 csv파일은 한국에 상장된 주식들의 종목명, 종가, EPS, PER 등 주식에 관련된 여러 데이터를 가지고 있습니다. csv파일의 윗부분만 보면 아래와 같습니다. import pandas as pd df = pd.read_csv("per_pbr_dividend.csv", encoding = 'cp949') df.head() df.iloc[ ] ..

2022.10.07 게시됨

코딩

파이썬 DataFrame 특정 column으로 subset만들기 (+df.filter)

DataFrame에서는 특정 column만 선택하여 새로운 DataFrame으로 만들 수 있습니다. DataFrame은 Series의 dictionary라고 생각했을 때 [ ]를 이용하여 인덱싱 하는 것처럼 column을 선택하여 subset을 만들게 됩니다. 아래 예제에서 사용한 csv파일은 한국에 상장된 주식들의 종목명, 종가, 주당배당금 등 가격과 관련된 데이터들을 가지고 있습니다. csv 파일의 head는 아래와 같습니다. import pandas as pd df = pd.read_csv("per_pbr_dividend.csv", encoding = 'cp949') df.head() 특정 column으로 subset 만들기 [ ]으로 인덱싱하듯 column을 선택하여 subset을 만들 수 있습니..

2022.10.04 게시됨

코딩

파이썬 DataFrame 정렬(df.nlargest, nsmallest, sort_values)

파이썬 DataFrame에서 정렬할 때 사용하는 df.nlargest, df.nsmallest, sort_values에 대해서 알아보겠습니다. 이를 통해 DataFrame에 있는 가장 큰 값들, 가장 작은 값들, 오름차순이나 내림차순으로 값들을 정렬할 수 있습니다. 아래 예제에서 사용한 csv파일은 주식 종목별 종목코드, 종목명, 종가, EPS, PER 등 가격과 관련된 정보가 들어있습니다. csv 파일의 head를 찍어보면 아래와 같이 나오는 것을 확인할 수 있습니다. import pandas as pd df = pd.read_csv("per_pbr_dividend.csv", encoding = 'cp949') df.head() df.nlargest(), df.nsmallest df.nlargest( ..

2022.09.28 게시됨

코딩

파이썬 DataFrame 고유값 확인 및 갯수(df.unique, df.nuique, df.value_counts)

파이썬 pandas에서는 unique, nunique, value_counts를 통해서 DataFrame에 있는 고유 값을 확인하고 고유 값의 갯수를 쉽게 알 수 있습니다. 읽어온 csv파일은 한국에 상장된 주식의 기본 정보들입니다. 이 csv 파일에는 각 주식의 표준코드, 단축코드, 한글 종목명, 한글 종목약명, 영문 종목명, 상장일, 시장구분, 증권구분, 소속부, 주식종류, 액면가, 상장주식 수가 포함되어 있습니다. import pandas as pd df = pd.read_csv('stock_data.csv', encoding = 'cp949') df.head() 이 DataFrame의 head를 찍어보면 다음과 같습니다. df.unique() unique는 DataFrame의 특정 column이 ..

2022.09.20 게시됨

재코IT

티스토리툴바