Python의 nunique() 함수 이해: 예제 가이드
nunique() 함수는 Python에서 데이터 분석에 유용한 도구입니다. pandas Series 또는 DaataFrame에서 고유한 값의 수를 계산하는 데 사용됩니다. 이 글에서는 nunique() 함수가 어떻게 작동하는지 설명하고 사용 방법에 대한 예제를 제공합니다.
nunique() 함수는 무엇일까요?
nunique() 함수는 pandas Series 또는 DataFrame에서 고유한 값의 수를 계산하는 데 사용되는 pandas 라이브러리의 메서드입니다. 행 또는 열일 수 있는 지정된 축의 고유한 값 수를 반환합니다.
nunique() 함수의 구문
nunique() 함수를 사용하기 위한 구문은 다음과 같습니다.
df.nunique(axis=0, dropna=True)
그런 다음 "df"는 함수를 적용하려는 pandas DataFrame 또는 Series를 나타냅니다. "axis" 매개변수는 행(axis=0) 또는 열(axis=1)에 대한 고유 값을 계산할지 여부를 지정하는 데 사용됩니다. "dropna" 매개변수는 계산에서 누락된 값을 계산할지(True) 아니면 계산하지 않을지(False)를 지정하는 부울 값입니다.
nunique() 함수 사용 예시
Python에서 nunique() 함수를 사용할 수 있는 방법에 대한 몇 가지 예를 살펴보겠습니다.
예제 1: 시리즈의 고유 값 계산
다음 값을 포함하는 pandas 시리즈가 있다고 가정합니다.
import pandas as pd
s = pd.Series([1, 2, 3, 3, 4, 4, 5, 5, 5, 5])
이 시리즈의 고유 값 수를 계산하려면 다음과 같이 nunique() 함수를 사용할 수 있습니다.
s.nunique()
이렇게 출력이 반환됩니다.
5
예제 2: DataFrame의 고유 값 계산
다음 값을 포함하는 pandas DataFrame이 있다고 가정합니다.
df = pd.DataFrame({'A': [1, 2, 2, 3], 'B': [1, 1, 2, 2]})
이 DataFrame의 각 열에 있는 고유한 값의 수를 계산하려면 다음과 같이 nunique() 함수를 사용할 수 있습니다.
df.nunique()
이렇게 출력을 반환합니다.
A 3
B 2
dtype: int64
nunique() 함수는 pandas Series 또는 DataFrame에서 고유한 값의 수를 계산할 수 있으므로 Python의 데이터 분석에 유용한 도구입니다. 전달된 구문과 예시를 이해하면 이 기능을 자신의 데이터 분석 프로젝트에 적용할 수 있습니다.