Python의 pandas 라이브러리에서 제공하는 4가지 유형의 DataFrame 조인

Python의 pandas 라이브러리에서 제공하는 4가지 유형의 DataFrame 조인

데이터 분석가는 여러 데이터 세트를 결합해야 하는 경우가 많습니다. 분석을 완료하고 비즈니스/이해관계자를 위한 결론에 도달하려면 이 작업을 수행해야 합니다.





데이터가 다른 테이블에 저장되어 있을 때 데이터를 표현하는 것은 종종 어려운 일입니다. 이러한 상황에서 조인은 작업 중인 프로그래밍 언어와 상관없이 그 가치를 증명합니다.





MAKEUSEOF 오늘의 비디오

Python 조인은 SQL 조인과 유사합니다. 공통 인덱스의 행을 일치시켜 데이터 세트를 결합합니다.





참조용으로 두 개의 DataFrame 만들기

이 가이드의 예제를 따르기 위해 두 개의 샘플 DataFrame을 만들 수 있습니다. 다음 코드를 사용하여 ID, 이름 및 성을 포함하는 첫 번째 DataFrame을 만듭니다.

import pandas as pd 

a = pd.DataFrame({"ID": ["001", "002", "003", "004", "005"],
"Fname": ["Ron", "John", "Helen", "Jenny", "Kenny"],
"Lname": ["Keith", "Harley", "Smith", "Kerr-Hislop", "Barber"]})
print(a)

첫 번째 단계로 가져오기 팬더 도서관. 그런 다음 변수를 사용할 수 있습니다. , DataFrame 생성자의 결과를 저장합니다. 생성자에 필요한 값이 포함된 사전을 전달합니다.



마지막으로 인쇄 기능을 사용하여 DataFrame 값의 내용을 표시하여 모든 것이 예상대로 보이는지 확인합니다.

마찬가지로 다른 DataFrame을 만들 수 있습니다. , ID 및 급여 값을 포함합니다.





앱 ar 영역이 무엇입니까
b = pd.DataFrame({"ID": ["001", "002", "003", "004", "005"], 
"Salary": [100000, 700000, 80000, 904750, 604772]})

print(b)

콘솔이나 IDE에서 출력을 확인할 수 있습니다. DataFrames의 내용을 확인해야 합니다.

조인은 Python의 병합 함수와 어떻게 다른가요?

pandas 라이브러리는 DataFrame을 조작하는 데 사용할 수 있는 주요 라이브러리 중 하나입니다. DataFrames에는 여러 데이터 세트가 포함되어 있으므로 Python에서 이를 결합하는 다양한 함수를 사용할 수 있습니다.





Python은 DataFrame을 결합하는 데 사용할 수 있는 결합 및 병합 기능을 제공합니다. 이 두 기능 사이에는 뚜렷한 차이가 있으며, 둘 중 하나를 사용하기 전에 염두에 두어야 합니다.

조인 함수는 인덱스 값을 기반으로 두 DataFrame을 조인합니다. 그만큼 병합 기능은 DataFrames를 결합합니다. 인덱스 값과 열을 기반으로 합니다.

Python의 조인에 대해 알아야 할 사항은 무엇입니까?

사용 가능한 조인 유형을 논의하기 전에 다음 사항에 유의해야 합니다.

  • SQL 조인은 가장 기본적인 기능 중 하나입니다. Python의 조인과 매우 유사합니다.
  • DataFrames를 조인하려면 다음을 사용할 수 있습니다. 팬더.DataFrame.join() 방법.
  • 기본 조인은 왼쪽 조인을 수행하는 반면 병합 기능은 내부 조인을 수행합니다.

Python 조인의 기본 구문은 다음과 같습니다.

DataFrame.join(other, on=None, how='left/right/inner/outer', lsuffix='', rsuffix='', 
sort=False)

첫 번째 DataFrame에서 조인 메서드를 호출하고 두 번째 DataFrame을 첫 번째 매개변수로 전달합니다. 다른 . 나머지 인수는 다음과 같습니다.

  • ~에 , 인덱스가 둘 이상인 경우 조인할 인덱스의 이름을 지정합니다.
  • 어떻게 , 어느 내부, 외부, 왼쪽 및 오른쪽을 포함한 조인 유형을 정의합니다.
  • 접미사 , 어느 열 이름의 왼쪽 접미사 문자열을 정의합니다.
  • 접미사 , 어느 열 이름의 올바른 접미사 문자열을 정의합니다.
  • 종류 , 어느 결과 DataFrame을 정렬할지 여부를 나타내는 부울입니다.

Python에서 다양한 유형의 조인을 사용하는 방법 배우기

Python에는 시간의 필요에 따라 운동할 수 있는 몇 가지 조인 옵션이 있습니다. 조인 유형은 다음과 같습니다.

1. 왼쪽 조인

왼쪽 조인은 첫 번째 DataFrame의 값을 그대로 유지하면서 두 번째 값에서 일치하는 값을 가져옵니다. 예를 들어 다음에서 일치하는 값을 가져오려는 경우 , 다음과 같이 정의할 수 있습니다.

무료 생일 축하 문자 메시지 노래
c = a.join(b, how="left", lsuffix = "_left", rsuffix = "_right", sort = True) 
print(c)

쿼리가 실행되면 출력에 다음 열 참조가 포함됩니다.

  • 아이디_왼쪽
  • 에프네임
  • 이름
  • 아이디_오른쪽
  • 샐러리

이 조인은 첫 번째 DataFrame에서 처음 세 개의 열을 가져오고 두 번째 DataFrame에서 마지막 두 개의 열을 가져옵니다. 그것은 사용했다 접미사 그리고 접미사 결과 필드 이름이 고유하도록 두 데이터 세트에서 ID 열의 이름을 바꾸는 값.

출력은 다음과 같습니다.

  Python에서 왼쪽 조인을 표시하는 코드's dataframes

2. 오른쪽 조인

오른쪽 조인은 첫 번째 테이블에서 일치하는 값을 가져오는 동안 두 번째 DataFrame의 값을 그대로 유지합니다. 예를 들어 다음에서 일치하는 값을 가져오려는 경우 , 다음과 같이 정의할 수 있습니다.

c = b.join(a, how="right", lsuffix = "_right", rsuffix = "_left", sort = True) 
print(c)

출력은 다음과 같습니다.

  Python에서 오른쪽 조인을 보여주는 코드's dataframes

코드를 검토하면 몇 가지 분명한 변경 사항이 있습니다. 예를 들어 결과에는 첫 번째 DataFrame의 열보다 먼저 두 번째 DataFrame의 열이 포함됩니다.

다음 값을 사용해야 합니다. 오른쪽 위해 어떻게 오른쪽 조인을 지정하는 인수. 또한 전환하는 방법에 유의하십시오. 접미사 그리고 접미사 오른쪽 조인의 특성을 반영하는 값.

일반 조인에서는 오른쪽 조인에 비해 왼쪽, 내부 및 외부 조인을 더 자주 사용하게 될 수 있습니다. 그러나 사용량은 전적으로 데이터 요구 사항에 따라 다릅니다.

Word에서 페이지를 재정렬하는 방법

3. 내부 조인

내부 조인은 두 DataFrame에서 일치하는 항목을 제공합니다. 조인은 인덱스 번호를 사용하여 행과 일치하므로 내부 조인은 일치하는 행만 반환합니다. 이 그림에서는 다음 두 DataFrames를 사용하겠습니다.

a = pd.DataFrame({"ID": ["001", "002", "003", "004", "005", "006", "007"], 
"Fname": ["Ron", "John", "Helen", "Jenny", "Kenny", "Daryl", "Cathy"],
"Lname": ["Keith", "Harley", "Smith", "Kerr-Hislop", "Barber", "Hooper", "Hope"]})
b = pd.DataFrame({"ID": ["001", "002", "003", "004", "005"],
"Salary": [100000, 700000, 80000, 904750, 604772]})

print(a)
print(b)

출력은 다음과 같습니다.

  Python에서 새 데이터 프레임 만들기

다음과 같이 내부 조인을 사용할 수 있습니다.

c = a.join(b, lsuffix="_left", rsuffix="_right", how='inner') 
print(c)

결과 출력에는 두 입력 DataFrame에 모두 존재하는 행만 포함됩니다.

  Python에서 내부 조인을 보여주는 코드's dataframes

4. 외부 조인

외부 조인은 두 DataFrame의 모든 값을 반환합니다. 일치하는 값이 없는 행의 경우 개별 셀에 null 값을 생성합니다.

위와 동일한 DataFrame을 사용하여 외부 조인을 위한 코드는 다음과 같습니다.

c = a.join(b, lsuffix="_left", rsuffix="_right", how='outer') 
print(c)
  Python에서 외부 조인을 보여주는 코드's dataframes

Python에서 조인 사용

조인은 해당 기능인 병합 및 연결과 마찬가지로 단순한 조인 기능 이상을 제공합니다. 일련의 옵션과 기능이 주어지면 요구 사항에 맞는 옵션을 선택할 수 있습니다.

Python이 제공하는 유연한 옵션을 사용하여 조인 기능을 사용하거나 사용하지 않고 결과 데이터 세트를 비교적 쉽게 정렬할 수 있습니다.