1. 기본형 1
import pandas as pd
df = pd.DataFrame({'id':[1, 2, 3],
'name':['kim', 'lee', 'jeong'],
'grade':['a', 'a', 'b']})
df
2. 기본형 2
import pandas as pd
df = pd.DataFrame([[1, 'Kim', 'a'],
[2, 'Lee', 'a'],
[3, 'Jeong', 'b']], columns = ['id', 'name', 'grade'])
df
3. 인덱스 추가
import pandas as pd
df = pd.DataFrame({'id':[1, 2, 3],
'name':['Kim', 'Lee', 'Jeong'],
'grade':['a', 'a', 'b']}, index = ['a', 'b', 'c'])
df
4. 데이터프레임 두개를 위아래로 붙이기
import pandas as pd
df_1 = pd.DataFrame([[1, 'kim', 'a'],
[2, 'lee', 'a'],
[3, 'jeong', 'b']],
columns = ['id', 'name', 'grade'])
df_2 = pd.DataFrame([[4, 'park', 'c'],
[5, 'oh', 'c'],
[6, 'ju', 'c']],
columns = ['id', 'name', 'grade'])
print(df_1)
print(df_2)
import pandas as pd
df_1 = pd.DataFrame([[1, 'kim', 'a'],
[2, 'lee', 'a'],
[3, 'jeong', 'b']],
columns = ['id', 'name', 'grade'])
df_2 = pd.DataFrame([[4, 'park', 'c'],
[5, 'oh', 'c'],
[6, 'ju', 'c']],
columns = ['id', 'name', 'grade'])
df_result = pd.concat([df_1, df_2])
print(df_result)
인덱스 0,1,2,0,1,2 는 두 데이터프레임을 붙일 때 그대로 붙였으므로
인덱스를 무시하고 두 데이터프레임을 붙여보자
import pandas as pd
df_1 = pd.DataFrame([[1, 'kim', 'a'],
[2, 'lee', 'a'],
[3, 'jeong', 'b']],
columns = ['id', 'name', 'grade'])
df_2 = pd.DataFrame([[4, 'park', 'c'],
[5, 'oh', 'c'],
[6, 'ju', 'c']],
columns = ['id', 'name', 'grade'])
df_result = pd.concat([df_1, df_2], ignore_index=True)
print(df_result)
데이터프레임을 위아래로 붙였다면,
이번에는 좌우로 붙여보자
import pandas as pd
df_1 = pd.DataFrame([[1, 'kim', 'a'],
[2, 'lee', 'a'],
[3, 'jeong', 'b']],
columns = ['id', 'name', 'grade'])
df_2 = pd.DataFrame([[4, 'park', 'c'],
[5, 'oh', 'c'],
[6, 'ju', 'c']],
columns = ['id', 'name', 'grade'])
df_result = pd.concat([df_1, df_2], axis=1)
print(df_result)
만약 두 데이터프레임의 행이 같지 않으면 어떻게 될까
df_1 데이터프레임에 행을 하나 더 추가해보자
import pandas as pd
df_1 = pd.DataFrame([[1, 'kim', 'a'],
[2, 'lee', 'a'],
[3, 'jeong', 'b'],
[3, 'abc', 'b']],
columns = ['id', 'name', 'grade'])
df_2 = pd.DataFrame([[4, 'park', 'c'],
[5, 'oh', 'c'],
[6, 'ju', 'c']],
columns = ['id', 'name', 'grade'])
print(df_1)
print(df_2)
합쳐보자
import pandas as pd
df_1 = pd.DataFrame([[1, 'kim', 'a'],
[2, 'lee', 'a'],
[3, 'jeong', 'b'],
[3, 'abc', 'b']],
columns = ['id', 'name', 'grade'])
df_2 = pd.DataFrame([[4, 'park', 'c'],
[5, 'oh', 'c'],
[6, 'ju', 'c']],
columns = ['id', 'name', 'grade'])
df_result = pd.concat([df_1, df_2], axis = 1)
print(df_result)
행이 맞지 않으면 Nan 으로 채워지는 것을 알 수있다.
'Programming Language > Python' 카테고리의 다른 글
[python] 판다스 데이터프레임 이미지로 저장하는 방법 (0) | 2022.01.28 |
---|---|
[python] 열을 기준으로 판다스 데이터프레임 병합하는 방법 (0) | 2022.01.28 |
[Anaconda] 아나콘다로 파이썬 3.6 가상환경 만들기 (0) | 2021.09.16 |
[Anaconda] 아나콘다 버전 업데이트하기 (0) | 2021.09.16 |
[Anaconda] 아나콘다 나의 가상환경 확인하기 (0) | 2021.09.16 |