안녕하세요.
오늘은 모두다 한번즈음 궁금해 하셨을법한 같은 도로명코드인 경우 층과 실거래가와의 상관관계가 있는지 분석해 보았습니다.
결과는 "층과 실거래가는 상관관계가 낮다" 였습니다.
단, 동일 층에 대한 거래가 많은 data로 분석하면 다를 것으로 예상됩니다.
(ex 헬리오시티와 같은 대단지)
다음번엔 대단지 위주의 데이터로만 분석해보겠습니다.
1. 먼저 제가 올린 글중에 아래 글을 참고하여, 엑셀로 종로구 실거래가 정보를 저장합니다.
- https://funscientist.tistory.com/29
공공데이터 Rest API 활용팁(부동산,정책 등)
안녕하세요. 현재 개발하고 있는 솔루션 중에 정책보고서의 특정 키워드 data를 파싱하고 분석하고있습니다. 아래 방법을 참고하시어 활용하세요~ 1. https://www.data.go.kr/ 접속 2. 필요한 데이터셋
funscientist.tistory.com
2. 위 코드에서 "도로명코드"를 추가합니다.
- 도로명코드 = item.find('도로명코드').text if item.find('도로명코드') else None
3. 같은 도로명코드일 경우에 층별로 평당_거래금액과의 상관관계를 도식화 합니다.
도로명코드가 같은 경우의 층과 평당 거래금액의 상관관계: 0.10745411874242669
예상은 도로명코드가 같을 경우 상관관계가 최소 0.4 이상일거라 생각했지만 너무 낮았습니다.
혹시 동일 년도 기준이 아니어서 그런가 해서
4. 같은 도로명코드, 연도 일 경우에 층별로 평당_거래금액과의 상관관계를 도식화 합니다.
동일 연,월,도로명코드인 경우의 층과 평당 거래금액의 상관관계: 0.01561240626807872
오히려 상관관계가 더 낮게 나옵니다.
5. 층별 평당 거래금액을 평균값, 중앙값 2개로 나누어 표시 해봅니다.
평균값, 중앙값 모두 큰 영향은 없네요.
6. 코드
import pandas as pd
import matplotlib.pyplot as plt
# 엑셀 파일 읽기
df = pd.read_excel('realestate_with_road_code.xlsx')
# 동일 연,월,도로명코드인 경우만 필터링
df_same_month_road_code = df[df.duplicated(subset=['년', '월', '도로명코드'], keep=False)]
# 평당 거래금액과 층 간의 상관관계를 계산
correlation_same_month_road_code = df_same_month_road_code['층'].corr(df_same_month_road_code['평당_거래금액'])
# 시각화: 층과 평당 거래금액 간의 관계 그래프
plt.figure(figsize=(8, 6))
plt.scatter(df_same_month_road_code['층'], df_same_month_road_code['평당_거래금액'], alpha=0.5)
plt.xticks(range(int(df_same_month_road_code['층'].min()), int(df_same_month_road_code['층'].max()) + 1)) # x축 단위를 1층 단위로 설정
plt.title('층과 평당 거래금액의 상관관계 (동일 연,월,도로명코드)')
plt.xlabel('층')
plt.ylabel('평당 거래금액')
plt.grid(True)
plt.show()
print(f"동일 연,월,도로명코드인 경우의 층과 평당 거래금액의 상관관계: {correlation_same_month_road_code}")
감사합니다.
'경제분석' 카테고리의 다른 글
태영건설68 채권에 대한 회수율 예측 (0) | 2024.02.28 |
---|---|
채권가격과 수익률 간의 관계(2008 금융위기를 사례로 분석) (0) | 2024.02.27 |
GDP와 환율간의 연관성 분석 (0) | 2024.02.12 |
아파트 가격은 금리, 통화량 중 어떤게 더 크게 작용할까? (0) | 2024.02.10 |
금리와 소고기 가격간의 상관관계 (0) | 2024.02.10 |