부동산 뉴스와 아파트 매매가격과 거래량 간의 관계에 대한 빅데이터 시계열 분석(2020, 전해정)

2022. 12. 7. 19:57연구 동향

부동산 뉴스와 아파트 매매가격과 거래량 간의 관계에 대한 빅데이터 시계열 분석(2020, 전해정)

  • 키워드: 부동산 뉴스, 아파트 매매가격, 아파트거래량, 빅데이터, 벡터자기회귀모형

개요

뉴스보도는 소비자의 성향이나 태도에 영향을 주는 프레임 효과(frame effect)를 가지고 있다. 아파트가격과 아파트거래량에 미치는 영향을 벡터자기회귀모형(VAR)을 이용해 실증적으로 밝혀내는 것을 목표로 한다. 이를 위해 종속변수를 아파트 매매가격, 아파트거래량으로 설정하고, 설명변수로는 '상승' 관련 기사 수 및 '하락' 관련 기사 수를 설정하여 부동산 뉴스와 아파트 매매가격 및 아파트 거래량에 미치는 영향을 분석하였다.

실중분석 결과,

  • 아파트거래량과 아파트매매가격은 서로 양(+)의 영향,
  • 아파트 하락 관련 기사는 아파트거래량, 아파트매매가격에 음(-)의 영향,
  • 아파트 상승 관련 기사는 아파트거래량, 아파트매매가격에 양(+)의 영향을

을 미치는 것으로 나타났다. 또한 아파트매매가격이 차지하는 설명력이 아파트거래량보다 높은 것을 확인하였다.

 

 

목차

  1. 서론
  2. 선행연구 고찰
  3. 실증분석: 자료설명, 단위근 검정, 최적시차결정, 그랜져 인과관계 검정, 충격반응분석, 분산분해분석
  4. 결론

선행연구 고찰
  • 주택시장 뉴스, 소비심리, 가격, 거래량의 관계(임재만 외 1인, 2017): 주택뉴스보도 및 주택가격이 거래량에 영향미침.
  • 경제뉴스와 부동산 시장의 관계에 관한 빅데이터 시계열 분석(김선우, 2018): 상승/하락 부동산 뉴스 크롤링 DB 구축
  • 선행 연구 보완: 부동산뉴스 관련 자료를 상승/하락으로 세분화하여 분석함. 

 

 

실증분석 
  • 독립변수: 언론보도량, 상승 뉴스('서울' & '아파트' & '상승' 키워드 조합) 생산량(X1), 하락 기사('서울' & '아파트' & '하락' 키워드 조합) 생산량(X2)
  • 종속변수: 서울시 월별 아파트매매가격(Y1), 서울시 월별 아파트거래량(Y2)
  • 분석기간: 2010년 1월 ~ 2019년 12월

 

 

VAR 모형 

내생성 문제를 고려하여 도구변수(IV)를 넣어 VAR 모형으로 영향을 분석했다. 

 

 

단위근 검정

시계열 자료들의 안정성 확보를 위해 1차 차분변수의 단위근 존재 여부를 확인하기 위해 ADF 테스트, PP테스트 이용.

PP테스트에서 상수항 포함 모형에서 단위근이 발견됨. 

상수항을 제외한 로그 차분에선 단위근이 없는 것으로 나타났으므로, 로그 1차 차분을 하여 시계열로 변환 

<표 3> 단위근 검정결과

 

 

VAR 시계열 모형의 최적 시차

일반적인 (외생, 내생 전부 포함) k개의 변수에 대한 y1 ~ yk까지 각각 VAR 모형

  • 최적 시차란, 어느 시점의 과거의 정보(t, ... , t - R)까지 활용하는 게 유의미한지를 판단하는 것임.
  • AIC 기준 시차 8기, SIC 기준 시차 2기가 적합한 것으로 나타남.
  • 시차가 증가하면 도구변수(IV)의 숫자가 증가하므로 분석의 효율성을 위해 시차를 2기로 설정함. 
  • 따라서, R=2

 

 

그랜져 인과관계 테스트

  • 서울시 월별 아파트매매가격(Y1), 서울시 월별 아파트거래량(Y2), 상승 기사수(X1), 하락 기사수(X2)
  • 가격 - 거래량 인과관계
    • ΔY1 → ΔY2
  • 상승 기사수 인과관계
    • ΔY1 → ΔX1
    • ΔX1 → ΔY2
  • 하락 기사수 인과관계
    • ΔX2 → ΔY1
    • ΔY1 → ΔX2
    • ΔX2 → ΔY2

 

 

충격반응함수

  • 가격 - 거래량 충격 영향
    • 상승기) ΔY1 → ΔY2: 음(-)의 반응, 5개월 후 영향 소멸
    • 하락기) ΔY2 → ΔY1: 양(+)의 반응, 10개월 후 영향 소멸 
  • 상승 기사수 충격 영향
    • ΔX1 → ΔY2: 양(+)의 반응
    • ΔY1 → ΔX1: 양(+)의 반응, 10개월 뒤 영향 소멸
    • ΔY2 → ΔX1: 음(-) → 양(+)  음(-), 6개월 뒤 영향 소멸

  • 하락 기사수 충격 영향
    • ΔX2 → ΔY1: 음(-)의 반응, 효과 서서히 소멸
    • ΔX2 → ΔY2: 음(-)의 반응, 크지 않음. 
    • ΔY1 → ΔX2: 음(-)의 반응
    • ΔY2 → ΔX2: 음(-)의 반응

 

 

예측 오차의 분산분해 결과

  • 상승 / 하락 기사수 모두 주택가격(Y1)에는 영향을 주는 것으로 나타남.
  • 상승기: 아파트거래량과 아파트매매가격은 서로 양(+)의 영향임.
  • 하락기: 아파트매매가격과 아파트거래량에 음(-)의 영향임. 
  • 주택가격(Y1)이 거래량(Y2)에 가장 큰 영향을 가지고 있음. 즉, 가격이 변하는 것에 따라 거래량이 늘고 줄고 한다는 것임.

 

 

한계
  • 월별 거래량 데이터 노이즈: 월별 거래량 데이터에는 절별 / 주기별 영향 변수(예: 추위, 설 또는 추석, 결혼식 등)가 있을 수 있음. 이런 월별 요인을 통제하기 위한 데이터 전처리가 없으므로, 노이즈가 발생 가능성 높음.   
  • 변수누락 문제: '정부 정책발표'라는 잠재 요인(Hidden variale)이 있으며 이는 기사량, 주택가격, 거래량 모두에 유의미한 영향을 줌. 이로 인해 변수 누락(omitted variable problem)이 발생함. 
  • 동시성 문제(Simultaneity): 주택가격의 상승, 거래량의 상승은 그 자체로 뉴스 생성에 영향을 줌. 즉, 상호인과관계가 존재하는 내생성 문제가 있음. 수요-공급의 문제처럼 닭이 먼저냐, 달걀이 먼저냐와 같은 동시성의 문제를 내재하고 있음. → 이를 고려하기 위해 매매가격수익률, 거래증가율 이라는 내생 변수(Y_t-1)를 추가함.