본문 바로가기

전체 글

(10)
단순선형회귀분석과 보스턴 집값 데이터(2) 자 이제 주어진 정제된 데이터 중 방의 수와 집값의 관계를 알아보도록 하겠다. 표에 나와있는 숫자들들 일일이 비교하기에는 시간도 너무 많이 걸리고 직관적이지 않다. 일일이 비교하면 파이썬을 사용하는 의미가 없다. 방의 수와 집값이 어떤 관계가 있는지 알아보기 위해 산점도를 그려보도록 하겠다. 산점도는 서로 다른 수 변수 사이의 관계를 보여준다. 산점도를 그리기 위해 plot() 메서드를 사용한다. ( ) 안에 그래프의 종류, x 축의 값, y 축의 값, 크기, 점 색깔 등을 넣어주면 된다. 어느 정도 양의 관계가 있는 것처럼 보이는데 자세히 보면 소수의 랜덤한 값들이 있는 것을 알 수가 있다. 보기에도 안 좋고 상관관계를 분석하는데 잘못된 영향을 끼칠 수 있기 때문에 삭제해 준다. 참고로 아래 그림은 g..
단순선형회귀분석과 보스턴 집값 데이터(1) 정의 회귀분석이란 간단히 말해 데이터의 관계성을 기술하는 것, 다시 말해 하나의 변수로 다른 변수의 값을 예측하거나 설명하는 것이다. 통계학의 자료 분석 방법 중 하나이다. 하나의 종속변수에 독립변수가 하나라면 단순회귀분석, 하나의 종속변수에 둘 이상의 독립변수를 다중회귀분석이라고 한다. 파이썬에서는 대표적으로 sklearn(scikit-learn) 패키지에서 선형회귀분석을 위한 함수(Linear Regression)를 제공한다. 회귀분석을 통해 다음 세가지를 알 수 있다. 1. 종속변수와 독립변수 간에 선형관계 존재 여부 2. 종속변수에 영향을 미치는 독립변수가 유의한지와 영향력의 정도 3. 추정된 회귀모형을 통한 종속변수의 예측치 종속변수: 서로 관계를 주고 받는 둘 또는 그 이상의 변수중에는, 다른..
가산금리(Spread) 정의 가산금리란 기준금리에 신용도 등에 차이에 따라 덧붙이는 추가적인 금리이다. 은행에서 고객들에게 대출을 해줄 때 고객의 신용등급에 따라 위험도가 달라진다. 즉, 고객의 신용도에 따라 은행이 감수해야 하는 위험이 달라지기 때문에 신용도가 낮은 고객에게는 기준금리에 추가적인 금리인 가산금리를 덧붙여 대출을 해준다. 신용등급 뿐만 아니라 만기의 길이에 따라 위험도가 달라지기도 한다. 만기가 길어질 수록 은행은 더 큰 위험을 감수해야 하기 때문에 가산금리를 측정하는데 이를 기간 가산금리(Term Spread) 라고 한다. 채권 시장에서는 비교대상이 되는 금융상품과 기준금리의 차이를 스프레드라고 한다. 일반적으로 해외에서 채권을 발행할 때는 동일한 만기의 미국 국채나 리보(LIBOR)가 기준금리가 된다. 예시..