본문 바로가기

회귀분석

[회귀분석] 3. [R] 추정된 회귀직선의 신뢰구간, 예측구간

반응형

## 작성일: 2017.11.28

## 작성자: 춤추는 초코칩

## 참고문헌: R 실습으로 배우는 통계적 방법(2016, 박진표)

## 9장 회귀분석

## 9.1 단순선형회귀분석


## 데이터

year <- c(26,16,20,7,22,15,29,28,17,3,1,16,19,13,27,4,30,8,3,12)

annual_salary <- c(1267,887,1022,511,1193,795,1713,1477,991,455,324,944,1232,808,1296,486,1516,565,299,830)

Data <- data.frame(year,annual_salary)

summary(Data)


## 회귀직선의 추정량

predict함수로 주어진 근무연수에 대한 연봉 값을 얻을 수 있다.

LSE <- lm(annual_salary~year, data=Data)

predict(LSE)


## 새로운 x의 예측값

10년 근무자는 연봉이 평균적으로 681.5996으로 예측되었다.

new_observation <- data.frame(year=c(10,20,30,40))

Predict <- predict(LSE, new_observation)

Predict


## 신뢰구간

근무연수가 10년인 사람의 평균 연봉에 대한 95% 신뢰구간은 (632.0645, 731.1348)이다.

CLM <- predict(LSE, new_observation, interval="confidence")

CLM


## 예측구간

근무연수가 10년인 사람의 새로운 연봉에 대한 95% 예측구간은 (488.1303, 875.0689)이다ㅏ.

PLM <- predict(LSE, new_observation, interval="prediction")

PLM


## 도식화

근무연수 1~40년까지에 대한 신뢰구간과 예측구간을 연결하여 그린 그림

new_obs <- data.frame(year=c(1:40))

CLM <- predict(LSE, new_obs, interval="confidence")

PLM <- predict(LSE, new_obs, interval="prediction")

matplot(new_obs$year, cbind(CLM, PLM[,-1]), lty=c(1,2,2,3,3), type="l", ylab="predict y")


반응형

'회귀분석' 카테고리의 다른 글

[회귀분석] 2. [R] 회귀계수의 추론  (0) 2017.11.26
[회귀분석] 1. [R] 단순회귀분석  (0) 2017.10.31