< 문제 출처 >
이공학도를 위한 확률과 통계 3판 한글판
[ 문제 ]
큰 규모의 컴퓨터 시스템을 설치하는 동안 어떠한 특정 작업, 그 중에서도 프로그램을 바꾸는 것이 얼마나 오래 걸리는지 아는 것이 유용하다. 이와 같은 작업이 걸리는 시간을 정확히 아는 것은 효과적인 계획과 설치 작업을 위한 중요한 요소이다. DS 12.2.5 의 데이터 집합은 전문가가 예측한 수행 시간과 실제로 걸린 시간 자료이다.
1. 데이터를 입력하고 선형 회귀 모형 구하기
> raw_datas <- read.table("ds12.2.5-computer-system-management.txt", header=T)
> lm2 <- lm(ActualTime~EstimatedTime, data=raw_datas)
> summary(lm2)
Call:
lm(formula = ActualTime ~ EstimatedTime, data = raw_datas)
Residuals:
Min 1Q Median 3Q Max
-6.2801 -1.8631 -0.3749 0.8751 8.9582
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.9112 1.7598 -1.086 0.286
EstimatedTime 1.6191 0.2829 5.723 3.03e-06 ***
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.544 on 30 degrees of freedom
Multiple R-squared: 0.5219, Adjusted R-squared: 0.506
F-statistic: 32.75 on 1 and 30 DF, p-value: 3.034e-06
B0 = -1.9112
B1 = 1.6191
y = -1.9112 + 1.6191x
standard error = 3.544
2. 추정된 시간이 1 시간 증가할 경우 실제 작업 시간은 얼마나 증가할 것인가? 이 전문가는 작업 시간을 과소평가했는가? 혹은 과대평가했는가? 만약 추정된 시간이 7 시간일 때 실제 소모될 시간은 얼마인가?
> predict(lm2, newdata=data.frame(EstimatedTime=7))
1
9.422709
추정된 시간이 1시간 증가할 경우
1.6191 x 1 = 1.6191
시간만큼 증가
추정된 시간이 7시간일 때
-1.911 + ( 1.6191 x 7 ) = 9.42
3. 추정된 시간이 15 시간일 경우 이 모델은 실제 필요한 시간에 대해서 어떠한 정보를 주는가?
> predict(lm2, newdata=data.frame(EstimatedTime=15))
1
22.3757
-1.911 + ( 1.6191 x 15 ) = 22.3755
시간이 실제로 소모된다고 추정할 수 있으나 extrapolation될 경우 정확하지 않은 수치입니다.
4. 오차 분산의 추정치를 구하라.
> anova(lm2)
Analysis of Variance Table
Response: ActualTime
Df Sum Sq Mean Sq F value Pr(>F)
EstimatedTime 1 411.26 411.26 32.748 3.034e-06 ***
Residuals 30 376.74 12.56
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(standard error)^2 = (3.544)^2 = 12.56
'About Data > R' 카테고리의 다른 글
[R Studio][12.6.9][DS12.2.5] R에서 분산분석표 도출 및 결정계수 구하고 p-value 해석하기 (0) | 2020.11.20 |
---|---|
[R Studio][12.2.9][DS12.2.6] R에서 선형회귀모형을 구하고 여러 예측값 구하기 (0) | 2020.11.20 |
[R Studio][12.4.4][DS12.2.1] R에서 파일로부터 데이터를 읽고 95% 신뢰구간 구하기 (0) | 2020.11.20 |
[R Studio][12.2.4][DS12.2.1] R에서 선형회귀모형을 구하고 여러 예측값 구하기 (0) | 2020.11.18 |
[R Studio][8.2.29][DS8.2.1] R에서 표본 평균, 표본 표준편차 구하여 t분포 기준 p-value 구하기 (0) | 2020.11.03 |