By far the simplest and quickest method for determining a straight line is to choose the line that can best be drawn by eye. Although this method often paints a reasonably good picture, it is extremely subjective and imprecise and is worthless for statistical inference. We now consider two analytical approaches for finding the best-fitting straight line. 

1. The Least-squared Method

The least-squared method determines the best-fitting straight line as the line that minimizes the sum of squares of the lengths of the vertical-line segments drawn from the observed data points on the scatter diagram to the fitted line. The idea here is that the smaller the deviations of observed values from this line ( and consequently the smaller the sum of squares of these deviations), the closer or "snugger" the best-fitting line will be to the data.

2. The Minimum-Variance Method

The minimum-variance method is more classically statistical than the method of least squares, which can be viewed as a purely mathematical algorithm. In this second approach, determining the best fit becomes a statistical estimation problem. The goal is to find point estimators of Beta(zero) and Beta(1) with good statistical properties. In this regard, under the previous assumptions, the best line is determined by the estimators Beta(zero) and Beta(1) that are unbiased for their unknown population counterparts Beta(zero) and Beta(1), respectively, and have minimum variance among all unbiased (linear) estimators of Beta(zero) and Beta(1).

*Fortunately, both the least-squares method and the minimum-variance method yield exactly the same solution, which we will state without proof. 

posted by sergeant


The general problems to be discussed: we have one response variable Y and a set of k predictor variables X1, X2, X3...Xk; and we want to determine the best subset of the k predictors and the corresponding best-fitting regression model for describing the relationship between Y and the X's. What exactly we mean by "best" depends in part on our overall goal for modeling.

One goal is to find a model that provides the best prediction of Y, given X1,X2, ..., Xk, for some new observation or for a batch of new observations.

Alongside the question of prediction is the question of validity- that is, of obtaining accurate estimates for one or more regression coefficient parameters in a model and then making inferences about these parameters of interest. The goal here is to quantify the relationship between one or more independent variables of interest and the dependent variable, controlling when necessary for other variables.

<Steps in Selecting the Best Regression Equation: Prediction Goal>

1. Specify the maximum model (defined in Section 16.3) to be considered.

2. Specify a criterion for selecting a model.

3. Specify a strategy for selecting variables.

4. Conduct the specified analysis.

5. Evaluate the reliability of the model chosen.

By following these steps, one can convert the global goal of finding the best predictors of Y into simple, concrete actions. Each step helped to ensure reliability and to reduce the work required.

- Recall that overfitting a model (including variables in the model with truly zero regression coefficients in the population) will not introduce bias when population regression coefficients are estimated if the usual regression assumptions are met. We must be careful, however, to ensure that overfitting does not introduce harmful collinearity (ch. 14). Underfitting (i.e. leaving important predictors out of the final model), however, will introduce bias in the estimated regression coefficients.


posted by sergeant

[05/02/2019] The end of the 1st year

미국유학/유학생활 2019. 5. 3. 10:33

오늘, 목요일은 annual review가 있는 날이었다.
예상대로(?) 순탄하게 잘 지나갔다.
금주 화요일에 첫 IRB approval도 받고 ㅎㅎ 
리뷰 때 I got IRB approval on Tuesday! 이야기를 하니까 교수들이 자기네도 (아직까지도) approval 받으면 달력에 표시해 놓는다고 ㅋㅋㅋ
아주 supportive한 분위기였고, 지도 교수도 꽤나 만족하는 눈치였다.

이렇게 마음이 붕 뜰 줄 알았던건지,
두개의 final paper를 많이 진행시켜 두었는데 그게 천만 다행이다 싶을 만큼
집중이 안 된다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
다음 주 월요일에 통계시험도 봐야하고,
화요일에는 다음학기에 시작할 practicum site 인터뷰도 가야해서
아직 헤이해지기에는 좀 막판 스퍼트가 필요한데
나도 사람인지라.... ㅋㅋ 오늘 하루종일 맛있는거 챙겨먹고,
집에선 도저히(!!) 안 될 것 같아 오피스에 죽치고 있다.
그런데도 여전히 마음은 둥둥 떠다닌다.

오늘로서 이번학기 시작했던 상담도 끝났다.
사실 오늘이 마지막 세션인걸 깜빡할 뻔 했을만큼 마음을 놓고 있었는데
세션에 가서는 상담사한테 고마운 마음을 많이 전할 수 있어서 좋았다.

상담사가 그동안 나와 함께 작업하며 좋았다고 얘기해주고,
또 내가 상담사 본인에게 많은 영향을 주었다고 말해 준 부분에서 많이 놀랐다.
상담사도 international student인데 자기는 이제껏
자신을 포함한 international의 suffering을 당연하게 생각했던 것 같다고,
근데 내가 그렇지 않은, international도 건강하게 생활할 수 있다는 표본의 증인이라고 얘기해줘서
약간 헉 싶기까지 했다 ㅋㅋㅋㅋ (그 정도의 감상을 바란 것은 아니었는데!!ㅋㅋ)
그정도로 나를 의미 있게 만들어 주어서 고마웠다.

결정적으로, 나는 아주 강한 사람이고, 자원이 많고, 앞으로 어떤 일이 닥치든
그 사건들을 잘 handling 할 수 있다는데 의심이 없다고 상담사가 말하는데
그 말을 들으며 나도 감정이 아주 많이 올라왔다.
그 자리에서 새로운 주제를 시작할 수가 없어서, 그냥 삼킨 말이지만
나는 내가 강한 사람이라는 것을 알고 있으면서도, 한편으로는
나에게 아주 큰 시련이 닥친다면 내가 그걸 이겨낼 수 있을지에 대한 자신감이 없기도 했었다.
어릴 때부터, 남들은, 혹은 드라마에서의 주인공들은 다 역경을 뚫고 성장하는데
나는 부모님의 도움을 많이 필요하다는, 그런 이상한 열등감이 있었다.
지금 생각해보면 그것 또한 특권인데, 어린 내 마음에는 그 부분이 내내 걸렸다는 생각이 든다.
나는 역경을 뚫고 성장하는 주인공 서사를 쓸 수 있을까? 약간 캔디같은? 그런 질문에
솔직히 나는 역경이 무서웠고, 피하고만 싶었고, 평탄한 성공가도의 삶만 살고 싶다고 생각했었다.
근데 그런 내 깊은 속마음, 정확히 말하자면 상담에서는 다루지 않았던 나의 중요한 이슈를
나와 함께 작업했던 소감에 대해 이야기 하면서 꺼내준 상담사에게
많이 고맙다는 마음이 들었다.

그리고 돌이켜보니 나는 정말로 강해졌구나 나는 더이상 어리지 않은, 강한 사람이구나, 라는것을
진심으로 받아들일 수 있었다. 마음 속에 그 느낌이 깊이 간직 될 것 같다.

그리고 또, 내가 이렇게 깊이 있는 대화를 할 수 있는 관계를 아주 많이 그리워 했구나를
새삼 다시 그 자리에서 깨닫게 되었다.

헤어짐이 아쉽다고 눈물을 흘리는 상담사를 보면서,
내가 상담을 하고, 의식적으로는 상담의 힘을 믿는다고 했으면서도
진짜로 상담의 중요성을 믿고 있는 사람이었던가를 돌아보게 되었다.
나는 내 내담자들에게 저렇게 진심으로 대했을까?
순간순간 최선을 다하고 나름 진심을 다 했었지만,
헤어짐을 진심으로 아쉬워하고 그 사람의 가는 길을 empowering 해 줬었는지
혹시 반쯤만 채운 진심을 가지고 나를 좋은 상담사로 포장하는 것이 주된 목적은 아니었는지.
내 상담사로부터 느낀 깊은 애정이 나를 부끄럽게 했다.
진심은 전해지는 거니까.

판단하지 않고 그 자리에 있어주는 사람.

나의 복지를 가장 우선으로 생각해 주는 사람.

그리고 무엇보다 내 말을 잘 듣고 이해하려 귀 기울여 주는 사람.

누군가에게 나도 그런 상담사가, 그리고 다른 측면에서는 그런 친구가 되고 싶다.

돌이켜보면, 학기를 시작하면서는 악에 받쳐 있었던 부분이 있었지 않았나 싶다.
교회에서 환멸을 느끼고, 진절머리 나는 관계도 있고.
그렇지만 상담을 포함한 아주 많은 요인들이
나를 지탱해 주었고, 이까지 잘 이 끌어 주었다고 생각한다.

우연히 보았던 다큐멘터리, 완벽하진 않더라도 같이 공부하는 사람들, 두주에 한번 약속을 잡아 방향을 정하고 지도해 주었던 지도교수님, 한국에 있는 친구들, 그리고 나의 든든한 버팀목인 배우자, 또 내가 하는 공부 그 자체.
그리고 이 곳에서 내 목소리가 중요하다는 느낌. 그런 것들이 나를 소생하게 만든다.

일 년 참 잘 보냈다. 다가올 방학도, 그리고 다음 한 해도 아주 많이 기대된다.



posted by sergeant