PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUANNHƯ VẬY, DẤU CỦA HỆ SỐ TƯƠNG QUAN R PHỤ...

Bài 4: Phân tích hồi quy và tương quan

Như vậy, dấu của hệ số tương quan r phụ thuộc vào dấu của hệ số b

1

vì phương sai

luôn mang dấu dương.

Các tính chất của hệ số tương quan: Miền xác định: –1 ≤ r ≤ 1.

o r > 0: Mối liên hệ tương quan tuyến tính thuận.

o

r < 0: Mối liên hệ tương quan tuyến tính nghịch.

o

r = ± 1: Mối liên hệ hàm số hoàn toàn chặt chẽ.

o

r = 0: Không có mối liên hệ tương quan tuyến tính giữa x và y.

o

r càng gần 1: Mối liên hệ càng chặt chẽ (cường độ mối liên hệ).

o r 0,9: Mối liên hệ rất chặt chẽ.

o 0,7 r 0,9: Mối liên hệ tương đối chặt chẽ.

o 0,5 r 0,7: Mối liên hệ bình thường (trong dự đoán thường không sử dụng r

này đối với tiêu thức số lượng nhưng với tiêu thức thuộc tính thì vẫn sử dụng).

o r < 0,5 : Mối liên hệ hết sức lỏng lẻo.

Vận dụng vào ví dụ trên, ta có:

y 2y

y

2

y

2

87,390 8,864

2

2,97

r = (–2,03) 1,353

2,97 = – 0,925

Kết luận: Mối liên hệ giữa số năm sử dụng và giá bán xe Honda Wave cũ là mối liên

hệ tương quan tuyến tính nghịch và rất chặt chẽ.

4.2.1.3. Hệ số xác định

Khái niệm: Hệ số xác định dùng để đánh giá sự phù hợp của mô hình, nó cho biết tỷ

lệ % thay đổi của y được giải thích bởi mô hình.

Ở ví dụ trên, ta có: r

2

= (– 0,925)

2

= 0,8556.

Như vậy, 85,56% sự thay đổi của giá bán xe máy Honda Wave cũ được giải thích bởi

mô hình đã nói ở trên trong mối quan hệ với số năm sử dụng. Điều đó nói lên rằng, số

năm sử dụng là hoàn toàn hữu ích khi dự đoán mức giá bán của một chiếc xe cũ.

4.2.1.4. Kiểm định các tham số của phương trình hồi quy tuyến tính đơn

Trong mối liên hệ tương quan giữa x và y, cứ mỗi giá trị của x ta có thể thu được

nhiều giá trị của y. Khi đó, chúng ta phải có một số giả định sau:

o Đường hồi quy tổng thể chung: với phương trình tuyến tính yˆ x =

0

+

1

x, thì mỗi

giá trị của x sẽ có nhiều giá trị tương ứng của y, khi đó số bình quân của các giá trị

này sẽ nằm trên một đường thẳng. Đường thẳng đó gọi là đường hồi quy tổng thể

chung và phương trình của nó là phương trình hồi quy tổng thể chung.

o Độ lệch tiêu chuẩn: độ lệch tiêu chuẩn của tổng thể chung gồm các giá trị y

tương ứng với một giá trị cụ thể của x là như nhau, bất kể x là bao nhiêu.

o Phân phối chuẩn: với một giá trị của x, tổng thể chung gồm các giá trị y tương

ứng có phân phối chuẩn.

Nói cách khác, các giả định trên cho rằng, nếu có các tham số không đổi là

0

,

1

và thì với mỗi giá trị của x, tổng thể chung gồm các giá trị của y tương ứng sẽ

có phân phối chuẩn với số bình quân là

0

+

1

x và độ lệch tiêu chuẩn .

Kiểm định hệ số hồi quy của phương trình tuyến tính đơn: Bài toán đặt ra như sau:

Giả sử, phương trình hồi quy tuyến tính đơn yˆ x =

0

+

1

x, biểu diễn mối liên hệ phụ

thuộc giữa tiêu thức nguyên nhân x và tiêu thức kết quả y. Từ phương trình đó,

chúng ta cho rằng có thể dùng x để dự đoán giá trị của y. Nhưng có thật sự là như

vậy hay không?

Chúng ta đã biết, trong mô hình hồi quy, hệ số hồi quy thể hiện mối liên hệ giữa x

và y, nó cho biết ảnh hưởng trực tiếp của nguyên nhân x đến kết quả y. Chính vì

vậy, để trả lời câu hỏi trên, người ta thực hiện kiểm định hệ số hồi quy của phương

trình tuyến tính đơn.

Trình tự thực hiện kiểm định như sau:

o

Bước 1: Phát biểu giả thiết không và giả thiết đối của nó.

Giả thiết không là: H

0

:

1

= 0 (x không có mối liên hệ với y)

o Bước 2: Xác định mức ý nghĩa α (với 1 – α là hệ số tin cậy).

o Bước 3: Chọn tiêu chuẩn kiểm định và tính giá trị của tiêu chuẩn kiểm định từ

mẫu quan sát.

Trên thực tế, các giá trị

0

,

1

và là không biết nhưng chúng ta có thể ước lượng được

qua một mẫu cụ thể.

Giả sử rằng với một mẫu cụ thể, chúng ta xác định được phương trình hồi quy mẫu

với hệ số hồi quy là b

1

, b

1

có phân phối chuẩn với số bình quân

b

1

1

và độ lệch

tiêu chuẩn S

b

. Khi đó, biến ngẫu nhiên chuẩn hoá z cũng có phân

(x

i

1

x)

2

phối chuẩn.

z b

1 1

S

b

1

Nhưng trong phương trình trên, chúng ta chưa biết , nên có thể dùng sai số tiêu

chuẩn S (y

i

x

)

2

của mẫu để thay thế. Khi đó, biến ngẫu nhiên kết quả

e

n 2

có phân phối t-student với bậc tự do df = n – 2.

t b

1 1

S

e

(x

i

x)

2

Với giả thiết không H

0

:

1

= 0, tiêu chuẩn kiểm định là:

t b

1S

e