Bài 3: Kiểm định giả thiết bằng p-value

Nội dung bài giảng Lý thuyết xác suất thống kê Bài 3: Kiểm định giả thiết bằng p-value sau đây sẽ giúp các bạn tìm hiểu về giả thiết bằng p-value gồm có ví dụ chứng minh cụ thể. Mời các bạn cùng eLib tham khảo!

Bài 3: Kiểm định giả thiết bằng p-value

Thủ tục kiểm định trình bày ở trên có tính chất truyền thống và theo cách tiếp cận cổ điển. Trong những năm gần đây, nhiều nhà nghiên cứu thường sử dụng một cách tiếp cận khác. Thay vì kiểm định giả thiết với một giá trị \(\alpha\) định trước thì họ cho rằng ta nên định rõ các giả thiết H0 và H1, sau đó thu thập số liệu mẫu và tính giá trị của tiêu chuẩn kiểm định. Từ đó có thể xác định được xác suất mắc phải sai lầm loại I nếu ta bác bỏ giả thiết H0. Xác suất này thương được gọi là giá trị p (p-value) của kiểm định.

Chúng ta sẽ minh họa cách tính p-value qua thí dụ sau:

Thí dụ: Trọng lượng của những con gà khi xuất chuồng là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 0,32. Trước đây trọng lượng trung bình khi xuất chuồng của một con gà ở trại chăn nuôi này là 3,4 kg. Năm nay người ta áp dụng thử một phương pháp chăn nuôi mới. Sau một thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con đem cân và tính được trung bình mẫu là 3,5 kg. Hãy cho biết phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng của gà khi xuất chuồng hay không ?

a. Hãy xác định p-value của kiểm định ?

b. p-value sẽ thay đổi như thế nào nếu trung bình mẫu không phải là 3,5 mà là 3,6 ?

Giải:

a) Gọi \(\mu\) là trọng lượng của một con gà khi xuất chuồng của trại chăn nuôi sau khi áp dụng phương pháp chăn nuôi mới (\(\mu\) chưa biết). Ta cần kiểm định giả thiết:

\({H_0}:\mu = 3,4;{H_1}:\mu > 3,4\)

Đây là bài toán kiểm định giả thiết về trung bình tổng thể (kiểm định giả thiết một phía), \({\sigma ^2}\) chưa biết.

Từ các giả thiết của bài toán, ta tính được giá trị của tiêu chuẩn kiểm định :

\(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,5 - 3,4)\sqrt {50} }}{{0,32}} = 2,21\)

p-value của kiểm định (tức là xác suất mắc phải sai lầm loại 1 nếu ta bác bỏ giả thiết H0) chính là : P(Z > 2,21)

Để tính xác suất này ta có thể dùng bảng hàm Laplace hoặc dùng hàm NORMSDIST trong Excel.

  • Nếu dùng bảng hàm Laplace thì:

\(p - value = P\left( {Z > 2,21} \right) = 0,5 - {\rm{ }}\varphi (2,21) = 0,5 - 0,48645 = 0,01355\)

  • Nếu dùng hàm NORMSDIST thì:

\(p-value = P(Z > 2,21) = 1- NORMSDIST(2,21) = 0,01355\)

Ta có thể minh họa giá trị p-value trên đồ thị như sau:

Như vậy, với mẫu đã cho ở thí dụ này, nếu ta bác bỏ giả thiết H0, tức cho rằng việc áp dụng phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng trung bình của gà khi xuất chuồng thì khả năng mắc phải sai lầm loại 1 là 0,01355 (hay 1,355%).

Nếu trung bình mẫu là 3,6 , tức \(\overline X = 3,6\), khi đó ta tính được:

\(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,6 - 3,4)\sqrt {50} }}{{0,32}} = 4,419\)

Khi đó ta có:

p-value = P(Z > 4,419) = 1-NORMSDIST(4.419) = 4.962E-06.

4.962E-06 = 4,962x 10-6 = 0,000004962 < 0,00001. Tức p-value ứng với z = 4,419 rất nhỏ (có thể coi bằng 0 nếu là lấy 5 số thập phân).

Như vậy p-value càng nhỏ thì mức độ khẳng định của mẫu về việc bác bỏ giả thiết H0 càng rõ rệt hơn, nói cách khác, giả thiết H0 càng kém tin cậy hơn. Chẳng hạn p-value = 0,01 cho thấy mức độ khẳng định để bác bỏ giả thiết H0 càng rõ ràng hơn so với giá trị p-value = 0,1.

Ở trên là p-value trong kiểm định một phía (phía bên phải). Nếu kiểm định già thiết về phía bên trái hoặc kiểm định giả thiết hai phía thì ta cũng tìm được giá trị p-value tương ứng.

Công thức tính p-value cho kiểm định giả thiết về trung bình tổng thể như sau:

Trường hợp đã biết \({\sigma ^2}\).

  • Nếu \({H_1}:\mu > {m_0}\) thì p-value = P(Z>z)  (8.4)
  • Nếu \({H_1}:\mu < {m_0}\) thì p-value = P(Z
  • Nếu \({H_1}:\mu \ne {m_0}\) thì p-value = P(Z>|z|)  (8.6)

Trường hợp chưa biết \({\sigma ^2}\).

  • Nếu \({H_1}:\mu > {m_0}\) thì p-value = P(T>t)  (8.7)
  • Nếu \({H_1}:\mu < {m_0}\) thì p-value = P(T  (8.8)

​Trên đây là nội dung bài giảng Bài 3: Kiểm định giả thiết bằng p-value mà eLib.VN muốn chia sẻ đến các bạn sinh viên. Hy vọng đây sẽ là tư liệu hữu ích giúp các bạn nắm được nội dung bài học tốt hơn. Chúc các bạn học tốt.

Ngày:23/11/2020 Chia sẻ bởi:Nhi

CÓ THỂ BẠN QUAN TÂM