p-value คืออะไร

หลายคนชอบคิดว่า p-value คือ probability แต่จริงๆแล้วไม่ใช่

p-value คือตัวเลขที่บอกว่าค่าที่คุณได้ออกมานั้นมีโอกาสเกิดจากดวง หรือเป็นค่าที่ยากที่จะเกิด เช่น ถ้าคุณได้ค่า p-value ที่ 0.0125 เอามาแปลงเป็น % จะหมายความว่า ค่าที่คุณได้มา มีโอกาส 1.25% ที่จะสุ่มมาโดนซึ่งน้อยมาก แต่ถ้าคุณได้ p-value 0.9 แปลว่ามีโอกาส 90% ที่จะสุ่มมาโดน

เพราะฉะนั้นยิ่งค่า p-value น้อยยิ่งแปลว่าค่านั้นมีความสำคัญ และยากที่จะเกิด

p-value เอาไว้ใช้บ่อยเพื่อช่วย support หรือ reject hypothesis ถ้าค่า p-value น้อยกว่าค่าที่เราเช็ตไว้เช่น 5% (0.05 p-value เรียกค่านี้ว่า alpha level หรือเป็นค่า confidence ใน hypothesis ของเรา) ให้เรา reject hypothesis แต่ถ้ามากกว่าให้ support

แล้วเลข p-value มากจากไหนละ

สมมุติคุณต้องการรู้ว่า p-value ของการโยนเหรียญ สองเหรียญให้ได้หัวทั้งคู่ probability ของการโยนเหรียญสองเหรียญจะออกมาแบบนี้

เลข p-value เกิดจากสามส่วน

  1. probability ของที่เราต้องการ observe
  2. probability ของการสิ่งที่เกิดยากเท่ากับที่เรา observe
  3. probability ของการสิ่งที่เกิดที่ยากกว่าที่เรา observe

โดยเราจะได้ค่า p-value ของการโยนเหรียญนี้ดังนี้

  1. 0.25 (เกิดจาก probability ของ HH)
  2. 0.25 (เกิดจาก probability ของ TT)
  3. 0 (เพราะไม่มีอะไรต่ำกว่า 0.25) รวมกันเป็น p-value 0.5

สมมุติว่าเราพยายามจะพิสูจน์ว่า แม้เราจะโยนเหรียญได้หัว 2 อัน เหรียญเรายังเป็นเหรียญปกตินะ โดยมีค่า alpha level ที่ 0.05

เราได้ค่า p-value 0.5 ซึ่งสูงกว่า 0.05 แปลว่าเหรียญเราปกติ

p-value ใน distribution

การคำนวน probability ใน distribution ก็ยังคงใช้หลักการเดียวกันกับข้างบน สมมุติใน normal distribution ด้านล่าง

เป็นการ distribution ที่บอกค่าความสูงของคนไทย (ค่ามั่วนะ) ถ้าเราต้องการรู้ว่า Probability ที่คนไทยจะสูง 140 - 180cm มีโอกาสเท่าไหร่ ให้หา area ใต้เส้น หรือตรงที่ระบายสีแดง เช่นในที่วาด เรา assume ว่า area คำนวนออกได้มาได้ 95% ของ area ทั้งหมด ก็ถือว่ามีโอกาส 95%

ที่นี้เราก็จะสามารถคำนวน p-value ได้แล้ว โดยใช้วิธีได้บน เช่นเราต้องการ p-value ของการวัดค่าความสูงที่ 182cm ก็ให้คำนวน probability 182cm (ส่วนที่ 1) และ 2. probability 138 (ส่วนที่ 2) และ probability ของค่าที่มากกว่า 182 และน้อยกว่า 138 (ส่วนที่ 3)

P.S ไว้เดียวบทความต่อๆไปหาโปรแกรมวาด graph ดีๆให้นะครับ 5555