ที่ปรึกษาการลงทุนของคุณเสนอโครงการลงทุนรายเดือนซึ่งสัญญาว่าจะได้รับผลตอบแทนในแต่ละเดือน คุณจะลงทุนเฉพาะในกรณีที่คุณมั่นใจได้ว่ามีรายได้เฉลี่ยต่อเดือนอยู่ที่ 180 เหรียญ ที่ปรึกษาของคุณยังบอกด้วยว่าในช่วง 300 เดือนที่ผ่านมาโครงการมีผลตอบแทนโดยมีมูลค่าเฉลี่ย 190 เหรียญและส่วนเบี่ยงเบนมาตรฐานเท่ากับ 75 เหรียญ คุณควรลงทุนในโครงการนี้หรือไม่?
การทดสอบสมมุติฐานมาช่วยในการตัดสินใจดังกล่าว
บทความนี้อนุมานถึงความคุ้นเคยของผู้อ่านเกี่ยวกับแนวคิดเกี่ยวกับตารางการแจกจ่ายสูตรค่า p และพื้นฐานทางสถิติที่เกี่ยวข้องสำหรับข้อมูลเพิ่มเติมเกี่ยวกับการประยุกต์ใช้ข้อมูลที่เป็นประโยชน์เพื่อกำหนดความเสี่ยงให้ดู "5 วิธีในการวัดความเสี่ยงของกองทุนรวม"
การทดสอบสมมุติฐาน
(หรือการทดสอบความสำคัญ) เป็นแบบจำลองทางคณิตศาสตร์สำหรับการทดสอบข้อเรียกร้องความคิดหรือสมมติฐาน เกี่ยวกับพารามิเตอร์ที่น่าสนใจในชุดประชากรที่กำหนดโดยใช้ข้อมูลที่วัดได้ในชุดตัวอย่าง การคำนวณจะดำเนินการกับตัวอย่างที่เลือกเพื่อรวบรวมข้อมูลเด็ดขาดมากขึ้นเกี่ยวกับลักษณะของประชากรทั้งหมดซึ่งจะช่วยให้สามารถทดสอบการอ้างสิทธิ์หรือแนวคิดเกี่ยวกับชุดข้อมูลทั้งหมดได้อย่างเป็นระบบ
มีวิธีการต่าง ๆ สำหรับการทดสอบสมมุติฐาน มีขั้นตอนพื้นฐานสี่ขั้นตอนดังนี้:
ขั้นตอนที่ 1: กำหนดสมมติฐาน:
โดยปกติแล้วมูลค่าที่รายงาน (หรือสถิติการอ้างสิทธิ์) ระบุเป็นสมมติฐานและสันนิษฐานว่าเป็นความจริง สำหรับตัวอย่างข้างต้นสมมุติฐานจะเป็น:
ตัวอย่าง A: นักเรียนในโรงเรียนคะแนนเฉลี่ย 7 ใน 10 ในการสอบ
- ตัวอย่าง B: ผลตอบแทนของกองทุนรวมประจำปีคือ 8% ต่อปี
- ตามที่ระบุไว้ คำอธิบายประกอบสมมติฐาน "
Null สมมุติฐาน (H 0 ) " และ สันนิษฐานว่า เป็นความจริง เช่นการพิจารณาของคณะลูกขุนเริ่มต้นด้วยการสมมติว่าผู้ต้องหาไร้เดียงสาตามด้วยการพิจารณาว่าสมมติฐานเป็นเท็จ ในทำนองเดียวกันการทดสอบสมมุติฐานจะเริ่มต้นด้วยการระบุและสมมติว่า "สมมติฐาน Null" และกระบวนการนี้จะกำหนดว่าสมมติฐานน่าจะเป็นความจริงหรือเท็จ ประเด็นสำคัญที่ควรทราบก็คือเรากำลังทดสอบสมมติฐานที่เป็นโมฆะเนื่องจากมีข้อสงสัยเกี่ยวกับความถูกต้อง ไม่ว่าข้อมูลใดที่ขัดแย้งกับสมมุติฐานที่เป็นโมฆะที่ระบุไว้จะถูกบันทึกใน
สมมติฐานทางเลือก (H 1 ) สำหรับตัวอย่างข้างต้นสมมติฐานทางเลือกคือ: นักเรียนให้คะแนนเฉลี่ย
- ไม่ เท่ากับ 7 ผลตอบแทนของกองทุนสำรองเลี้ยงชีพต่อปีอยู่ที่
- ไม่ เท่ากัน เป็น 8% ต่อปี โดยสรุปสมมติฐานทางเลือกเป็นข้อขัดแย้งโดยตรงของสมมติฐานที่เป็นโมฆะ
เช่นเดียวกับในการพิจารณาคดีคณะลูกขุนถือว่าผู้บริสุทธิ์ที่สงสัย (สมมติฐานที่เป็นโมฆะ) พนักงานอัยการต้องพิสูจน์อย่างอื่น (ทางเลือก) ในทำนองเดียวกันผู้วิจัยต้องพิสูจน์ว่าสมมติฐานที่เป็นโมฆะเป็นความจริงหรือเท็จ หากพนักงานอัยการไม่สามารถพิสูจน์สมมติฐานทางเลือกได้คณะลูกขุนต้องปล่อยตัวผู้ต้องสงสัย (โดยพิจารณาจากสมมติฐานที่เป็นโมฆะ) ในทำนองเดียวกันถ้านักวิจัยล้มเหลวในการพิสูจน์สมมติฐานทางเลือก (หรือเพียงแค่ไม่ทำอะไรเลย) สมมุติฐานสมมติฐานสมมติว่าเป็นจริง
ขั้นตอนที่ 2: กำหนดเกณฑ์การตัดสินใจ
เกณฑ์การตัดสินใจต้องอยู่บนพื้นฐานของพารามิเตอร์ชุดข้อมูลและนี่คือจุดเชื่อมต่อกับการแจกแจงแบบปกติที่มีอยู่ในภาพ
ตามเกณฑ์สถิติมาตรฐานเกี่ยวกับการแจกแจงการสุ่มตัวอย่าง "สำหรับทุกขนาดตัวอย่าง n การกระจายตัวอย่างของX̅เป็นเรื่องปกติถ้าประชากร X ซึ่งตัวอย่างถูกวาดกระจายอยู่ตามปกติ "ดังนั้นความน่าจะเป็นของ
ตัวอย่างที่เป็นไปได้อื่น ๆ ทั้งหมดซึ่งหมายความว่า ที่เราสามารถเลือกได้มีการกระจายตามปกติ สำหรับ e. ก. , ตรวจสอบว่าผลตอบแทนรายวันเฉลี่ยของหุ้นใด ๆ ที่จดทะเบียนในตลาดหุ้น XYZ รอบเวลาปีใหม่มากกว่า 2%
H
0 : สมมุติฐาน Null: mean = 2% H
1 : สมมติฐานทางเลือก: mean> 2% (นี่คือสิ่งที่เราต้องการพิสูจน์) ใช้ตัวอย่าง (พูดจาก 50 หุ้นจากทั้งหมด 500) และคำนวณค่าเฉลี่ยของกลุ่มตัวอย่าง
สำหรับการแจกแจงแบบปกติ 95% ของค่าอยู่ในความเบี่ยงเบนมาตรฐาน 2 อย่างของประชากร ดังนั้นการแจกแจงแบบปกติและข้อสันนิษฐานขีดกลางสำหรับชุดข้อมูลตัวอย่างช่วยให้เราสามารถสร้าง 5% เป็นระดับความสำคัญได้ เป็นไปได้ว่าภายใต้สมมติฐานนี้มีความเป็นไปได้ต่ำกว่า 5% (100-95) ในการรับค่าผิดปกติที่อยู่นอกเหนือการเบี่ยงเบนมาตรฐาน 2 ค่าจากค่าเฉลี่ยประชากร ระดับความสำคัญอื่น ๆ จะขึ้นอยู่กับลักษณะของชุดข้อมูลที่ 1%, 5% หรือ 10% สำหรับการคำนวณทางการเงิน (รวมถึงการเงินด้านพฤติกรรม) 5% เป็นวงเงินที่ยอมรับโดยทั่วไป
ถ้าเราพบการคำนวณใด ๆ ที่เกินกว่าปกติ 2 เบี่ยงเบนมาตรฐานแล้วเรามีกรณีที่ดีของ outliers เพื่อปฏิเสธสมมุติฐาน null ส่วนเบี่ยงเบนมาตรฐานเป็นสิ่งสำคัญอย่างยิ่งสำหรับการทำความเข้าใจข้อมูลทางสถิติ เรียนรู้เพิ่มเติมเกี่ยวกับสิ่งเหล่านี้โดยดูวิดีโอของ Investopedia เกี่ยวกับการเบี่ยงเบนมาตรฐาน ในตัวอย่างข้างต้นถ้าค่าเฉลี่ยของตัวอย่างมีขนาดใหญ่กว่า 2% (พูด 3. 5%) แล้วเราจะปฏิเสธสมมติฐานที่เป็นโมฆะสมมติฐานทางเลือก (เฉลี่ย> 2%) เป็นที่ยอมรับซึ่งยืนยันว่าผลตอบแทนเฉลี่ยต่อวันของหุ้นมีค่ามากกว่า 2%
อย่างไรก็ตามถ้าค่าเฉลี่ยของตัวอย่างไม่น่าจะมากกว่า 2% (และยังคงอยู่ที่ประมาณ 2. 2%) จากนั้นเราไม่สามารถปฏิเสธสมมติฐานที่เป็นโมฆะได้ ความท้าทายมาในการตัดสินใจในกรณีที่ใกล้ชิดเช่น ในการสรุปจากตัวอย่างและผลการคัดเลือกจะต้องมีการกำหนดระดับความสำคัญ
ซึ่งจะทำให้สามารถสรุปข้อสรุปเกี่ยวกับสมมติฐานที่เป็นโมฆะได้ สมมติฐานทางเลือกช่วยในการกำหนดระดับความสำคัญหรือแนวคิด "คุณค่าสำคัญ" สำหรับการตัดสินใจในกรณีที่ใกล้เคียงกันดังคำจำกัดความมาตรฐาน "ค่าที่สำคัญคือค่าตัดที่กำหนดขอบเขตเกินกว่าที่น้อยกว่า 5% ของกลุ่มตัวอย่าง หมายความว่าสามารถหาได้ถ้าสมมุติฐานเป็นจริงตัวอย่างหมายความว่าได้เกินกว่าค่าที่สำคัญจะส่งผลให้มีการตัดสินใจที่จะปฏิเสธสมมุติฐาน "ในตัวอย่างข้างต้นถ้าเราได้กำหนดค่าวิกฤตเป็น 2 1% และ คำนวณค่าเฉลี่ยมาถึง 2 2% แล้วเราปฏิเสธสมมติฐาน null ค่าสำคัญกำหนดแบ่งเขตชัดเจนเกี่ยวกับการยอมรับหรือปฏิเสธ ตัวอย่างอื่น ๆ ที่จะปฏิบัติตาม - ขั้นแรกให้ดูที่ขั้นตอนสำคัญบางอย่างและแนวคิด ขั้นตอนที่ 3: คำนวณสถิติการทดสอบ:
ขั้นตอนนี้เกี่ยวข้องกับการคำนวณตัวเลขที่ต้องการเรียกว่าสถิติทดสอบ (เช่นค่าเฉลี่ยค่า z-score, p-value ฯลฯ ) สำหรับตัวอย่างที่เลือก จะครอบคลุมค่าต่างๆที่จะคำนวณ ในส่วนท้ายด้วยตัวอย่าง
ขั้นตอนที่ 4: หาข้อสรุปเกี่ยวกับสมมุติฐาน
ด้วยค่าที่คำนวณได้ (s) ตัดสินใจเลือกสมมติฐานที่เป็นโมฆะ ถ้าความเป็นไปได้ที่จะได้ค่าเฉลี่ยตัวอย่างน้อยกว่า 5% ข้อสรุปก็คือ
ปฏิเสธ
สมมติฐานที่เป็นโมฆะ มิฉะนั้น ยอมรับ และคงสมมติฐานที่เป็นโมฆะ ประเภทของข้อผิดพลาดในการตัดสินใจ: อาจมีสี่ผลลัพธ์ที่เป็นไปได้ในการตัดสินใจโดยใช้ตัวอย่างโดยคำนึงถึงการบังคับใช้ที่ถูกต้องต่อประชากรทั้งหมด:
การตัดสินใจที่จะรักษา
การตัดสินใจที่จะปฏิเสธ > ใช้กับประชากรทั้งหมด
ถูกต้อง |
ไม่ถูกต้อง | |
(TYPE 1 Error - a) |
ไม่ใช้กับประชากรทั้งหมด |
ไม่ถูกต้อง (TYPE 2 Error - b) |
ถูกต้อง |
กรณี "ถูกต้อง" เป็นกรณีที่การตัดสินใจของกลุ่มตัวอย่างเป็นไปอย่างเหมาะสมกับประชากรทั้งหมด กรณีของข้อผิดพลาดเกิดขึ้นเมื่อหนึ่งตัดสินใจที่จะรักษาสมมติฐานที่เป็นโมฆะ (หรือปฏิเสธ) ขึ้นอยู่กับการคำนวณตัวอย่าง แต่การตัดสินใจนั้นไม่ได้มีผลกับประชากรทั้งหมด กรณีเหล่านี้เป็นข้อผิดพลาดประเภท 1 (alpha) และ Type 2 (beta) ดังที่แสดงในตารางด้านบน การเลือกค่าที่สำคัญที่ถูกต้องช่วยให้สามารถขจัดข้อผิดพลาด alpha type-1 หรือ จำกัด ให้อยู่ในช่วงที่ยอมรับได้ |
Alpha หมายถึงข้อผิดพลาดในระดับนัยสำคัญและผู้วิจัยกำหนด เพื่อรักษาระดับนัยสำคัญ 5% หรือระดับความเชื่อมั่นสำหรับการคำนวณความน่าจะเป็น 5% |
ตามเกณฑ์การตัดสินใจและคำจำกัดความที่เกี่ยวข้อง:
"เกณฑ์นี้ (อัลฟา) มีการตั้งค่าไว้ที่ 005 (a = 0) และเราจะเปรียบเทียบระดับอัลฟ่ากับค่า p เมื่อความน่าจะเป็นของข้อผิดพลาด Type I น้อยกว่า 5% (p <0. 05) เราจะปฏิเสธสมมติฐานที่เป็นโมฆะ มิฉะนั้นเราจะรักษาสมมติฐานที่เป็นโมฆะ "
ระยะทางเทคนิคที่ใช้สำหรับความน่าจะเป็นนี้คือ
ค่า p
- มันถูกกำหนดให้เป็น "ความน่าจะเป็นของการได้รับผลการสุ่มตัวอย่างโดยให้ค่าที่ระบุไว้ในสมมติฐานที่เป็นโมฆะเป็นความจริง ค่า p สำหรับการรับผลลัพธ์ตัวอย่างจะถูกเปรียบเทียบกับระดับความสำคัญ "
- ข้อผิดพลาด Type II หรือข้อผิดพลาดเบต้าหมายถึง "ความน่าจะเป็นของการเก็บรักษาสมมติฐานที่เป็นโมฆะอย่างไม่ถูกต้องเมื่อความจริงมันไม่สามารถใช้ได้กับประชากรทั้งหมด " อีกสองสามตัวอย่างจะแสดงให้เห็นถึงการคำนวณนี้และการคำนวณอื่น ๆ ตัวอย่าง 1. มีโครงการลงทุนรายเดือนที่สัญญาว่าจะได้ผลตอบแทนรายเดือนแบบผันแปร นักลงทุนจะลงทุนในตราสารนี้เฉพาะในกรณีที่เขามั่นใจได้ว่าจะมีรายได้เฉลี่ยต่อเดือน 180 ดอลลาร์ เขามีตัวอย่างผลตอบแทน 300 เดือนซึ่งมีค่าเฉลี่ย 190 ดอลลาร์และเบี่ยงเบนมาตรฐาน 75 เหรียญ เขาควรจะลงทุนในโครงการนี้หรือไม่?
- ลองตั้งปัญหาแล้ว นักลงทุนจะลงทุนในโครงการนี้หากเขาหรือเธอมั่นใจในผลตอบแทนเฉลี่ยที่ต้องการ 180 บาท ที่นี่
H
0
: สมมุติฐาน Null: mean = 180
H 1 : สมมติฐานทางเลือก: เฉลี่ย> 180
วิธีที่ 1 - Critical Value Approach : ระบุค่าที่สำคัญ X
L สำหรับค่าเฉลี่ยของตัวอย่างซึ่งมีขนาดใหญ่พอที่จะปฏิเสธสมมติฐานที่เป็นโมฆะ - i อี ปฏิเสธค่าสมมติฐานสมมติฐานถ้าค่าเฉลี่ยตัวอย่าง = ค่าวิกฤต X
L P (ระบุข้อผิดพลาด Type I alpha) = P (ปฏิเสธ H 0 ให้ H
0 เป็นจริง) ซึ่งจะทำได้เมื่อค่าเฉลี่ยของตัวอย่างสูงกว่าขีด จำกัด ที่สำคัญ i อี = P (ระบุว่า H 0
เป็นความจริง) = alpha
กราฟิก, การ alpha = 0 05 (ระดับความสำคัญอย่างน้อย 5%), Z 0 05
= 1. 645 (จากตาราง Z หรือตารางกระจายปกติ)
=> X L = 180 +1 645 * (75 / sqrt (300)) = 187. 12
เนื่องจากค่าเฉลี่ยของตัวอย่าง (190) สูงกว่าค่าที่สำคัญ (187. 12) สมมุติฐานที่เป็นโมฆะถูกปฏิเสธและสรุปได้ว่าผลตอบแทนรายเดือนเฉลี่ย แน่นอนมากกว่า $ 180 ดังนั้นนักลงทุนจึงสามารถพิจารณาลงทุนในโครงการนี้ได้ วิธีที่ 2 - การใช้สถิติการทดสอบมาตรฐาน :
นอกจากนี้ยังสามารถใช้ค่ามาตรฐาน z
สถิติการทดสอบ Z = (ค่าเฉลี่ยตัวอย่าง - ค่าเฉลี่ยประชากร) / (std-dev / sqrt (ไม่มีตัวอย่าง) เช่น จากนั้นพื้นที่การปฏิเสธจะกลายเป็น
Z = (190 - 180) / ( 75 / sqrt (300)) = 2.309
เขตการปฏิเสธของเราที่ระดับนัยสำคัญ 5% คือ Z> Z
0 <05 = = 1. 645
เนื่องจาก Z = 2.309 เป็นค่ามาก
วิธีที่ 3 - การคำนวณค่า P: เรามุ่งมั่นที่จะระบุ P (ตัวอย่างเฉลี่ย> = 190, เมื่อ mean = 180) = P (Z> = (190-180) / (75 / sqrt (300))
= P (Z> = 2. 309) = 0. 0084 = 0. 84%
ตารางต่อไปนี้ เพื่ออนุมานการคำนวณค่า p- สรุปว่ามีหลักฐานยืนยันว่าผลตอบแทนรายเดือนเฉลี่ยสูงกว่า 180
น้อยกว่า 1%
หลักฐานยืนยัน |
สนับสนุนสมมติฐานทางเลือก |
ระหว่าง 1% ถึง 5% |
หลักฐานที่แข็งแกร่ง สนับสนุนสมมติฐานทางเลือก > สมมติฐานทางเลือก |
มากกว่า 10% |
ไม่มีหลักฐาน สนับสนุนสมมติฐานทางเลือก |
ตัวอย่างที่ 2: คำแถลงข้อเรียกร้องของนายหน้าซื้อขายหลักทรัพย์ (XYZ) ใหม่ ว่าอัตราการเป็นนายหน้าซื้อขายหลักทรัพย์ของเขาต่ำกว่าหุ้นของนายหน้าซื้อขายหลักทรัพย์ในปัจจุบัน (ABC) ข้อมูลจาก บริษัท วิจัยอิสระระบุว่าค่าเฉลี่ยและ std-dev ของลูกค้านายหน้าซื้อขายหลักทรัพย์ ABC ทั้งหมดอยู่ที่ 18 และ 6 เหรียญตามลำดับ |
ตัวอย่างลูกค้า 100 รายของเอบีซีและค่านายหน้าซื้อขายหลักทรัพย์คำนวณจากอัตราใหม่ของโบรกเกอร์ XYZ ถ้าค่าเฉลี่ยของตัวอย่างคือ 18 เหรียญ 75 และ std-dev เหมือนกัน ($ 6) สามารถอนุมานได้เกี่ยวกับความแตกต่างในการเรียกเก็บเงินเฉลี่ยของโบรกเกอร์ ABC และ XYZ ได้หรือไม่? H |
0 |
: สมมุติฐาน Null: mean = 18 H |
1
: สมมติฐานทางเลือก: mean 18 (นี่คือสิ่งที่เราต้องการพิสูจน์)
Rejection region: Z <= - z 2. 5 และ Z> = Z
2. 5 (สมมติว่าระดับความสำคัญ 5%, แบ่ง 2. 5 แต่ละด้านใดด้านหนึ่ง) Z = (ค่าเฉลี่ยตัวอย่าง) / (std-dev / sqrt (ไม่มีตัวอย่าง) = (18 . 75 - 18) / (6 / (sqrt (100)) = 1. 25
ค่า Z ที่คำนวณได้นี้อยู่ระหว่างขีด จำกัด สองข้อที่กำหนดโดย - Z 2. 5 = -1 96 และ Z 2. 5
= 1. 96.
สรุปได้ว่าไม่มีหลักฐานเพียงพอที่จะอนุมานได้ว่ามีความแตกต่างระหว่างอัตราของนายหน้าใหม่และนายหน้าใหม่
ค่า p คือ = P (Z1. 25)
= 2 * 0. 1056 = 0 2112 = 21. 12% ซึ่งมากกว่า 0 หรือ 5% ทำให้ข้อสรุปเดียวกัน แบบกราฟิก (999) - วิธีการทางสถิติตามสมมติฐาน - เกิดข้อผิดพลาดในรายละเอียดเกี่ยวกับข้อผิดพลาดของอัลฟ่าและเบต้า - การตีความ (Interpretation) ของค่า p สามารถ ambigous นำไปสู่ผลลัพธ์ที่สับสน
การทดสอบด้านล่าง
การทดสอบสมมติฐานช่วยให้โมเดลทางคณิตศาสตร์สามารถตรวจสอบความถูกต้องหรือข้อคิดเห็นได้ ระดับความเชื่อมั่นบางอย่าง อย่างไรก็ตามเช่นเดียวกับเครื่องมือทางสถิติและแบบจำลองส่วนใหญ่ข้อ จำกัด นี้ก็มีข้อ จำกัด อยู่ด้วย การใช้แบบจำลองนี้ในการตัดสินใจด้านการเงินควรได้รับการพิจารณาอย่างมีวิจารณญาณโดยคำนึงถึงการอ้างอิงทั้งหมด วิธีการสำรองเช่นการอนุมานแบบเบส์ (Bayesian Inference) มีค่าสำหรับการวิเคราะห์ที่คล้ายกัน
พื้นฐานของการซื้อขายอัลกอริทึม: แนวคิดและตัวอย่าง |
การค้าอัลกอริธึมการค้าแบบอัลกอริธึมทำให้การใช้คอมพิวเตอร์ในการซื้อขายชุดคำสั่งที่กำหนดไว้ล่วงหน้าเพื่อสร้างผลกำไรให้มีประสิทธิภาพมากขึ้นกว่าผู้ค้ามนุษย์