สถิติ

7.สถิติ



บทที่ 3. สถิติ

 3.1 ข้อมูลและการนำเสนอข้อมูล

2554-11-10_1822.png
2554-11-10_1822_001.png
แหล่งที่มาของข้อมูล  สามารถแบ่งที่มาของข้อมูลจากแหล่งข้อมูลดังนี้
ข้อมูลปฐมภูมิ เป็นข้อมูลที่ผู้ใช้จะต้องเก็บรวบรวมข้อมูลจากผู้ให้ข้อมูล หรือแหล่งที่มาของข้อมูลโดยตรง
ข้อมูลทุติยภูมิ เป็นข้อมูลที่ผู้ใช้ไม่ต้องเก็บข้อมูลหรือแหล่งที่มาของข้อมูลโดยตรง แต่ได้จากข้อมูลที่มีผู้อื่นเก็บรวบรวมไว้แล้ว

การนำเสนอข้อมูล  เป็นการเตรียมความพร้อมเบื้องต้นสำหรับการวิเคราะห์และการแปลความหมายเพื่อจะนำไปใช้งานต่อไป การนำเสนอข้อมูลที่ได้เคยเรียนมาแล้ว ได้แก่ การนำเสนอข้อมูลในรูปข้อความ ข้อความกึ่งตาราง ตาราง แผนภูมิรูปภาพ แผนภูมิแท่ง แผนภูมิรูปวงกลม และกราฟเส้น

การนำเสนอข้อมูลโดยตารางแจกแจงความถี่
การนำข้อมูลที่เก็บรวบรวมมาจัดใหม่เป็นพวก ๆ หรือเรียงข้อมูลใหม่ให้เป็นระบบโดยเรียงจากน้อยไปหามากหรือจากมากไปหาน้อย แล้วจัดข้อมูลนั้นลงในตารางและเขียนบันทึกด้วยรอยขีดที่แสดงจำนวนครั้งของข้อมูลที่เกิดขึ้นซ้ำกัน จำนวนรอยขีดที่นับได้ในแต่ละข้อมูลเรียกว่า ความถี่ ของข้อมูลนั้น ๆ  และเรียกว่า ตารางแจกแจงความถี่   เรียกวิธีการจัดข้อมูลที่มีการหาค่าความถี่ว่า
การแจกแจงความถี่

การแจกแจงความถี่ในรูปตารางแบ่งได้เป็น 2 ลักษณะ คือ
  1. ตารางแจกแจงความถี่แบบแต่ละค่า การแจกแจงความถี่แบบนี้เหมาะสำหรับข้อมูลที่มี ไม่มากนัก และมีข้อมูลซ้ำ ๆ กันหลายจำนวน

วิธีการสร้างตารางแจกแจงความถี่แบบแต่ละค่า ทำได้ดังนี้
1)      หาข้อมูลค่าต่ำสุดและข้อมูลค่าสูงสุด
2)      เขียนข้อมูลจากต่ำสุดไปหาข้อมูลสูงสุดในช่องแรกของตารางในแนวดิ่ง
3)      หาว่าข้อมูลแต่ละค่าปรากฏกี่ครั้ง โดยการใช้รอยขีดในช่องที่สองของตาราง
4)      นับรอยขีด จำนวนของรอยขีด เรียกว่า ความถี่ของข้อมูลนั้น

  1. 2.      ตารางแจกแจงความถี่ของข้อมูลที่เป็นอันตรภาคชั้น
ส่วนประกอบของตารางแจกแจงความถี่แบบอันตรภาคชั้นที่ควรทราบ
1)      อันตรภาคชั้น หมายถึง ช่วงหรือกลุ่มของข้อมูลที่แบ่งออกเป็นชั้น ๆ ของตารางแจกแจงความถี่
2)      ความกว้างของอันตรภาคชั้น หมายถึง จำนวนค่าของข้อมูลที่นับได้จากแต่ละชั้น
3)      ความถี่ หมายถึง จำนวนที่นับได้ว่ามีข้อมูลดิบกี่ค่าที่ปรากฏอยู่ในข้อมูลหรือมีกี่ค่าที่ตกอยู่ในแต่ละชั้น
4)      ขอบล่างของอันตรภาคชั้น หมายถึง ค่ากึ่งกลางระหว่างค่าน้อยที่สุดของอันตรภาคชั้นนั้น กับค่ามากที่สุดของอันตรภาคชั้นที่ต่ำกว่าหนึ่งชั้น
5)      ขอบบนของอันตรภาคชั้น หมายถึง ค่ากึ่งกลางระหว่างค่ามากที่สุดของอันตรภาคชั้นนั้น กับค่าน้อยที่สุดของอันตรภาคชั้นที่สูงกว่าหนึ่งชั้น
6)      จุดกึ่งกลางของอันตรภาคชั้น หมายถึง ค่าที่เป็นตัวแทนของแต่ละอันตรภาคชั้น หาได้จาก ค่ากึ่งกลางระหว่างค่าที่น้อยที่สุดกับค่าที่มากที่สุดในอันตรภาคชั้นนั้น

การสร้างตารางแจกแจงความถี่แบบเป็นอันตรภาคชั้น สรุปเป็นขั้นตอนได้ดังนี้
1)      หาคะแนนต่ำสุดและคะแนนสูงสุดของข้อมูล
2)      หาพิสัยของข้อมูล คือ ค่าสูงสุดของข้อมูล – ค่าต่ำสุดของข้อมูล
3)      ถ้ากำหนดจำนวนอันตรภาคชั้น ต้องคำนวณหาความกว้างของแต่ละอันตรภาคชั้น โดยใช้หลักเกณฑ์ดังต่อไปนี้
2554-11-10_1832.png
ถ้ากำหนดความกว้างของอันตรภาคชั้น ก็จะสามารถหาจำนวนอันตรภาคชั้น จาก
 2554-11-10_1833.png
4)      เขียนอันตรภาคชั้นเรียงตามลำดับ แล้วดูว่าค่าจากการสังเกตแต่ละค่าของข้อมูลอยู่ในอันตรภาคชั้นใด ก็ให้ขีด “ | ” ลงในอันตรภาคชั้นนั้นไปเรื่อย ๆ จนครบทุกค่าจากการสังเกตของข้อมูลทั้งหมด
5)      นับจำนวนขีดในแต่ละอันตรภาคชั้น และสรุปออกมาเป็นจำนวน ซึ่งจำนวนดังกล่าวคือ ความถี่ นั่นเอง

วิธีการหาขอบบน – ขอบล่าง
ขอบล่าง
ขอบล่างของอันตรภาคชั้นใด คือ ค่ากึ่งกลางระหว่างค่าที่น้อยที่สุดของอันตรภาคชั้นนั้นกับค่าที่สูงที่สุดของอันตรภาคชั้นที่ติดกันและเป็นช่วงที่ต่ำกว่า

ขอบบน
ขอบบนของอันตรภาคชั้นใด คือ ค่ากึ่งกลางระหว่างคะแนนที่มากที่สุดในอันตรภาคชั้นนั้นกับคะแนนที่น้อยที่สุดของอันตรภาคชั้นที่ติดกัน และเป็นช่วงคะแนนที่สูงกว่า

แผนภาพ ฮิสโทแกรม เป็นแผนภาพที่เกิดจากการการนำข้อมูลในตารางแจกแจงความถี่ที่นำขอบล่างและขอบบนของแต่ละชั้นมาเขียนเป็นกราฟแท่ง

ข้อสังเกต สิ่งต่าง ๆ ในแผนภาพฮิสโทแกรม มีดังนี้
  1. ฮิสโทแกรมประกอบด้วยแกนนอนและแกนตั้งซึ่ง
แกนนอน แสดงความกว้างของแต่ละอันตรภาคชั้น
แกนตั้ง แสดงความถี่ของข้อมูลในแต่ละอันตรภาคชั้น
  1. ลักษณะของฮิสโทแกรม เป็นรูปสี่เหลี่ยมมุมฉากเรียงต่อติดกันโดยมีความกว้างของรูปสี่เหลี่ยม มุมฉากเท่ากับความกว้างของอันตรภาคชั้น และความยาวของรูปสี่เหลี่ยมมุมฉากเท่ากับความถี่ของชั้น
  2. จุดปลายของด้านกว้างของรูปสี่เหลี่ยมมุมฉากแต่ละรูปคือ ขอบล่างและขอบบนของ อันตรภาคชั้นที่เรียงต่อกัน
  3. ความกว้างของอันตรภาคชั้นแต่ละชั้นจะเท่ากัน
  4. จุดกึ่งกลางชั้นของอันตรภาคชั้นที่ติดกันจะมีค่าต่างกันเท่ากับความกว้างของอันตรภาคชั้น

รูปหลายเหลี่ยมของความถี่  คือ รูปที่ล้อมด้วยแกนนอนและส่วนของเส้นตรงที่ลากต่อกันของจุดกึ่งกลางของด้านบนของรูปสี่เหลี่ยมมุมฉากแต่ละรูปในแผนภาพฮิสโทแกรม และ จุดบนแกนนอนอีกสองจุด ซึ่งเป็นจุดกึ่งกลางของอันตรภาคชั้นที่อยู่ก่อน อันตรภาคชั้นต่ำสุด และจุดกึ่งกลางของอันตรภาคชั้นที่อยู่ถัดจากอันตรภาคชั้นสูงสุด

ข้อสังเกต  พื้นที่ของรูปหลายเหลี่ยมของความถี่เท่ากับผลบวกของพื้นที่ของรูปสี่เหลี่ยมมุมฉากทุกรูปในฮิสโทแกรม


 3.2 ค่ากลางของข้อมูล

ค่ากลางของข้อมูล
ค่ากลางของข้อมูลเป็นค่าที่ถือว่าเป็นกลางของข้อมูลในชุดที่กล่าวถึงและใช้ค่านี้เป็นตัวแทน คาดเดาถึงลักษณะของข้อมูลได้บ้างแต่ยังไม่ชัดเจนมากนัก
ค่ากลางของข้อมูลที่ใช้โดยทั่ว ๆ ไป ได้แก่ ค่าเฉลี่ยเลขคณิต  มัธยฐาน  และฐานนิยม
ค่าเฉลี่ยเลขคณิต  คือ จำนวนที่ได้จากการหารผลบวกของข้อมูลทั้งหมดด้วยจำนวนข้อมูล ในที่นี้ ค่าเฉลี่ยเลขคณิตอาจเรียกสั้น ๆ ว่า ค่าเฉลี่ย
มัธยฐาน คือ ค่ากลางของข้อมูล ซึ่งเมื่อเรียงข้อมูลจากน้อยไปหามาก หรือจากมากไปหาน้อย แล้วจำนวนข้อมูลที่น้อยกว่าค่านั้นจะเท่ากับจำนวนข้อมูลที่มากกว่าค่านั้น
ฐานนิยม  ของข้อมูลชุดหนึ่ง คือ ข้อมูลที่มีความถี่สูงสุดในข้อมูลชุดนั้น
พิสัย คือ ผลต่างที่ได้จากการนำคะแนนสูงสุดลบด้วยคะแนนต่ำสุด
ส่วนเบี่ยงเบนมาตรฐาน หาได้ดังนี้
  1. หาค่าเฉลี่ยเลขคณิต
  2. หาผลต่างระหว่างแต่ละคะแนนกับค่าเฉลี่ยเลขคณิต โดยนำ แต่ละคะแนนลบด้วยค่าเฉลี่ย
เลขคณิต
  1. หากำลังสองของแต่ละค่าที่ได้ในข้อ 2
  2. หาค่าเฉลี่ยเลขคณิตที่ได้ในข้อ 3
  3. หารากที่สองที่เป็นบวกของค่าที่ได้ในข้อ 4
เส้นโค้งของความถี่ คือ เส้นโค้งเรียบที่ได้จากการปรับรูปหลายเหลี่ยมของความถี่โดยให้พื้นที่ใต้เส้นโค้งเท่ากับพื้นที่ของรูปหลายเหลี่ยมของความถี่รูปเดิม
เส้นโค้งของความถี่ที่พบได้บ่อยในทางสถิติ มี 3 ลักษณะ คือ
  1. เส้นโค้งเบ้ลาดทางซ้าย
  2. เส้นโค้งเบ้ลาดทางขวา
  3. เส้นโค้งปกติหรือรูประฆัง
ข้อมูลที่มีเส้นโค้งของความถี่เป็นเส้นโค้งปกติ เรียกว่า เป็นข้อมูลที่มีการแจกแจงปกติ จะมีค่าเฉลี่ยเลขคณิต มัธยฐาน และ ฐานนิยม เป็นค่าเดียวกัน
เส้นโค้งปกติ มีสมบัติของพื้นที่ที่คิดเป็นเปอร์เซ็นต์ของพื้นที่ใต้เส้นโค้งปกติที่เกี่ยวข้องกับ ค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐาน ดังรูป

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

เรขาคณิต

1.เรขาคณิต ความรู้พื้นฐานเกี่ยวกับการให้เหตุผลทางเรขาคณิต (สำหรับนักเรียนที่ ไม่สามารถ ชมคลิปบอร์ดของโปรแกรม Geogebra ได้ ให้...