บทที่ 3. สถิติ
3.1 ข้อมูลและการนำเสนอข้อมูล


แหล่งที่มาของข้อมูล สามารถแบ่งที่มาของข้อมูลจากแหล่งข้อมูลดังนี้
ข้อมูลปฐมภูมิ เป็นข้อมูลที่ผู้ใช้จะต้องเก็บรวบรวมข้อมูลจากผู้ให้ข้อมูล หรือแหล่งที่มาของข้อมูลโดยตรง
ข้อมูลทุติยภูมิ เป็นข้อมูลที่ผู้ใช้ไม่ต้องเก็บข้อมูลหรือแหล่งที่มาของข้อมูลโดยตรง แต่ได้จากข้อมูลที่มีผู้อื่นเก็บรวบรวมไว้แล้ว
การนำเสนอข้อมูล เป็นการเตรียมความพร้อมเบื้องต้นสำหรับการวิเคราะห์และการแปลความหมายเพื่อจะนำไปใช้งานต่อไป การนำเสนอข้อมูลที่ได้เคยเรียนมาแล้ว ได้แก่ การนำเสนอข้อมูลในรูปข้อความ ข้อความกึ่งตาราง ตาราง แผนภูมิรูปภาพ แผนภูมิแท่ง แผนภูมิรูปวงกลม และกราฟเส้น
การนำเสนอข้อมูลโดยตารางแจกแจงความถี่
การนำข้อมูลที่เก็บรวบรวมมาจัดใหม่เป็นพวก ๆ หรือเรียงข้อมูลใหม่ให้เป็นระบบโดยเรียงจากน้อยไปหามากหรือจากมากไปหาน้อย แล้วจัดข้อมูลนั้นลงในตารางและเขียนบันทึกด้วยรอยขีดที่แสดงจำนวนครั้งของข้อมูลที่เกิดขึ้นซ้ำกัน จำนวนรอยขีดที่นับได้ในแต่ละข้อมูลเรียกว่า ความถี่ ของข้อมูลนั้น ๆ และเรียกว่า ตารางแจกแจงความถี่ เรียกวิธีการจัดข้อมูลที่มีการหาค่าความถี่ว่า
การแจกแจงความถี่
การแจกแจงความถี่ในรูปตารางแบ่งได้เป็น 2 ลักษณะ คือ
- ตารางแจกแจงความถี่แบบแต่ละค่า การแจกแจงความถี่แบบนี้เหมาะสำหรับข้อมูลที่มี ไม่มากนัก และมีข้อมูลซ้ำ ๆ กันหลายจำนวน
วิธีการสร้างตารางแจกแจงความถี่แบบแต่ละค่า ทำได้ดังนี้
1) หาข้อมูลค่าต่ำสุดและข้อมูลค่าสูงสุด
2) เขียนข้อมูลจากต่ำสุดไปหาข้อมูลสูงสุดในช่องแรกของตารางในแนวดิ่ง
3) หาว่าข้อมูลแต่ละค่าปรากฏกี่ครั้ง โดยการใช้รอยขีดในช่องที่สองของตาราง
4) นับรอยขีด จำนวนของรอยขีด เรียกว่า ความถี่ของข้อมูลนั้น
- 2. ตารางแจกแจงความถี่ของข้อมูลที่เป็นอันตรภาคชั้น
ส่วนประกอบของตารางแจกแจงความถี่แบบอันตรภาคชั้นที่ควรทราบ
1) อันตรภาคชั้น หมายถึง ช่วงหรือกลุ่มของข้อมูลที่แบ่งออกเป็นชั้น ๆ ของตารางแจกแจงความถี่
2) ความกว้างของอันตรภาคชั้น หมายถึง จำนวนค่าของข้อมูลที่นับได้จากแต่ละชั้น
3) ความถี่ หมายถึง จำนวนที่นับได้ว่ามีข้อมูลดิบกี่ค่าที่ปรากฏอยู่ในข้อมูลหรือมีกี่ค่าที่ตกอยู่ในแต่ละชั้น
4) ขอบล่างของอันตรภาคชั้น หมายถึง ค่ากึ่งกลางระหว่างค่าน้อยที่สุดของอันตรภาคชั้นนั้น กับค่ามากที่สุดของอันตรภาคชั้นที่ต่ำกว่าหนึ่งชั้น
5) ขอบบนของอันตรภาคชั้น หมายถึง ค่ากึ่งกลางระหว่างค่ามากที่สุดของอันตรภาคชั้นนั้น กับค่าน้อยที่สุดของอันตรภาคชั้นที่สูงกว่าหนึ่งชั้น
6) จุดกึ่งกลางของอันตรภาคชั้น หมายถึง ค่าที่เป็นตัวแทนของแต่ละอันตรภาคชั้น หาได้จาก ค่ากึ่งกลางระหว่างค่าที่น้อยที่สุดกับค่าที่มากที่สุดในอันตรภาคชั้นนั้น
การสร้างตารางแจกแจงความถี่แบบเป็นอันตรภาคชั้น สรุปเป็นขั้นตอนได้ดังนี้
1) หาคะแนนต่ำสุดและคะแนนสูงสุดของข้อมูล
2) หาพิสัยของข้อมูล คือ ค่าสูงสุดของข้อมูล – ค่าต่ำสุดของข้อมูล
3) ถ้ากำหนดจำนวนอันตรภาคชั้น ต้องคำนวณหาความกว้างของแต่ละอันตรภาคชั้น โดยใช้หลักเกณฑ์ดังต่อไปนี้

ถ้ากำหนดความกว้างของอันตรภาคชั้น ก็จะสามารถหาจำนวนอันตรภาคชั้น จาก

4) เขียนอันตรภาคชั้นเรียงตามลำดับ แล้วดูว่าค่าจากการสังเกตแต่ละค่าของข้อมูลอยู่ในอันตรภาคชั้นใด ก็ให้ขีด “ | ” ลงในอันตรภาคชั้นนั้นไปเรื่อย ๆ จนครบทุกค่าจากการสังเกตของข้อมูลทั้งหมด
5) นับจำนวนขีดในแต่ละอันตรภาคชั้น และสรุปออกมาเป็นจำนวน ซึ่งจำนวนดังกล่าวคือ ความถี่ นั่นเอง
วิธีการหาขอบบน – ขอบล่าง
ขอบล่าง
ขอบล่างของอันตรภาคชั้นใด คือ ค่ากึ่งกลางระหว่างค่าที่น้อยที่สุดของอันตรภาคชั้นนั้นกับค่าที่สูงที่สุดของอันตรภาคชั้นที่ติดกันและเป็นช่วงที่ต่ำกว่า
ขอบบน
ขอบบนของอันตรภาคชั้นใด คือ ค่ากึ่งกลางระหว่างคะแนนที่มากที่สุดในอันตรภาคชั้นนั้นกับคะแนนที่น้อยที่สุดของอันตรภาคชั้นที่ติดกัน และเป็นช่วงคะแนนที่สูงกว่า
แผนภาพ ฮิสโทแกรม เป็นแผนภาพที่เกิดจากการการนำข้อมูลในตารางแจกแจงความถี่ที่นำขอบล่างและขอบบนของแต่ละชั้นมาเขียนเป็นกราฟแท่ง
ข้อสังเกต สิ่งต่าง ๆ ในแผนภาพฮิสโทแกรม มีดังนี้
- ฮิสโทแกรมประกอบด้วยแกนนอนและแกนตั้งซึ่ง
แกนนอน แสดงความกว้างของแต่ละอันตรภาคชั้น
แกนตั้ง แสดงความถี่ของข้อมูลในแต่ละอันตรภาคชั้น
- ลักษณะของฮิสโทแกรม เป็นรูปสี่เหลี่ยมมุมฉากเรียงต่อติดกันโดยมีความกว้างของรูปสี่เหลี่ยม มุมฉากเท่ากับความกว้างของอันตรภาคชั้น และความยาวของรูปสี่เหลี่ยมมุมฉากเท่ากับความถี่ของชั้น
- จุดปลายของด้านกว้างของรูปสี่เหลี่ยมมุมฉากแต่ละรูปคือ ขอบล่างและขอบบนของ อันตรภาคชั้นที่เรียงต่อกัน
- ความกว้างของอันตรภาคชั้นแต่ละชั้นจะเท่ากัน
- จุดกึ่งกลางชั้นของอันตรภาคชั้นที่ติดกันจะมีค่าต่างกันเท่ากับความกว้างของอันตรภาคชั้น
รูปหลายเหลี่ยมของความถี่ คือ รูปที่ล้อมด้วยแกนนอนและส่วนของเส้นตรงที่ลากต่อกันของจุดกึ่งกลางของด้านบนของรูปสี่เหลี่ยมมุมฉากแต่ละรูปในแผนภาพฮิสโทแกรม และ จุดบนแกนนอนอีกสองจุด ซึ่งเป็นจุดกึ่งกลางของอันตรภาคชั้นที่อยู่ก่อน อันตรภาคชั้นต่ำสุด และจุดกึ่งกลางของอันตรภาคชั้นที่อยู่ถัดจากอันตรภาคชั้นสูงสุด
ข้อสังเกต พื้นที่ของรูปหลายเหลี่ยมของความถี่เท่ากับผลบวกของพื้นที่ของรูปสี่เหลี่ยมมุมฉากทุกรูปในฮิสโทแกรม
3.2 ค่ากลางของข้อมูล
ค่ากลางของข้อมูล
ค่ากลางของข้อมูลเป็นค่าที่ถือว่าเป็นกลางของข้อมูลในชุดที่กล่าวถึงและใช้ค่านี้เป็นตัวแทน คาดเดาถึงลักษณะของข้อมูลได้บ้างแต่ยังไม่ชัดเจนมากนัก
ค่ากลางของข้อมูลที่ใช้โดยทั่ว ๆ ไป ได้แก่ ค่าเฉลี่ยเลขคณิต มัธยฐาน และฐานนิยม
ค่าเฉลี่ยเลขคณิต คือ จำนวนที่ได้จากการหารผลบวกของข้อมูลทั้งหมดด้วยจำนวนข้อมูล ในที่นี้ ค่าเฉลี่ยเลขคณิตอาจเรียกสั้น ๆ ว่า ค่าเฉลี่ย
มัธยฐาน คือ ค่ากลางของข้อมูล ซึ่งเมื่อเรียงข้อมูลจากน้อยไปหามาก หรือจากมากไปหาน้อย แล้วจำนวนข้อมูลที่น้อยกว่าค่านั้นจะเท่ากับจำนวนข้อมูลที่มากกว่าค่านั้น
ฐานนิยม ของข้อมูลชุดหนึ่ง คือ ข้อมูลที่มีความถี่สูงสุดในข้อมูลชุดนั้น
พิสัย คือ ผลต่างที่ได้จากการนำคะแนนสูงสุดลบด้วยคะแนนต่ำสุด
ส่วนเบี่ยงเบนมาตรฐาน หาได้ดังนี้
- หาค่าเฉลี่ยเลขคณิต
- หาผลต่างระหว่างแต่ละคะแนนกับค่าเฉลี่ยเลขคณิต โดยนำ แต่ละคะแนนลบด้วยค่าเฉลี่ย
เลขคณิต
- หากำลังสองของแต่ละค่าที่ได้ในข้อ 2
- หาค่าเฉลี่ยเลขคณิตที่ได้ในข้อ 3
- หารากที่สองที่เป็นบวกของค่าที่ได้ในข้อ 4
เส้นโค้งของความถี่ คือ เส้นโค้งเรียบที่ได้จากการปรับรูปหลายเหลี่ยมของความถี่โดยให้พื้นที่ใต้เส้นโค้งเท่ากับพื้นที่ของรูปหลายเหลี่ยมของความถี่รูปเดิม
เส้นโค้งของความถี่ที่พบได้บ่อยในทางสถิติ มี 3 ลักษณะ คือ
- เส้นโค้งเบ้ลาดทางซ้าย
- เส้นโค้งเบ้ลาดทางขวา
- เส้นโค้งปกติหรือรูประฆัง
ข้อมูลที่มีเส้นโค้งของความถี่เป็นเส้นโค้งปกติ เรียกว่า เป็นข้อมูลที่มีการแจกแจงปกติ จะมีค่าเฉลี่ยเลขคณิต มัธยฐาน และ ฐานนิยม เป็นค่าเดียวกัน
เส้นโค้งปกติ มีสมบัติของพื้นที่ที่คิดเป็นเปอร์เซ็นต์ของพื้นที่ใต้เส้นโค้งปกติที่เกี่ยวข้องกับ ค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐาน ดังรูป
ไม่มีความคิดเห็น:
แสดงความคิดเห็น