บทความ

1.6.1.1: กายวิภาคของพล็อต


เป้าหมายของการลงจุดข้อมูลคือการนำเสนอบทสรุปของชุดข้อมูลในการนำเสนอแบบสองมิติ (หรือบางครั้งเป็นสามมิติ) เราอ้างถึงมิติเป็น แกน – แกนนอนเรียกว่า แกน X และแกนตั้งเรียกว่า แกน Y. ค่าเหล่านี้อาจเป็นค่าต่อเนื่องหรือเป็นหมวดหมู่ก็ได้

มีที่ดินหลายประเภทที่เราสามารถใช้ได้ซึ่งมีข้อดีและข้อเสียต่างกัน สมมติว่าเรามีความสนใจในการอธิบายลักษณะความแตกต่างของความสูงระหว่างชายและหญิงในชุดข้อมูล NHANES รูปที่ 6.3 แสดงสี่วิธีในการลงจุดข้อมูลเหล่านี้

  1. กราฟแท่งในแผง A แสดงความแตกต่างของค่าเฉลี่ย แต่ไม่ได้แสดงให้เราเห็นว่าข้อมูลมีวิธีการเหล่านี้กระจายไปมากน้อยเพียงใด และดังที่เราจะเห็นในภายหลัง การรู้ว่าสิ่งนี้เป็นสิ่งสำคัญในการพิจารณาว่าเราคิดว่าความแตกต่างระหว่าง กลุ่มใหญ่พอที่จะมีความสำคัญ
  2. พล็อตที่สองแสดงแถบที่มีจุดข้อมูลทั้งหมดซ้อนทับ - ทำให้ชัดเจนขึ้นเล็กน้อยว่าการกระจายความสูงสำหรับผู้ชายและผู้หญิงซ้อนทับกัน แต่ก็ยังมองเห็นได้ยากเนื่องจากมีจุดข้อมูลจำนวนมาก

โดยทั่วไป เราชอบใช้เทคนิคการพล็อตที่ให้มุมมองที่ชัดเจนขึ้นเกี่ยวกับการกระจายจุดข้อมูล

  1. ในแผง C เราจะเห็นตัวอย่างหนึ่งของ a พล็อตไวโอลินซึ่งพล็อตการกระจายข้อมูลในแต่ละเงื่อนไข (หลังจากทำให้เรียบขึ้นเล็กน้อย)
  2. อีกทางเลือกหนึ่งคือ พล็อตกล่อง แสดงในแผง D ซึ่งแสดงค่ามัธยฐาน (เส้นกลาง) การวัดความแปรปรวน (ความกว้างของกล่องซึ่งอิงตามการวัดที่เรียกว่าพิสัยระหว่างควอไทล์) และค่าผิดปกติใดๆ (ระบุโดยจุดที่ปลาย เส้น) ทั้งสองวิธีนี้เป็นวิธีที่มีประสิทธิภาพในการแสดงข้อมูลที่ให้ความรู้สึกที่ดีต่อการกระจายข้อมูล
รูปที่ 6.3: สี่วิธีที่แตกต่างกันในการวางแผนความแตกต่างของความสูงระหว่างชายและหญิงในชุดข้อมูล NHANES แผง A แปลงค่าเฉลี่ยของทั้งสองกลุ่ม ซึ่งไม่มีทางประเมินการทับซ้อนสัมพัทธ์ของการแจกแจงทั้งสองแบบ แผง B แสดงแถบเดียวกัน แต่ยังซ้อนทับจุดข้อมูล กระวนกระวายใจเพื่อให้เราเห็นการกระจายโดยรวม แผง C แสดงโครงไวโอลิน ซึ่งแสดงการกระจายชุดข้อมูลสำหรับแต่ละกลุ่ม แผง D แสดงแผนภาพกล่อง ซึ่งเน้นการกระจายของการแจกแจงพร้อมกับค่าผิดปกติใดๆ (ซึ่งแสดงเป็นจุดแต่ละจุด)


ดูวิดีโอ: How to: สอนแตงฟคนยาย สไตลเจค ฉบบเบองตน (พฤศจิกายน 2021).