Perbezaan antara kecenderungan pusat dan penyebaran

Kecenderungan pusat vs penyebaran

Dalam statistik deskriptif dan kesimpulan, beberapa indeks digunakan untuk menggambarkan set data yang sepadan dengan kecenderungan, penyebaran, dan kecenderungan pusatnya: tiga sifat paling penting yang menentukan bentuk relatif pengedaran set data.

Apakah kecenderungan utama?

Kecenderungan Pusat merujuk kepada dan menempatkan pusat pengagihan nilai. Purata, mod, dan median adalah indeks yang paling biasa digunakan dalam menggambarkan kecenderungan pusat set data. Sekiranya set data adalah simetri, maka kedua -dua median dan min set data bertepatan antara satu sama lain.

Memandangkan set data, min dikira dengan mengambil jumlah semua nilai data dan kemudian membahagikannya dengan bilangan data. Sebagai contoh, berat 10 orang (dalam kilogram) diukur menjadi 70, 62, 65, 72, 80, 70, 63, 72, 77 dan 79. Maka berat min sepuluh orang (dalam kilogram) dapat dikira seperti berikut. Jumlah berat adalah 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Min = (jumlah) / (bilangan data) = 710/10 = 71 (dalam kilogram). Difahamkan bahawa outliers (titik data yang menyimpang dari trend biasa) cenderung mempengaruhi min. Oleh itu, dengan kehadiran outlier bermakna sahaja tidak akan memberikan gambaran yang betul mengenai pusat set data.

Median adalah titik data yang terdapat di tengah -tengah set data yang tepat. Salah satu cara untuk mengira median adalah untuk memerintahkan titik data dalam urutan menaik, dan kemudian cari titik data di tengah. Sebagai contoh, jika pernah mengarahkan set data sebelumnya kelihatan seperti, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Oleh itu, (70+72)/2 = 71 berada di tengah. Dari ini, dilihat bahawa median tidak perlu berada dalam set data. Median tidak terjejas oleh kehadiran outlier. Oleh itu, median akan berfungsi sebagai ukuran kecenderungan pusat yang lebih baik dengan kehadiran outlier.

Mod adalah nilai yang paling kerap berlaku dalam set data. Dalam contoh sebelumnya, nilai 70 dan 72 kedua -duanya berlaku dua kali dan oleh itu, kedua -duanya adalah mod. Ini menunjukkan bahawa, dalam beberapa pengagihan, terdapat lebih daripada satu nilai modal. Sekiranya terdapat hanya satu mod, set data dikatakan tidak sama, dalam kes ini, set data adalah bimodal.

Apa itu penyebaran?

Penyebaran adalah jumlah penyebaran data mengenai pusat pengedaran. Julat dan sisihan piawai adalah ukuran penyebaran yang paling biasa digunakan.

Julatnya hanyalah nilai tertinggi tolak nilai terendah. Dalam contoh terdahulu, nilai tertinggi adalah 80 dan nilai terendah ialah 62, jadi julatnya ialah 80-62 = 18. Tetapi julat tidak memberikan gambaran yang mencukupi mengenai penyebaran.

Untuk mengira sisihan piawai, terlebih dahulu penyimpangan nilai data dari min dikira. Purata persegi akar penyimpangan dipanggil sisihan piawai. Dalam contoh terdahulu, penyimpangan masing -masing dari min ialah (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 dan (79 - 71) = 8. Jumlah kuadrat sisihan adalah (-1)² + (-9)² + (-6)² + 1² + 9² + (-1)² + (-8)² + 1² + 6² + 8² = 366. Sisihan piawai adalah √ (366/10) = 6.05 (dalam kilogram). Kecuali set data sangat condong, dari ini dapat disimpulkan bahawa majoriti data berada dalam selang 71 ± 6.05, dan memang begitu dalam contoh ini.