Regresi vs korelasi
Dalam statistik, menentukan hubungan antara dua pembolehubah rawak adalah penting. Ia memberikan keupayaan untuk membuat ramalan mengenai satu pemboleh ubah berbanding dengan orang lain. Analisis regresi dan korelasi digunakan dalam ramalan cuaca, tingkah laku pasaran kewangan, penubuhan hubungan fizikal oleh eksperimen, dan dalam senario dunia yang lebih nyata.
Apa itu regresi?
Regresi adalah kaedah statistik yang digunakan untuk menarik hubungan antara dua pembolehubah. Selalunya apabila data dikumpulkan mungkin terdapat pembolehubah yang bergantung kepada orang lain. Hubungan yang tepat antara pembolehubah tersebut hanya boleh ditubuhkan oleh kaedah regresi. Menentukan hubungan ini membantu memahami dan meramalkan tingkah laku satu pemboleh ubah kepada yang lain.
Penggunaan analisis regresi yang paling biasa adalah untuk menganggarkan nilai pemboleh ubah bergantung untuk nilai tertentu atau julat nilai pembolehubah bebas. Sebagai contoh, dengan menggunakan regresi kita dapat mewujudkan hubungan antara harga komoditi dan penggunaan, berdasarkan data yang dikumpulkan dari sampel rawak. Analisis regresi menghasilkan fungsi regresi set data, yang merupakan model matematik yang paling sesuai dengan data yang ada. Ini dengan mudah boleh diwakili oleh plot penyebaran. Secara grafik, regresi bersamaan dengan mencari lengkung pemasangan terbaik untuk memberi data set. Fungsi lengkung adalah fungsi regresi. Menggunakan model matematik, permintaan komoditi boleh diramalkan untuk harga tertentu.
Oleh itu, analisis regresi digunakan secara meluas dalam meramalkan dan ramalan. Ia juga digunakan untuk mewujudkan hubungan dalam data eksperimen, dalam bidang fizik, kimia, dan banyak sains semula jadi dan disiplin kejuruteraan. Sekiranya hubungan atau fungsi regresi adalah fungsi linear, maka prosesnya dikenali sebagai regresi linear. Dalam plot berselerak, ia boleh diwakili sebagai garis lurus. Sekiranya fungsi bukan gabungan linear parameter, maka regresi tidak linear.
Apa itu korelasi?
Korelasi adalah ukuran kekuatan hubungan antara dua pembolehubah. Koefisien korelasi mengukur tahap perubahan dalam satu pembolehubah berdasarkan perubahan dalam pembolehubah lain. Dalam statistik, korelasi dihubungkan dengan konsep ketergantungan, yang merupakan hubungan statistik antara dua pembolehubah.
Koefisien korelasi Pearsons atau hanya pekali korelasi r adalah nilai antara -1 dan 1 (-1≤r≤+1) . Ia adalah pekali korelasi yang paling biasa digunakan dan hanya sah untuk hubungan linear antara pembolehubah. Jika r = 0, tiada hubungan wujud, dan jika r≥0, hubungannya berkadar terus; i.e. nilai satu pemboleh ubah meningkat dengan peningkatan yang lain. Jika r≤0, hubungan itu berkadar songsang; i.e. Satu pemboleh ubah berkurangan apabila peningkatan yang lain.
Kerana keadaan linearity, pekali korelasi R juga boleh digunakan untuk mewujudkan kehadiran hubungan linear antara pembolehubah.
Apakah perbezaan antara regresi dan korelasi?
Regresi memberikan bentuk hubungan antara dua pembolehubah rawak, dan korelasi memberikan tahap kekuatan hubungan.
Analisis regresi menghasilkan fungsi regresi, yang membantu untuk mengekstrapolasi dan meramalkan hasil sementara korelasi hanya boleh memberikan maklumat mengenai arah yang mungkin berubah.
Model regresi linear yang lebih tepat diberikan oleh analisis, jika pekali korelasi lebih tinggi. (| r | ≥0.8)