Isi kandungan
- Apakah Ujian T?
- Menerangkan Ujian T
- Keputusan ujian yang tidak masuk akal
- T-Test Assumptions
- Mengira Ujian T
- Ujian T Berterusan (atau Berpasangan)
- Tes Ujian Sama Rata (Dikumpulkan)
- Ujian T Unjustal T-Test
- Menentukan T-Uji Yang Digunakan
- Contoh Ujian T Unjustal Unequal
Apakah Ujian T?
Ujian t adalah sejenis statistik inferens yang digunakan untuk menentukan sama ada terdapat perbezaan yang signifikan di antara cara dua kumpulan, yang mungkin berkaitan dengan ciri-ciri tertentu. Ia kebanyakannya digunakan apabila set data, seperti set data yang direkodkan sebagai hasil daripada membalikkan duit syiling sebanyak 100 kali, akan mengikut taburan normal dan mungkin mempunyai variasi yang tidak diketahui. Ujian t digunakan sebagai alat ujian hipotesis, yang membolehkan pengujian terhadap anggapan yang dikenakan kepada populasi.
Ujian t melihat statistik t, nilai t-t, dan darjah kebebasan untuk menentukan kebarangkalian perbezaan antara dua set data. Untuk menjalankan ujian dengan tiga atau lebih pembolehubah, seseorang mesti menggunakan analisis varians.
Ujian T
Menerangkan Ujian T
Pada asasnya, ujian-t membolehkan kita membandingkan nilai-nilai purata kedua-dua set data dan menentukan sama ada ia berasal dari populasi yang sama. Dalam contoh di atas, jika kita mengambil contoh pelajar dari kelas A dan sampel pelajar lain dari kelas B, kita tidak akan mengharapkan mereka mempunyai persamaan yang sama dan sisihan piawai yang sama. Begitu juga, sampel yang diambil dari kumpulan kawalan plasebo dan yang diambil dari kumpulan yang ditetapkan ubat harus mempunyai sedikit perbezaan dan sisihan piawai.
Secara matematik, ujian-t mengambil sampel dari setiap satu set dan menetapkan pernyataan masalah dengan mengandaikan hipotesis nol bahawa kedua-dua cara adalah sama. Berdasarkan formula yang berkenaan, nilai-nilai tertentu dikira dan dibandingkan dengan nilai-nilai standard, dan hipotesis nol yang diandaikan diterima atau ditolak dengan sewajarnya.
Sekiranya hipotesis nol layak untuk ditolak, ia menunjukkan bahawa pembacaan data adalah kuat dan tidak secara kebetulan. Ujian t hanyalah satu daripada banyak ujian yang digunakan untuk tujuan ini. Ahli statistik juga mesti menggunakan ujian selain ujian t untuk memeriksa lebih banyak pemboleh ubah dan ujian dengan saiz sampel yang lebih besar. Untuk saiz sampel yang besar, ahli statistik menggunakan ujian z. Pilihan ujian lain termasuk ujian chi-square dan ujian f.
Terdapat tiga jenis ujian t, dan mereka dikategorikan sebagai ujian bergantung dan bebas t.
Takeaways Utama
- Ujian t ialah sejenis statistik inferens yang digunakan untuk menentukan sama ada terdapat perbezaan yang signifikan di antara cara dua kumpulan, yang mungkin berkaitan dengan ciri-ciri tertentu. Ujian t ialah salah satu daripada banyak ujian yang digunakan untuk tujuan ujian hipotesis dalam statistik. Mengira ujian t memerlukan tiga nilai data utama. Ia termasuk perbezaan antara nilai min dari setiap set data (dipanggil perbezaan min), sisihan piawai bagi setiap kumpulan, dan bilangan nilai data setiap kumpulan. Terdapat beberapa jenis ujian t yang boleh dilakukan bergantung pada data dan jenis analisis yang diperlukan.
Keputusan ujian yang tidak masuk akal
Pertimbangkan bahawa pengilang ubat ingin menguji ubat yang baru dicipta. Ia mengikuti prosedur standard mencuba ubat pada satu kumpulan pesakit dan memberi plasebo kepada kumpulan lain, yang dikenali sebagai kumpulan kawalan. Plasebo yang diberikan kepada kumpulan kawalan adalah bahan yang tidak mempunyai nilai terapeutik dan berfungsi sebagai penanda aras untuk mengukur bagaimana kumpulan lain, yang diberi ubat sebenar, bertindak balas.
Selepas percubaan ubat, ahli kumpulan kawalan plasebo melaporkan peningkatan purata jangka hayat selama tiga tahun, sementara ahli kumpulan yang menetapkan laporan dadah baru meningkatkan purata jangka hayat selama empat tahun. Pemerhatian segera mungkin menunjukkan bahawa ubat memang berfungsi kerana hasilnya lebih baik untuk kumpulan menggunakan ubat. Walau bagaimanapun, juga mungkin bahawa pemerhatian mungkin disebabkan oleh kemungkinan berlakunya kejadian, terutamanya sekeping nasib yang mengejutkan. Ujian t berguna untuk membuat kesimpulan jika keputusannya betul dan sesuai untuk keseluruhan populasi.
Di sekolah, 100 pelajar di kelas A menjaringkan purata 85% dengan sisihan piawai sebanyak 3%. Seramai 100 orang pelajar kelas B menjaringkan purata 87% dengan sisihan piawai 4%. Walaupun purata kelas B lebih baik daripada kelas A, mungkin tidak betul untuk melompat ke kesimpulan bahawa prestasi keseluruhan pelajar di kelas B adalah lebih baik daripada pelajar di kelas A. Ini kerana, bersama dengan maksudnya, sisihan piawai kelas B juga lebih tinggi daripada kelas A. Ia menunjukkan bahawa peratusan ekstrim mereka, di bahagian bawah dan lebih tinggi, jauh lebih tersebar berbanding kelas A. Ujian t dapat membantu menentukan kelas yang lebih baik.
T-Test Assumptions
- Anggapan pertama yang dibuat mengenai t-tes berkenaan skala ukuran. Anggapan bagi uji-t adalah skala pengukuran yang digunakan untuk data yang dikumpulkan mengikut skala berterusan atau ordinal, seperti skor untuk ujian IQ. Anggapan kedua dibuat ialah sampel mudah rawak, bahawa data dikumpulkan dari perwakilan, bahagian yang dipilih secara rawak daripada jumlah penduduk. Anggapan ketiga adalah data, apabila diplot, menghasilkan pengagihan normal, keluk edaran berbentuk loceng. Anggapan keempat adalah saiz sampel yang agak besar digunakan. Saiz sampel yang lebih besar bermakna pengedaran hasil harus mendekati lengkung berbentuk bel yang normal. Anggapan terakhir adalah homogenitas varians. Varieti homogen, atau sama, wujud apabila penyimpangan piawai sampel adalah hampir sama.
Mengira Ujian T
Mengira ujian t memerlukan tiga nilai data utama. Ini termasuk perbezaan antara nilai min dari setiap set data (dipanggil perbezaan min), sisihan piawai bagi setiap kumpulan, dan bilangan nilai data bagi setiap kumpulan.
Hasil ujian t menghasilkan nilai t. Nilai t dikira kemudiannya dibandingkan dengan nilai yang diperoleh daripada jadual nilai kritikal (dipanggil Jadual Pengagihan T). Perbandingan ini membantu menentukan sejauh mana perbezaan antara cara berlaku secara kebetulan atau sama ada set data benar-benar mempunyai perbezaan intrinsik. Soalan t-ujian sama ada perbezaan antara kumpulan mewakili perbezaan sebenar dalam kajian ini atau jika kemungkinan perbezaan statistik yang tidak bermakna.
Jadual T-Taburan
Jadual T-Pengedaran tersedia dalam format satu ekor dan dua ekor. Bekas digunakan untuk menilai kes-kes yang mempunyai nilai tetap atau jarak dengan arah yang jelas (positif atau negatif). Sebagai contoh, apakah kebarangkalian nilai keluaran yang tinggal di bawah -3, atau mendapat lebih dari tujuh ketika berguling sepasang dadu? Yang terakhir digunakan untuk analisis terikat pelbagai, seperti bertanya jika koordinat jatuh antara -2 dan +2.
Pengiraan boleh dilakukan dengan program perisian standard yang menyokong fungsi statistik yang diperlukan, seperti yang terdapat dalam MS Excel.
T-Nilai dan Darjah Kebebasan
Ujian t menghasilkan dua nilai sebagai outputnya: t-nilai dan darjah kebebasan. Nilai t adalah nisbah perbezaan antara min bagi dua sampel dan perbezaan yang wujud dalam set sampel. Walaupun nilai pengangka (perbezaan antara min bagi dua sampel sampel) adalah mudah untuk mengira, penyebut (perbezaan yang wujud dalam set sampel) boleh menjadi sedikit rumit bergantung kepada jenis nilai data yang terlibat. Penyebut nisbah adalah pengukuran penyebaran atau kebolehubahan. Nilai-nilai t-nilai yang lebih tinggi, juga dikenali sebagai skor t, menunjukkan bahawa terdapat perbezaan yang besar antara kedua-dua set sampel. Semakin kecil t-nilai, semakin banyak kesamaan antara kedua-dua set sampel.
- Skor t yang besar menunjukkan bahawa kumpulan adalah berbeza. Skor t kecil menandakan bahawa kumpulan adalah serupa.
Derajat kebebasan merujuk kepada nilai-nilai dalam suatu kajian yang mempunyai kebebasan untuk bervariasi dan penting untuk menilai kepentingan dan kesahihan hipotesis nol. Pengiraan nilai-nilai ini biasanya bergantung kepada bilangan rekod data yang terdapat dalam set sampel.
Ujian T Berterusan (atau Berpasangan)
Ujian t berkorelasi dilakukan apabila sampel biasanya terdiri daripada sepadan dengan pasangan unit serupa, atau apabila terdapat kes-kes berulang. Sebagai contoh, mungkin ada contoh pesakit yang sama yang diuji berulang-sebelum dan selepas menerima rawatan tertentu. Dalam kes sedemikian, setiap pesakit sedang digunakan sebagai sampel kawalan terhadap diri mereka sendiri.
Kaedah ini juga terpakai kepada kes-kes di mana sampel berkaitan dalam beberapa cara atau mempunyai ciri-ciri yang sepadan, seperti analisis perbandingan yang melibatkan kanak-kanak, ibu bapa atau adik-beradik. Ujian toresih atau berpasangan adalah jenis bergantung, kerana ini melibatkan kes di mana kedua-dua set sampel berkaitan.
Formula untuk mengira nilai t dan darjah kebebasan untuk ujian t berpasangan adalah:
- Mean1 dan mean2 adalah nilai purata setiap set sampel, manakala var1 dan var2 mewakili varians setiap set sampel.
Dua jenis yang lain tergolong dalam ujian t-bebas. Sampel-sampel jenis ini dipilih bebas dari satu sama lain-iaitu, data yang ditetapkan dalam kedua-dua kumpulan tidak merujuk kepada nilai-nilai yang sama. Mereka termasuk kes seperti sekumpulan 100 pesakit yang berpecah kepada dua set setiap 50 pesakit. Salah satu kumpulan menjadi kumpulan kawalan dan diberi plasebo, manakala kumpulan lain menerima rawatan yang ditetapkan. Ini merupakan dua kumpulan sampel bebas yang tidak berpasangan dengan satu sama lain.
Ujian T setara (atau dikumpulkan)
Ujian t-sama yang sama digunakan apabila bilangan sampel dalam setiap kumpulan adalah sama, atau varians kedua-dua set data adalah serupa. Formula berikut digunakan untuk mengira nilai t dan darjah kebebasan untuk ujian t-varians yang sama:
Ku Nilai-n = n1 + n2-2 (n1-1) × var12 + (n2-1) × var22 × n11 + n21 mean1-mean2 di mana: mean1 dan mean2 = Nilai purata masing-masing sampel setvar1 dan var2 = Perbezaan setiap set sampel1 dan n2 = Bilangan rekod dalam setiap set sampel
dan, Ku Darjah Kebebasan = n1 + n2-2 mana: n1 dan n2 = Bilangan rekod dalam setiap set sampel
Ujian T Unjustal T-Test
Ujian t-tidak sama rata digunakan apabila bilangan sampel dalam setiap kumpulan berbeza, dan varians kedua-dua set data juga berbeza. Ujian ini juga dikenali sebagai ujian t-Welch. Formula berikut digunakan untuk mengira nilai t dan darjah kebebasan untuk ujian t-varians yang tidak sama rata:
Ku T-nilai = n1var12 + n2var22 mean1-mean2 di mana: mean1 dan mean2 = Nilai purata setiap sampel dari setvar1 dan var2 = Perbezaan setiap set sampel1 dan n2 = Bilangan rekod dalam setiap set sampel
dan, Ku Derajat Kebebasan = n1-1 (n1var12) 2 + n2-1 (n2var22) 2 (n1var12 + n2var22) 2 di mana: var1 dan var2 = Perbezaan setiap set sampel1 dan n2 = rekod dalam setiap set sampel
Menentukan Ujian T yang Betul untuk Digunakan
Carta aliran berikut boleh digunakan untuk menentukan ujian t-mana yang harus digunakan berdasarkan ciri-ciri set sampel. Butiran utama untuk dipertimbangkan termasuk sama ada rekod sampel adalah sama, bilangan rekod data dalam setiap set sampel, dan varians setiap set sampel.
Imej oleh Julie Bang © Investopedia 2019
Contoh Ujian T Unjustal Unequal
Anggap kita mengambil ukuran lukisan pepenjuru yang diterima dalam galeri seni. Satu kumpulan sampel termasuk 10 lukisan, manakala yang lain termasuk 20 lukisan. Set data, dengan nilai min dan varians yang sama, adalah seperti berikut:
Tetapkan 1 | Tetapkan 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Maksudnya | 19.4 | 21.6 |
Perbezaan | 1.4 | 17.1 |
Walaupun rata-rata Set 2 lebih tinggi daripada Set 1, kita tidak boleh menyimpulkan bahawa semua lukisan mempunyai panjang purata sekitar 21.6 unit kerana variasi Set 2 jauh lebih tinggi daripada Set 1. Ini secara kebetulan, atau melakukan perbezaan benar-benar wujud dalam keseluruhan populasi semua lukisan yang diterima di galeri seni? Kami menubuhkan masalah dengan mengandaikan hipotesis nol bahawa min adalah sama antara kedua-dua set sampel dan menjalankan uji-t untuk mengesahkan jika hipotesis berlaku.
Oleh kerana bilangan rekod data adalah berbeza (n1 = 10 dan n2 = 20) dan varians juga berbeza, nilai t dan darjah kebebasan dikira untuk set data di atas menggunakan formula yang disebutkan dalam Ujian Unjustal Variance T seksyen.
Nilai t ialah -2.24787. Oleh kerana tanda minus boleh diabaikan apabila membandingkan dua nilai t, nilai yang dikira adalah 2.24787.
Nilai kebebasan darjah adalah 24.38 dan dikurangkan kepada 24, kerana takrif formula yang menghendaki penggenapan nilai kepada nilai integer yang paling kurang.
Apabila taburan normal diandaikan, seseorang boleh menentukan tahap kebarangkalian (tahap alfa, tahap kepentingan, p ) sebagai kriteria untuk penerimaan. Dalam kebanyakan kes, nilai 5% boleh diandaikan.
Dengan menggunakan nilai kebebasan sebagai 24 dan tahap penting 5%, melihat jadual edaran t-nilai memberikan nilai 2.064. Membandingkan nilai ini terhadap nilai dikira 2.247 menunjukkan bahawa nilai t yang dikira adalah lebih besar daripada nilai jadual pada tahap penting sebanyak 5%. Oleh itu, adalah selamat untuk menolak hipotesis nol bahawa tidak ada perbezaan antara cara. Set populasi mempunyai perbezaan intrinsik, dan mereka tidak secara kebetulan.
Bandingkan Akaun Pelaburan × Tawaran yang terdapat dalam jadual ini adalah dari perkongsian yang mana Investopedia menerima pampasan. Nama Penyedia DeskripsiTerma Berkaitan
Bagaimana Analisis Analisis Varians (ANOVA) Analisis Varians (ANOVA) merupakan alat analisis statistik yang memisahkan jumlah variabiliti yang terdapat dalam suatu data yang ditetapkan kepada dua komponen: faktor rawak dan sistematik. lebih banyak Definisi Z-Ujian Ujian z ialah ujian statistik yang digunakan untuk menentukan sama ada dua populasi bermakna berbeza apabila variasi diketahui dan saiz sampel adalah besar. lebih banyak Derajat Freedom Definition Degrees of Freedom merujuk kepada bilangan maksimum nilai logik bebas, iaitu nilai yang mempunyai kebebasan untuk berubah, dalam sampel data. lebih banyak Pengetahuan T Distribusi AT adalah jenis fungsi kebarangkalian yang sesuai untuk menganggar parameter populasi untuk saiz sampel kecil atau varians yang tidak diketahui. lagi Apa Semi-Deviasi Langkah Semi-penyimpangan adalah kaedah menilai turun naik purata di dalam pulangan pelaburan. Ia digunakan sebagai alternatif kepada sisihan piawai. lebih banyak Bonferroni Test Ujian Bonferroni adalah sejenis ujian perbandingan berbilang yang digunakan dalam analisis statistik. lebih banyak Pautan Rakan Kongsiartikel berkaitan
Ekonomi
Apakah andaian apabila membuat ujian t?
Pengurusan Risiko
Menggunakan Volatiliti Sejarah Untuk Mengukur Risiko Masa Depan
Strategi & Pendidikan Perdagangan Saham
Bagaimana Menggunakan Excel untuk Simulasi Harga Saham
Rasio Kewangan
Bagaimana anda mengira IRR dalam Excel?
Matematik & Statistik
Apakah Ralat Standard Relatif
Rasio Kewangan
Apakah formula untuk mengira nilai semasa bersih (NPV) dalam Excel?
