Parametryczny i nieparametryczny

Anonim

Badacze społeczni często konstruują hipotezę, w której zakładają, że pewna uogólniona zasada może być zastosowana do populacji. Testują tę hipotezę za pomocą testów, które mogą być parametryczne lub nieparametryczne. Testy parametryczne są zwykle bardziej powszechne i są badane znacznie wcześniej niż standardowe testy stosowane podczas przeprowadzania badań.

Proces przeprowadzania badań jest stosunkowo prosty - konstruujesz hipotezę i zakładasz, że pewne "prawo" można zastosować do populacji. Następnie przeprowadzasz test i gromadzisz dane, które następnie analizujesz statystycznie. Zebrane dane można zwykle przedstawić w postaci wykresu, a hipotetyczne prawo jako średnią wartość tych danych. Jeżeli hipoteza prawa i wartości średniej jest zgodna, hipoteza zostaje potwierdzona.

Jednak w niektórych przypadkach znalezienie średniej wartości nie jest najodpowiedniejszym sposobem wyszukiwania prawa. Doskonałym przykładem jest rozkład całkowitego dochodu. Jeśli nie pasowałeś do wartości średniej, to prawdopodobnie dlatego, że jeden lub dwóch miliarderów zakłóca twoje średnie wartości. Jednak mediana da o wiele dokładniejszy wynik na średnim dochodzie, który jest bardziej prawdopodobne, aby dopasować swoje dane.

Innymi słowy, test parametryczny zostanie użyty, gdy założenia przyjęte w odniesieniu do populacji są jasne i istnieje wiele dostępnych informacji na ten temat. Pytania zostaną zaprojektowane w celu zmierzenia tych konkretnych parametrów, aby dane mogły być następnie analizowane, jak opisano powyżej. Test nieparametryczny jest stosowany, gdy badana populacja nie jest całkowicie znana, a zatem badane parametry również nie są znane. Dodatkowo, podczas gdy test parametryczny wykorzystuje jako wyniki średnie wartości, test nieparametryczny przyjmuje medianę, a zatem jest zwykle wykorzystywany, gdy pierwotna hipoteza nie pasuje do danych.

Czym jest test parametryczny?

Test parametryczny jest testem zaprojektowanym w celu dostarczenia danych, które następnie będą analizowane za pośrednictwem gałęzi nauki zwanej statystyką parametryczną. Statystyka parametryczna zakłada, że ​​pewne informacje o populacji są już znane, a mianowicie rozkład prawdopodobieństwa. Jako przykład, rozkład wysokości ciała na całym świecie jest opisany przez normalny model dystrybucji. Podobnie jak każdy znany model dystrybucji może być zastosowany do zbioru danych. Jednak, zakładając, że dany model dystrybucji pasuje do zbioru danych, oznacza to, że z założenia przyjmujesz, że pewne dodatkowe informacje są znane na temat populacji, jak już wspomniałem. Rozkład prawdopodobieństwa zawiera różne parametry opisujące dokładny kształt rozkładu. Parametry te są tym, co zapewniają testy parametryczne - każde pytanie jest dostosowane, aby podać dokładną wartość pewnego parametru dla każdej z badanych osób. Łącznie, średnia wartość tego parametru jest używana dla rozkładu prawdopodobieństwa. Oznacza to, że testy parametryczne również przyjmują coś na temat populacji. Jeśli założenia są poprawne, statystyki parametryczne zastosowane do danych dostarczonych przez test parametryczny dadzą wyniki, które są znacznie dokładniejsze i dokładniejsze niż wyniki testu nieparametrycznego i statystyk.

Co to jest test nieparametryczny?

W podobny sposób do testowania parametrycznego i statystyk istnieje nieparametryczny test i statystyki. Są używane, gdy nie oczekuje się, że uzyskane dane pasują do normalnej krzywej rozkładu lub danych porządkowych. Doskonałym przykładem danych porządkowych jest ocena, którą opuścisz, oceniając dany produkt lub usługę na skali od 1 do 5. Dane ogólne zazwyczaj uzyskuje się z testów, które korzystają z różnych rankingów lub zamówień. Dlatego nie opiera się na liczbach ani dokładnych wartościach parametrów, na których polegały testy parametryczne. W rzeczywistości nie wykorzystuje w żaden sposób parametrów, ponieważ nie przyjmuje określonej dystrybucji. Zwykle analiza parametryczna jest preferowana względem analizy nieparametrycznej, ale jeśli nie można przeprowadzić testu parametrycznego z powodu nieznanej populacji, konieczne jest zastosowanie testów nieparametrycznych.

Różnica między testami parametrycznymi i nieparametrycznymi

1) Dokonywanie założeń

Jak już wspomniałem, test parametryczny przyjmuje założenia dotyczące populacji. Potrzebuje parametrów związanych z rozkładem normalnym, który jest używany w analizie, a jedynym sposobem poznania tych parametrów jest posiadanie pewnej wiedzy na temat populacji. Z drugiej strony test nieparametryczny, jak wskazuje nazwa, nie opiera się na żadnych parametrach i dlatego nie zakłada niczego na temat populacji.

2) Prawdopodobieństwo parametrycznego i nieparametrycznego

Podstawą analizy statystycznej, która zostanie wykonana na danych, w przypadku testów parametrycznych, jest rozkład probabilistyczny. Z drugiej strony podstawa do testów nieparametrycznych nie istnieje - jest całkowicie arbitralna. Zapewnia to większą elastyczność i ułatwia dopasowanie hipotezy do zebranych danych.

3) Pomiar tendencji centralnej

Miara tendencji centralnej jest wartością centralną w rozkładzie prawdopodobieństwa. I chociaż rozkład prawdopodobieństwa w przypadku statystyk nieparametrycznych jest arbitralny, to nadal istnieje, a zatem także miara tendencji centralnej. Jednak środki te są różne.W przypadku testów parametrycznych przyjmuje się, że jest to wartość średnia, natomiast w przypadku testów nieparametrycznych przyjmuje się wartość średnią.

4) Znajomość parametrów populacji

Jak już wspomniałem w pierwszej różnicy, informacje o populacji różnią się między parametrycznymi i nieparametrycznymi testami i statystykami. Mianowicie, pewna wiedza na temat populacji jest absolutnie niezbędna do analizy parametrycznej, ponieważ wymaga parametrów związanych z populacją w celu uzyskania precyzyjnych wyników. Z drugiej strony, podejście nieparametryczne może być podejmowane bez jakiejkolwiek wcześniejszej wiedzy na temat populacji.

Testy parametryczne vs. testy nieparametryczne: tabela porównawcza

Podsumowanie parametryczne i nieparametryczne

  • Test parametryczny jest testem, który zakłada, że ​​pewne parametry i rozkłady są znane populacji, w przeciwieństwie do nieparametrycznej
  • Test parametryczny wykorzystuje wartość średnią, podczas gdy wartość nieparametryczna wykorzystuje wartość średnią
  • Podejście parametryczne wymaga wcześniejszej wiedzy na temat populacji, w przeciwieństwie do podejścia nieparametrycznego