Pogrupowane dane i niepogrupowane dane
Dane słowo odnosi się do informacji, które są gromadzone i rejestrowane. Może to być liczba, słowa, pomiary i wiele więcej.
Istnieją dwa rodzaje danych, które są danymi jakościowymi i danymi ilościowymi. Różnica między tymi dwoma rodzajami danych polega na tym, że dane ilościowe są używane do opisu informacji liczbowej. Na przykład pomiar temperatury mieści się w ramach tego rodzaju danych.
Z drugiej strony dane jakościowe są używane do opisu informacji w słowach. Po zebraniu danych należy je uporządkować, dlatego należy oddzielić pogrupowane dane od niezgrupowanych danych. Obie są przydatnymi formami danych, ale różnica między nimi polega na tym, że niezgrupowane dane są danymi nieprzetworzonymi. Oznacza to, że został właśnie zebrany, ale nie został posortowany w żadnej grupie lub klasach. Z drugiej strony, zgrupowane dane to dane, które zostały uporządkowane w grupy na podstawie nieprzetworzonych danych.
Co to jest zgrupowane dane?
Jak wspomniano powyżej, zgrupowane dane to rodzaj danych, które są klasyfikowane w grupy po pobraniu. Surowe dane są podzielone na różne grupy i tworzona jest tabela. Podstawowym celem tabeli jest pokazanie punktów danych występujących w każdej grupie. Na przykład po zakończeniu testu wyniki są danymi w tym scenariuszu i istnieje wiele sposobów grupowania tych danych. Na przykład można zarejestrować liczbę studentów, którzy uzyskali ocenę powyżej 20 punktów.
Alternatywnie można zastosować stopnie. Na przykład 90-100 do F 0-59 z każdą kategorią pokazującą, ilu uczniów jest w każdej kategorii. Histogramy i tabela częstotliwości najlepiej służą do wyświetlania i interpretowania zgrupowanych danych. Oto przykład
Grupowanie danych ma następujące zalety:
- Pomaga w poprawie wydajności oszacowań.
- Pozwala na większe zrównoważenie statystycznej mocy testów różnic między warstwami poprzez analizę równej liczby warstw.
- Nieistotne subpopulacje są ignorowane, podczas gdy istotne koncentrują się na nich.
Co to są dane rozgrupowane?
Niezgrupowane dane, które są również określane jako nieprzetworzone, to dane, które nie zostały umieszczone w żadnej grupie lub kategorii po ich zebraniu. Dane są podzielone na liczby lub cechy, zatem dane, które nie zostały umieszczone w żadnej z kategorii, są rozgrupowane. Na przykład podczas przeprowadzania spisu i chcesz przeanalizować, ile kobiet powyżej 45 roku życia znajduje się na danym obszarze, najpierw musisz wiedzieć, ile osób mieszka w tej okolicy.
Liczba osób zamieszkujących w tym obszarze to niezgrupowane dane lub nieprzetworzone informacje, ponieważ nic nie zostało zaklasyfikowane. Możemy zatem stwierdzić, że niezgrupowane dane są danymi wykorzystywanymi do wyświetlania informacji na temat pojedynczego członka próby lub populacji.
Niektóre zalety niezgrupowanych danych są następujące;
- Większość ludzi może z łatwością to zinterpretować.
- Gdy wielkość próby jest mała, łatwo jest obliczyć średnią, tryb i medianę.
- Nie wymaga ekspertyzy technicznej do jej analizy.
Różnice między danymi zgrupowanymi a niepogrupowanymi
Pogrupowane dane to dane uporządkowane w klasach po analizie. Przykłady obejmują ilość worków kukurydzy zebranych podczas pory deszczowej. Z drugiej strony niezgrupowane dane to dane, które nie należą do żadnej grupy. To wciąż surowe dane.
Podczas gromadzenia danych preferowane są niezgrupowane dane, ponieważ informacje są nadal w oryginalnej formie. Nie została naruszona przez klasyfikację lub podział. Jednak podczas analizy i rysowania wykresów preferowane są pogrupowane dane, ponieważ są łatwe w interpretacji.
Podczas obliczania środków pogrupowanych i niezgrupowanych danych nastąpi zmiana. Średnia zgrupowanych danych jest preferowana, ponieważ jest bardziej dokładna w porównaniu ze średnią niezgrupowanych danych. Średnia niezgrupowanych danych może prowadzić do niewłaściwej manipulacji medianą, dlatego w większości przypadków jest uważana za nieskuteczną.
Tabele częstotliwości służą do wyświetlania informacji o zgrupowanych danych, natomiast w przypadku niezgrupowanych danych informacja wygląda jak duża lista liczb. Wynika to z faktu, że informacje są nadal surowe.
Pogrupowane dane to dane podzielone na rozkład częstotliwości, podczas gdy niezgrupowane dane nie zostały w żaden sposób podsumowane.
Pogrupowane dane niepogrupowane danych
Podsumowanie zgrupowanych danych weryfikuje dane zgrupowane
- W statystykach termin dane jest używany w odniesieniu do informacji, które zostały zebrane i zarejestrowane dla celów konkretnych projektów i mogą być jakościowe lub ilościowe.
- Zarówno dane pogrupowane, jak i niezgrupowane są typami danych, jednak pogrupowane dane zostały podzielone na kategorie oparte na podobnych cechach charakterystycznych, natomiast dane niezgrupowane to dane surowe.
- Oba typy danych mogą być reprezentowane przez tabele częstotliwości. Jednak w przypadku zgrupowanych danych nie ma ograniczeń dotyczących klasy, a więc wykorzystanie znaków. Pogrupowane dane w tabeli częstotliwości mają ograniczenia, a to jest limit górnej klasy i niższy limit klasy.
- Oba typy danych można wykorzystać do obliczenia średniej, trybu i mediany próbek populacji, dlatego są użyteczne.