Histogram przedstawia wartości zmiennej liczbowej w postaci serii słupków. Każdy słupek obejmuje zwykle zakres wartości liczbowych zwany przedziałem lub klasą, a jego wysokość wskazuje częstotliwość występowania punktów danych o wartości w tym przedziale.
Wybór wielkości binów jest zazwyczaj kwestią oceny. W przypadku dużych zbiorów danych wybór optymalnego rozmiaru binów staje się bardzo skomplikowany.
Oś X
Histogram jest wykresem słupkowym, który wizualizuje rozkład zmiennej liczby ciągłej poprzez pomiar częstotliwości występowania pewnych wartości. Składa się z osi x, osi y i różnych słupków o różnej wysokości, zwanych koszami.
Oś x jest poziomą linią, której początkiem jest 0. Oś y jest pionową linią poprowadzoną od dołu do góry, o tym samym początku co oś x.
W geometrii współrzędnych osie są liniami, które definiują układ współrzędnych z początkiem w punkcie 0 i uporządkowanymi parami liczb do lokalizacji punktów. Zapisuje się je w nawiasach jako (x, y).
Zazwyczaj liczbę na osi x umieszcza się na prawo od punktu, a liczbę na osi y na lewo od punktu. Odpowiednie liczby dla danego punktu zapisuje się w kolejności, od dołu do góry siatki współrzędnych.
Oś może być oznaczona nazwą odpowiadającą wykreślanym danym, np. wysokość na osi x lub częstotliwość względna na osi y. Może być również oznaczona opisem wykreślanych danych, takim jak procent lub prawdopodobieństwo.
Histogramy tworzone są w R za pomocą funkcji hist, która przyjmuje wektor i jeszcze kilka parametrów do wykreślenia histogramu. Na przykład hist(v, main, col) tworzy histogram dla kolumny v zbioru danych o nazwie Swiss o wartości egzamin.
Aby narysować histogram, najpierw zaimportuj do R zbiór danych. W zależności od potrzeb możesz znaleźć istniejący lub użyć wbudowanego w program.
Następnie dodaj funkcję hist do bloku kodu. Spowoduje to automatyczne wywołanie funkcji w celu utworzenia histogramu z wartościami z twojego wektora w kolumnie v.
Po utworzeniu histogramu możesz zmienić jego etykiety, edytując właściwości osi x i osi y. Na przykład zmiana etykiety na osi y z “frequencies” na “relative frequencies” zmieni wygląd histogramu. Możesz również dodać etykiety do osi x, takie jak “maksimum” lub “średnia”, klikając ikonę etykiety obok każdej opcji na karcie Dane w panelu Właściwości wykresu.
Oś Y
Oś Y, zwana również osią rzędnych, jest jedną z najważniejszych osi w matematyce. Jest to pionowa linia na wykresie współrzędnych, która może być użyta do reprezentowania liczb i pomiarów.
Uczniowie zaczynają rozumieć oś Y, gdy poznają pary współrzędnych, takie jak (1,6) i (2,5). Używają tych par współrzędnych do rysowania i przekładania prostych kształtów na płaszczyźnie współrzędnych i odzwierciedlania ich na wykresie osi Y. Rozpoznają również i stosują odbicie w różnych diagramach, w tym z wykorzystaniem narzędzi ICT do wykreślania współrzędnych.
Aby narysować histogram, parametry x i y twoich danych są podzielone na biny (przedziały) o równej szerokości. Następnie biny są sumowane, aby uzyskać wartość histogramu. W zależności od rodzaju histogramu, który tworzysz, mogą istnieć różne sposoby podziału parametrów x i y.
W histogramie, dzielenie bloków może ułatwić zobaczenie rozkładu danych. Często biny są równomiernie rozmieszczone w całym przedziale, ale czasami nie są. Użycie suwaka Bin Offset pomoże określić, jak blisko powinny być rozmieszczone kosze.
Histogram może być rysowany w przestrzeni kartezjańskiej, biegunowej lub pseudo gwałtownie i może zawierać kolorowe kontury, jak również tekst. Opcje CYL, SPH i PSR pozwalają rysować kontury na sferze, cylindrze lub w przestrzeni pseudoszybkiej, natomiast opcje L i TEXT rysują tylko zawartość binów i nie zapewniają obszaru wypełnienia.
Aby stworzyć histogram, który ma spójne szerokości binów w poprzek osi, można użyć konstruktora TH1(option_t *opt). Tworzy on histogram, który zawiera biny o jednakowej szerokości zarówno dla osi X jak i Y. Alternatywnie można użyć funkcji TH1::Smooth do wygładzenia zawartości binarek. Na koniec możesz użyć funkcji TH1::Integrate, aby zintegrować zawartość binów wzdłuż osi i zwrócić ich całkę.
Paski
Histogram jest rodzajem wykresu słupkowego używanego do przedstawienia rozkładu pewnego typu danych. Składa się on z przylegających do siebie pól oraz osi poziomej i pionowej. Oś x reprezentuje dane ciągłe, natomiast oś y przedstawia wartość częstotliwości (względną).
Histogramy są jednym z rodzajów wykresu słupkowego, ale różnią się od innych typów na kilka sposobów. Po pierwsze, histogramy wymagają tylko jednego zestawu danych liczbowych (ilościowych) do wykreślenia. Wyświetlają one również szerszy zakres punktów danych niż wykresy słupkowe, które wykorzystują zmienne dyskretne.
Po drugie, histogramy mają uporządkowaną organizację, co oznacza, że kosze lub zakresy są zorganizowane w porządku rosnącym. Dzięki temu łatwiej jest znaleźć konkretne przedziały i porównać je ze sobą.
Po trzecie, histogramy są dobrym wyborem do wyświetlania brakujących lub nieznanych wartości. Te wartości są często pomijane podczas tworzenia wykresu słupkowego, więc ważne jest, aby uwzględnić histogram w tym celu.
Ponadto histogramy mogą być bardzo przydatne w podkreślaniu trendów. Na przykład, jeśli liczba osób odwiedzających ten sam bar podczas weekendu wzrasta lub spada, narysowanie histogramu pokazującego ten trend może być bardzo pouczające.
Chociaż histogramy nie są tak popularne jak inne typy wykresów, mogą być świetnym narzędziem do wyświetlania różnych danych. Są one szczególnie przydatne do prezentacji dużych zestawów danych i są często dostępne w większości narzędzi wizualizacyjnych.
Histogramy są szybkim i łatwym sposobem wizualizacji szerokiego zakresu punktów danych, ale mogą być trudne do utworzenia, jeśli długości lub szerokości słupków nie odpowiadają przedziałom. Dobrą zasadą jest używanie jednakowych rozmiarów słupków lub klas, aby proporcjonalnie reprezentować przedziały. Jednak może to być wyzwaniem, gdy interwał jest bardzo szeroki lub bardzo wąski.
Linie
Histogram to wykres podsumowujący dane ciągłe w formacie graficznym. Wyświetla on różne statystyki opisowe, takie jak średnia i mediana, i może być używany do porównywania rozkładu różnych zmiennych w zbiorze danych.
Linia to podstawowy zarys, który stanowi podstawę histogramu. Składa się on z linii poziomych i pionowych, które mają określone znaczenie i mogą się zmieniać wraz ze zmianami reprezentowanej zmiennej.
Liczba poziomych i pionowych linii tworzących histogram nazywana jest jego “bin size”. Podział zakresu danych na biny może mieć różne efekty interpretacyjne, takie jak zwiększenie lub zmniejszenie poziomu szumu. Wybór odpowiedniego rozmiaru bloku jest niezbędny, aby histogram dokładnie odzwierciedlał dane.
Dla wielu typów danych wybór rozmiaru binów jest prosty i zazwyczaj nie wymaga większego zastanowienia. Na przykład, gdy wartości są odniesione do okresów czasu (np. 30 sekund, 20 minut), binning według czasu ma sens.
Jednakże, gdy cecha oparta na czasie jest wykreślana jako histogram, czasami nie jest jasne, które biny powinny być wybrane. W takich przypadkach pomocne może być wypróbowanie kilku różnych rozmiarów koszy, aby zobaczyć, który z nich jest najbardziej odpowiedni dla wykreślanych danych.
Podczas rysowania histogramu należy również wybrać skalę dla osi pionowej. Wybór ten zależy od Ciebie, ale dobrym pomysłem jest rozpoczęcie wykresu od liczby, która dzieli wszystkie częstotliwości w Twoim zestawie danych.
Kolejną rzeczą, o której należy pamiętać podczas rysowania histogramu jest wysokość każdego słupka. To reprezentuje prawdopodobieństwo, że dany punkt danych mieści się w każdym binie.
Aby narysować histogram, musisz użyć linijki i narysować linie, które tworzą podstawowy zarys twojego wykresu. Kiedy już to zrobisz, możesz dodać więcej informacji do swojego wykresu, mierząc grupy, do których należą dane i zaznaczając je na osi. Te zestawy liczb pomogą Twoim odbiorcom zrozumieć rozkład danych i co on dla nich oznacza.
Podobne tematy