PDF pagePrint page

Dla celów ilustracyjnych wykorzystano zbiór danych iris pochodzący z bazowego pakietu datasets. Ponieważ zbiór ten zawiera identyczną ilość danych dla każdego z gatunków, postanowiono pozbyć się paru wpisów w celu urozmaicenia wykresów. Pierwszych 6 wierszy zbioru wygląda następująco:

Histogram

Histogram umożliwia nam zaprezentowanie rozkładu zmiennej liczbowej. Rezultatem jest możliwość odczytania częstości występowania poszczególnych wartości w serii danych. Przykładowo w stworzonym przez nas poniżej histogramie szerokość płatku sepal wynosząca 3.0 występuje w 25 instancjach zbioru danych iris.

Histogram dla częstości występowania pomiaru.
Histogram dla częstości występowania pomiaru.

Wykres pudełkowy

Wykres pudełkowy wizualizuje 5 podstawowych statystyk dla rozkładu zmiennej liczbowej: wartość minimalną, pierwszy kwartyl (kwantyl rzędu 0.25), medianę, drugi kwartyl (kwantyl rzędu 0.75) oraz wartość maksymalną. W przykładzie zwizualizujemy zmienną charakteryzującą szerokość kwiatu sepal:

Wykres pudełkowy w akcji.
Wykres pudełkowy w akcji.

Idąc od dołu odczytujemy następujące wartości: wartość minimalna (2.3 – dolny wąs), pierwszy kwartyl (2.8 – dolna krawędź pudełka), mediana (3 – gruba linia na środku pudełka), trzeci kwartyl (3.3 – górna krawędź pudełka) oraz wartość maksymalna (4 – górny wąs). Kółeczka oznaczają marginalne wartości, odrzucane przy wyliczaniu podstawowych statystyk.

Wykres kołowy

Największą bolączką pokazanego wykresu kołowego jest próba rozróżnienia liczebności gatunków setosa versicolor. Różnica procentowa pomiędzy nimi wynosi 4.1% i jest ciężka do zaobserwowania.

Wykres kołowy z procentowym udziałem gatunków w zbiorze new_iris
Wykres kołowy z procentowym udziałem gatunków w zbiorze new_iris

Wykres wachlarzowy

Problem rozróżnienia liczebności gatunków częściowo rozwiązuje wykres wachlarzowy, który lepiej ukazuje proporcje występujące pomiędzy wartościami. Wykres ten nie jest częścią standardowego R i wymaga instalacji pakietu plotrix.

Wykres wachlarzowy liczebności gatunków w zbiorze new_iris
Wykres wachlarzowy liczebności gatunków w zbiorze new_iris

 Wykres słupkowy

Wykres ten umożliwia wizualizacje wartości przy pomocy wysokości słupka. Posłuży nam do zaprezentowania dokładnej liczebności poszczególnych gatunków irysów. Do wyliczenia częstości występowania poszczególnych cech grupujących posłuży nam funkcja table().

Wykres słupkowy ilości gatunków w zbiorze new iris
Wykres słupkowy ilości gatunków w zbiorze new_iris