PDF pagePrint page

Wykonywanie instrukcji

Praca w środowisku R przebiega w sposób interaktywny i oparta jest o wykonywanie instrukcji. Instrukcje mogą być kolejno wpisywane i uruchamiane z konsoli. Innym podejściem jest tworzenie plików skryptowych zawierających zbiór instrukcji do wykonania w sposób sekwencyjny. Pliki takie posiadają rozszerzenie *.R i uruchamiane są w całości. Jedną z najprostszych instrukcji jest dodawanie:

W wyniku otrzymaliśmy wektor jednoelementowy z wynikiem dodawania 5. W przedstawionych przykładach znak > jest znakiem zachęty do wpisywania instrukcji w konsoli R. Znak zachęty będzie pojawiać się w notatkach wszędzie tam, gdzie chcemy zaprezentować wyniki uruchomionej w konsoli instrukcji. Tekst znajdujący się po znaku jest komentarzem i jest całkowicie ignorowany przez środowisko R. Zapisanie i przechowanie w zmiennej wyniku dodawania umożliwia operator przypisania <-:

Wpisanie w konsoli nazwy zmiennej wyświetla jej zawartość. Stworzone przez nas zmienne możemy wykorzystywać w kolejnych instrukcjach. Oprócz prostych instrukcji i przypisań R posiada ogromną ilość funkcji:

Możliwości języka R można podejrzeć dzięki specjalnie przygotowanym prezentacjom:

Korzystanie z pomocy

Liczba instrukcji, funkcji i parametrów dostępnych w R jest przytłaczająca. Dlatego warto poznać funkcje umożliwiające uzyskanie pomocy i dodatkowych informacji. Dostęp do pomocy w środowisku R zaprezentujemy na przykładzie funkcji max() zwracającej największą z podanych liczb.

Środowisko R posiada w wbudowanym pakiecie datasets ponad 100 zbiorów danych. Funkcja data() wyświetla ich nazwy. Ulotki pakietów, tzw. vignette to pliki pdf zawierające dodatkowe informacje o pakiecie. Warto nadmienić, że nie każdy pakiet dostarcza swoje ulotki.

Zarządzanie obszarem roboczym

Sesja ze środowiskiem R korzysta z katalogu oraz obszaru roboczego. Katalog roboczy to miejsce na dysku, w którym przechowujemy wykorzystywane w sesji pliki z danymi oraz skrypty. Obszar roboczy przechowuje stworzone przez nas zmienne wraz z ich wartościami. Poniższe funkcje umożliwiają manipulację obydwoma obiektami:

Ścieżki względne plików są zawsze relatywne do aktualnie ustawionego katalogu roboczego. Środowisko R zapamiętuje wszystkie wpisane instrukcje w celu ułatwienia ich ponownego wykonania.

Pakiety rozszerzające

Cechą charakterystyczną ekosystemu środowiska R jest ogromna liczba rozszerzeń dostępnych do ściągnięcia w postaci pakietów. W chwili pisania główne repozytorium pakietów R zawiera ich ponad 6694. Zainstalujemy pakiet do uczenia maszynowego RWeka wykorzystywany w drugiej części notatek. Pakiet ten jest nakładką na narzędzie Weka i umożliwia tworzenie oraz uruchamianie eksperymentów uczenia maszynowego.

Każdy z niestandardowych pakietów przed użyciem musi zostać załadowany przy użyciu funkcji library(). Funkcja ta ładuje pakiet tylko i wyłącznie, gdy jest on niezaładowany bądź został uaktualniony. Domyślnie załadowane są tylko podstawowe pakiety takie jak base, utilsdatasets czy graphics. Funkcja instalująca pakiet install.packages() przyjmuje jako argument łańcuch znaków zawarty w cudzysłowie. Natomiast funkcja ładująca pakiet library() przyjmuje jego nazwę bez cudzysłowu.