rozmiar czcionki: - 0 + ++ +++
Technologia Informacyjna
notatki w internecie

Reprezentacja danych

Znaki pisarskie są reprezentowane przez liczby, określające pozycję (wskaźnik)danego symbolu w tablicy kodowej.

Tablice kodowe:

  • ASCII (ang. American Standard Code for Information Interchange)- 7-bitowy kod przyporządkowujący liczby z zakresu 0-127: literom (alfabetu angielskiego), cyfrom, znakom przestankowym i innym symbolom oraz poleceniom sterującym
  • Rozszerzony kod ASCII - posiada 256 pozycji (pierwsze 128 tak jak ASCII, następne kody narodowe i inne symbole). Problemem są różne kody dla różnych organizacji i krajów
  • Kody rodziny EBCDIC (ang. Extended Binary Coded Decimal Interchange Code) - EBCDIC to rozszerzony zapisywany dziesiętnie kod wymiany informacji, używany w systemach firmy IBM.
  • UNICODE
  • ISO 8859-x

ASCII

  • Opracowany dla urządzeń dalekopisowych, później przyjęty dla komputerów
  • 128 pozycji, w tym 95 znaków widocznych i 33 niewidoczne (znaki niewidoczne: spacja, odstęoy i inne kody formatujące)
  • Posiada kody sterujące transmisją i urządzeniami (pozycje 0..31)
  • Spacja - kod 32
  • Cyfry 0..9 - kody od 48 do 57 (0x30...0x39)
  • Litery w kolejności alfabetycznej (wielkie: 65..90 (0x41. 0x5a), małe: 97.122 (0x61.0x7a))
  • Odstęp pomiędzy małą i wielką literą wynosi 32 (0x20)
  • 127 - kod specjalny (kasowanie znaku)

Zobacz tablicę ASCII.

Rozszerzone kody na bazie ASCII

  • 256 pozycji kodowych - reprezentacja 8-bitowa
  • pierwsze 128 pozycji identycznych z ASCII
  • kolejne 128 pozycji reprezentuje znaki wybranej grupy alfabetów narodowych lub inne (np. znaki alfabetów słowiańskich, znaki alfabetów skandynawskich, alfabet grecki, cyrylica itp.)
  • Wiele tablic kodowych pochodzących z wielu źródeł, między innymi:
    » IS08859 - kilkanaście tablic (znaki polskie - IS08859-2)
    » Microsoft - kilkadziesiąt tablic, tzw.: „strony kodowe”- CP
  • Własne o lokalnym zasięgu, np. Mazovia, Polgaz

UNICODE

definicja UNICODE - uniwersalny kod znakowy, umożliwiający reprezentację wszystkich znaków pisarskich zapisu fonetycznego (głoskowego) używanych na całym świecie.

    Liczba pozycji kodowych jest praktycznie nieograniczona, (pierwotnie 216 obecnie 2 32). Wersja kodu 3.2 obejmuje 95.156 znaków (alfabet chiński, japoński, koreański, rosyjski, hebrajski, perski, tajski oraz szereg innych języków + symbole matematyczne i graficzne).

ISO 8859-1 Latin-1

  • formalnie ISO/IEC 8859-1, czy też Latin-1, "kodowanie zachodnioeuropejskie",
  • pierwsza część ISO/IEC 8859 — standardu kodowania znaków ustalonego przez Międzynarodową Organizację Normalizacyjną (później ISO i IEC)
  • Standard po rozszerzeniu o dodatkowe przypisania znaków, jest podstawą dla dwóch powszechnie używanych odwzorowań znaków, znanych jako ISO-8859-1 i Windows-1252.
  • Znak jest kodowany jako pojedyncza, 8-bitowa wartość.

ISO 8859-2

  • formalnie ISO/IEC 8859-2, Latin-2, środkowo i wschodnioeuropejskie
  • druga częścią standardu kodowania znaków zdefiniowanego przez organizację ISO.
  • 191 znaków łacińskiego pisma, z czego każdy jest zapisywany przy pomocy ośmiu bitów.

Dźwięk i obraz

    Dźwięk:

  • Chwilowa wartość napięcia reprezentującego ciśnienie akustyczne jest próbkowania z częstotliwością zależną od potrzeb (zwykle od 8 do 487kHz).
  • Wartości próbek są zapisywane jako liczby.

    Obraz rastrowy:

  • Jest zapisywany w postaci prostokątnej macierzy punktów (pikseli).
  • Każdemu pikselowi odpowiada jeden kolor.
  • Kolor jest reprezentowany w postaci trzech składowych - jasności świateł podstawowych.
  • Wartości jasności zapisane w postaci liczb.

Jednostki informacji

  • bit „b” - najmniejsza jednostka informacji, odpowiada informacji TAK-NIE, 1-0, PRAWDA-FAŁSZ
  • bajt (byte) - „B" - najmniejsza jednostka informacji adresowana przez procesor - obecnie 8 bitów
  • słowo (word) - jednostka informacji, na której operuje komputer
definicja Słowo procesora - jednostka informacji o długości naturalnej dla danego procesora (długość odpowiada długości rejestrów - obecnie 32 lub 64 bity).
definicja Słowo pamięci - jednostka informacji możliwa do przetransmitowania w jednym cyklu transmisji do lub z pamięci (obecnie zwykle 64 bity, niekiedy 128).
ważne Powyższe pojęcia są bardzo często mylone, warto zapamiętać różnice pomiędzy słowem procesora a słowem pamięci.

 

do góry