Instytut Informatyki PB
Zakład Oprogramowania
Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat: Wprowadzenie do pakietu SAS - wczytywanie danych
Zagadnienia: Trzy style czytania danych z zewnętrznego pliku: listowy (list input), kolumnowy (column input) oraz wykorzystujący informaty. Wybrane informaty; mieszanie stylów wczytywania danych; bardziej skomplikowane sytuacje (jedna linia - wiele obserwacji, wiele linii - jedna obserwacja, czytanie tylko częsci pliku). Opcje wyrażenia INFILE.
Informaty (uwaga na kropkę):
- znakowe: $informatw. (np: $CHARw.
$HEXw. $w. )
- numeryczne: informatw.d (np: COMMAw.d
PERCENTw. )
- daty: informatw. (np: DATEw.
MMDDYYw. )
Opcje wyrażenia INFILE:
- FIRSTOBS=n - umożliwia rozpoczęcie wczytywania danych od
linii nr n;
- MISSOVER - w przypadku napotkania końca linii nie
przechodzimy do następnej linii,
wszystkie
pozostałe zmienne obserwacji przyjmują wartość brakującą;
- PAD - uzupełnia wszystkie czytane linie spacjami do maksymalnej
dlugości linii (domyślna długość 132);
- DLM - wykorzystywane do zmiany domyślnego separatora (np:
DLM=',' oznacza przecinek jako separator) ;
Przykładowe programy SAS:
DATA lab_2; /* Styl kolumnowy */
INFILE 'c:\data\kolumny.txt' FIRSTOBS=2; /* Opuszczamy pierwszą linię */
INPUT nazwa $ 1-20 ilosc 21-25 wartosc 30-39;
RUN;DATA lab_2; /*Wykorzystanie informatów */
INFILE 'c:\data\inne.txt';'
INPUT nazwa $20. ilosc 3. +2 data MMDDYY8. (kwota1 kwota2 kwota3) (10.2);
/* +n oznacza przesunięcie o n znaków */
RUN;DATA lab_2; /* Mieszanie stylów wczytywania danych*/
INFILE 'c:\data\inne.txt';'
INPUT nazwa $ 1-20 ilosc kraj $ cena @50 wartosc COMMA10.;
/* @n oznacza przeskok do kolumny numer n */
RUN;
Copyright © 2000 Marek Krętowski & Wojciech Kwedlo. All rights
reserved.
Revised: 2000-03-10