Instytut Informatyki PB
Zakład Oprogramowania
Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat: Składowe Główne
Zagadnienia: Definicja składowych głównych. Kryteria Hotelling’a i Pearson’a. Techniki numeryczne wyznaczania składowych głównych – rozwiązywanie symetrycznego zagadnienia własnego. Własności algebraiczne i statystyczne składowych głównych. Ładunki składowych głównych. Zastosowania – redukcja wymiarowości.
Treść ćwiczenia:
Wykorzystywane procedury SAS:
PROC PRINCOMP {opcje};
{VAR lista-zmiennych;}
{BY list-zmiennych;}
{FREQ zmienna;} - umożliwia podanie częstości występowania poszczególnych obserwacji opcje:
N = liczba - ilość składowych głównych,
COV – składowe są wyliczane z macierzy kowariancji, (domyślnie z macierzy korelacji),
OUT = zbiór SAS-a – tworzony jest wyjściowy zbiór zawierający oprócz oryginalnych danych również ładunki,
PREFIX = nazwa – umożliwia określenie prefiksu wykorzystywanego do nazwania kolejnych składowych
Przykładowe pytania sprawdzające:
1. W jakim celu liczymy składowe główne?
2. Dlaczego składowe główne uzyskiwane z macierzy kowariancji i korelacji mogą się różnić?
3. W jaki sposób oceniamy kolejne składowe?
4. Co to są ładunki (ang. scores)?
5. Dlaczego żądamy, aby wektory własne w procedurze wyznaczania składowych miały jednostkową długość?
Copyright © 1999 Marek Krętowski & Wojciech Kwedlo. All rights
reserved.
Revised: 00-03-10