Instytut Informatyki PB
Zakład Oprogramowania

Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat:  Macierze Kowariancji i Korelacji

Zagadnienia: Populacyjne macierze kowariancji i korelacji – definicje i własności. Metody estymacji macierzy kowariancji i korelacji. Współczynnik korelacji Pearsona i współczynnik korelacji rang Spearmana. Korelacja a niezależność zmiennych.

Treść ćwiczenia: Dla podanego zbioru danych eksperymentalnych:

  1. Obliczyć macierz kowariancji i macierz korelacji;
  2. Wskazać zmienne najbardziej (najmniej) skorelowane i sporządzić ich wykresy rozproszeń;
  3. Zbadać czy (jak) zmieniają się macierze kowariancji i korelacji w poszczególnych klasach;
  4. Utworzyć na podstawie dowolnej zmiennej V z oryginalnego zbioru dodatkową zmienną Z, tak że Z=aV+b  i wyznaczyć korelacje i kowariancje zmiennych V i Z;
  5. Zmienić skalę pomiarową rozpatrywanego zbioru (przykładowo pomiary podawane w cm wyrażamy w metrach), i sprawdzić czy (jaki) ma wpływ taka operacja na analizowane macierze;

Wykorzystywane procedury SAS:

PROC CORR {COV SPEARMAN}; {} - opcjonalne
        {VAR lista-zmiennych;}
        {WITH lista-zmiennych;}
        {BY list-zmiennych;}

        COV – oblicza macierz kowariancji;
        SPEARMAN – oblicza współczynniki korelacji rang Spearmana.

Przykładowe pytania sprawdzające:

1. Na czym polegają różnice pomiędzy macierzą korelacji a macierzą kowariancji?
2. Jeżeli zmienne losowe są niezależne to co możemy powiedzieć o współczynniku korelacji?
3. Ile wynosi współczynnik korelacji zmiennych liniowo zależnych?
4. O czym mówi znak współczynnika korelacji?
5. Przekątne macierzy kowariancji i korelacji zawierają odpowiednio …
6. Czy mogą macierze korelacji i kowariancji być sobie równe ?(Kiedy?)

Powrót   


Copyright © 1999 Marek Krętowski & Wojciech Kwedlo. All rights reserved.
Revised: 99-11-03