Instytut Informatyki PB
Zakład Oprogramowania

Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat:  Analiza Regresji – model liniowy

Zagadnienia: Definicja i założenia modelu liniowego regresji. Kryterium najmniejszych kwadratów. Postać modelu optymalnego. Współczynnik determinacji R2 oraz współczynnik korelacji wielokrotnej R. Wykres residuów. Selekcja cech w regresji.

Treść ćwiczenia:

  1. Na podstawie dwóch dostarczonych zbiorów (A i B) danych przeprowadzić analizę związku liniowego zmiennej zależnej w funkcji zmiennych objaśniających. Uzyskane wyniki przedstawić również w postaci wykresów, ze szczególnym uwzględnieniem wykresów reszt.
  2. Przeprowadzić analizę podanego, rzeczywistego zbioru danych (C), stosując trzy metody tworzenia modelu (selekcji cech).

Wykorzystywane procedury SAS:

PROC REG {opcje};
        MODEL zm-zależna = lista-zm-niezależnych {/ opcje modelu};
            {VAR lista-zmiennych;}
            {BY list-zmiennych;}
            {PLOT y-zmienna * x-zmienna;} – poza standardowymi możliwościami PLOT możemy wykorzystywać predefiniowane statystyki:  P. – wartość przewidywana, R. – reszty

        opcje:
            {OUTTEST = zbiór-danych-SAS} – tworzy zbiór zawierający wyestymowane parametry oraz opcjonalne statystyki

        opcje modelu:
            {SELECTION= model} – wybór modelu, np. FORWARD, BACKWARD, STEPWISE, MAXR
            {BEST= ilość} – maksymalna liczba wybranych zmiennych

Przykładowe pytania sprawdzające:

1. Co to są reszty (ang. residuals)?
2. Współczynnik determinacji określa … .
3. Kiedy współczynnik korelacji wielokrotnej przyjmuje wartość największą (jaką)?
4. Jakie założenia o błędach przyjmujemy w klasycznym modelu regresji ?

Powrót   


Copyright © 1999 Marek Krętowski & Wojciech Kwedlo. All rights reserved.
Revised: 00-03-10