Instytut Informatyki PB
Zakład Oprogramowania
Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat: Analiza Regresji – model liniowy
Zagadnienia: Definicja i założenia modelu liniowego regresji. Kryterium najmniejszych kwadratów. Postać modelu optymalnego. Współczynnik determinacji R2 oraz współczynnik korelacji wielokrotnej R. Wykres residuów. Selekcja cech w regresji.
Treść ćwiczenia:
Wykorzystywane procedury SAS:
PROC REG {opcje};
MODEL zm-zależna = lista-zm-niezależnych {/ opcje modelu};
{VAR lista-zmiennych;}
{BY list-zmiennych;}
{PLOT y-zmienna * x-zmienna;} – poza standardowymi możliwościami PLOT możemy wykorzystywać predefiniowane statystyki: P. – wartość przewidywana, R. – reszty
opcje:
{OUTTEST = zbiór-danych-SAS} – tworzy zbiór zawierający wyestymowane parametry oraz opcjonalne statystyki
opcje modelu:
{SELECTION= model} – wybór modelu, np. FORWARD, BACKWARD, STEPWISE, MAXR
{BEST= ilość} – maksymalna liczba wybranych zmiennych
Przykładowe pytania sprawdzające:
1. Co to są reszty (ang. residuals)?
2. Współczynnik determinacji określa … .
3. Kiedy współczynnik korelacji wielokrotnej przyjmuje wartość największą (jaką)?
4. Jakie założenia o błędach przyjmujemy w klasycznym modelu regresji ?
Copyright © 1999 Marek Krętowski & Wojciech Kwedlo. All rights
reserved.
Revised: 00-03-10