![]() |
er en metode til at bestemme bedste rette linie gennem et antal punkter. Teorien er udviklet af C. F. Gauss i 1820-erne. Metoden kaldes ofte mindste kvadraters metode. |
Lad der være giver n punkter (x1, y1), (x2, y2),
... , (xn, yn) og linien med ligningen l : y = a · x + b.
I stedet for at regne med den vinkelrette afstand mellem et punkt og l, valgte Gauss at se på
den lodrette afstand. Lodret over/under punktet (xi, yi) ligger
liniepunktet (xi, a · xi + b), og den lodrette afstand er
di = ½a · xi + b
yi½. Afstandskvadratet er di2 =
(a · xi + b yi)2.
Ideen er nu at variere a og b, indtil summen af afstandskvadraterne bliver så lille som muligt.
Vi danner altså funktionen
For at finde kravene til a og b, differentierer vi d2(a, b) partielt med hensyn til a. D.v.s. at alt andet end a holdes konstant under differentiationen. Det skrives
| ¶d2(a, b) ¶a |
= 2S(a · xi + b yi) · xi = 2aSxi2 + 2bSxi 2Sxi · yi = 2a Sxx + 2b Sx 2 Sxy . |
Partiel differentiation m.h.t. b giver
| ¶d2(a, b) ¶b |
= 2S(a · xi + b yi) = 2aSxi + 2nb 2Syi = 2a Sx + 2nb 2 Sy . |
Summen af afstandskvadraterne bliver mindst mulig, når differentialkvotienterne er 0, så
Disse ligninger løses af
| a = | n Sxy SxSy n Sxx SxSx |
og | b = | Sy a Sx n |
. |
Uanset hvordan de n punkter ligger, er der altid én "bedste rette linie" gennem dem. Men i nogle tilfælde er tilpasningen bedre end i andre. For at undersøge dette, læner vi os op ad statistikken, idet vi lader punkterne indgå med samme vægt 1 / n.
Vi indfører variablerne X = {x1, x2, ... , xn} og Y = {y1, y2, ... , yn} og deres middelværdier
For varianserne finder vi
og dermed spredningerne
| spr(X) = | Ö |
Sxx/n Sx2/n2 |
og | spr(Y) = | Ö |
Syy/n Sy2/n2 |
. |
Covariansen bliver
Hvis der er stor sandsynlighed for, at X og Y på samme tid er større end deres middelværdier og på samme tid mindre, er cov(X, Y) > 0. Er X ofte større end sin middelværdi, når Y er mindre end sin og omvendt, er cov(X, Y) < 0. Er der ingen sådan sammenhæng mellem X og Y, siges X og Y at være uafhængige, og cov(X, Y) = 0. Som mål for, hvor godt linien matcher med punkterne, anvendes korrelationsionskoefficienten R(X, Y)
| R(X, Y) = | cov(X, Y) spr(X) · spr(Y) |
= | Sxy/n SxSy/n2
|
= | nSxy SxSy
|
Her er Y = log(y) = log(a) · x + log(b), så man anvender mindste kvadraters metode på punkterne (x1, log(y1)), ... (xn, log(yn)), og finder konstanterne A = log(a) og B = log(b). Herefter er ligningen for bedste eksponentielle kurve y = 10B · (10A)x.
Her er MatLex' regnemaskine til "bedste eksponentielle funktion".
Her er Y = log(y) = log(x) · a + log(b), så man anvender mindste kvadraters metode på punkterne (log(x1), log(y1)), ... (log(xn), log(yn)), og finder konstanterne a og B = log(b). Herefter er ligningen for bedste eksponentielle kurve y = 10B · xa.
Her er MatLex' regnemaskine til "bedste potens- funktion".
[ Hovedmenu ] [ Ordliste ] [ Tilbage til hovedsiden ]