7. Linearna regresija

Iz Računalniška orodja v fiziki 2008 - 2009

(Primerjava redakcij)
Skoči na: navigacija, iskanje
(Nova stran: Linearna zveza <math>y=kx</math> je najpreprostejša in najpogostejša zveza med dvema fizikalnima količinama, zlasti še, ker lahko tudi druge funkcijske odvisnosti v ozkem intervalu a...)
Vrstica 38: Vrstica 38:
# Za meritve<ref>Blaž Kavčič, Dušan Babič in Igor Poberaj, ''Mikrofluidično vezje z mikročrpalko'', OMF '''56''' (2009) 1.</ref> v datoteki "HitrostTokaOdFrekvence.txt" (naloga 6.1) določi parametra najboljše premice. Ker so podane napake hitrosti, lahko določiš tudi <math>\chi^2</math>.
# Za meritve<ref>Blaž Kavčič, Dušan Babič in Igor Poberaj, ''Mikrofluidično vezje z mikročrpalko'', OMF '''56''' (2009) 1.</ref> v datoteki "HitrostTokaOdFrekvence.txt" (naloga 6.1) določi parametra najboljše premice. Ker so podane napake hitrosti, lahko določiš tudi <math>\chi^2</math>.
# Skozi oblak podatkov "Tintin.dat" potegni najboljšo premico. Uporabiš lahko kar korelacijske rezultate iz naloge 6.2.
# Skozi oblak podatkov "Tintin.dat" potegni najboljšo premico. Uporabiš lahko kar korelacijske rezultate iz naloge 6.2.
-
# Skozi točke v histogramu podatkov "Interval.dat" poskusi potegniti najboljšo eksponentno funkcijo <math>w=Ae^{-\lambda x}</math>, ki jo moramo najprej predelati v linearno zvezo. Z logaritmiranjem dobimo <math>\ln w=\ln A \lambda x</math>. V grafu <math>y=\ln w</math> od <math>x</math> sta koeficienta premice <math>k=-\lambda</math> in <math>n=\ln A</math>. Po teoriji verjetnosti mora biti koeficient <math>\lambda</math> enak recipročni povprečni vrednosti histograma.
+
# Skozi točke v histogramu podatkov "Interval.dat" poskusi potegniti najboljšo eksponentno funkcijo <math>w=Ae^{-\lambda x}</math>, ki jo moramo najprej predelati v linearno zvezo. Z logaritmiranjem dobimo <math>\ln(w)=\ln(A)-\lambda x</math>. V grafu <math>y=\ln(w)</math> od <math>x</math> sta koeficienta premice <math>k=-\lambda</math> in <math>n=\ln(A)</math>. Po teoriji verjetnosti mora biti koeficient <math>\lambda</math> enak recipročni povprečni vrednosti histograma.
# Teorija kemijske kinetike napove za sigmoidno krivuljo iz podatkov "Adrenalin.dat" (naloga 1.1) naslednjo odvisnost <math>F/F_\mathrm{max}=c/(a+c)</math>, kjer pomeni <math>a</math> koncentracijo s polovičnim maksimalnim učinkom. Določi koeficienta <math>F_\mathrm{max}</math> in <math>a</math>. Pretvori v linearno zvezo – ena pot je uvedba recipročnih spremenljivk <math>1/F</math> in <math>1/c</math>, druga pa je uvedba spremenljivke <math>c/F</math>.
# Teorija kemijske kinetike napove za sigmoidno krivuljo iz podatkov "Adrenalin.dat" (naloga 1.1) naslednjo odvisnost <math>F/F_\mathrm{max}=c/(a+c)</math>, kjer pomeni <math>a</math> koncentracijo s polovičnim maksimalnim učinkom. Določi koeficienta <math>F_\mathrm{max}</math> in <math>a</math>. Pretvori v linearno zvezo – ena pot je uvedba recipročnih spremenljivk <math>1/F</math> in <math>1/c</math>, druga pa je uvedba spremenljivke <math>c/F</math>.

Redakcija: 18:04, 20. april 2009

Linearna zveza y = kx je najpreprostejša in najpogostejša zveza med dvema fizikalnima količinama, zlasti še, ker lahko tudi druge funkcijske odvisnosti v ozkem intervalu aproksimiramo z linearno zvezo: Δy = kΔx. Vemo, da sorazmernostni koeficient k za majhne Δx limitira k odvodu dy / dx.

Kadar moramo določiti koeficient v linearni zvezi dveh količin x in y, je s stališča merske tehnike koristno izmeriti več kot en par (x,y). Če določimo vrednosti yi, ki ustrezajo celi vrsti izbranih xi, i = 1, 2, ..., m, lahko z njimi določimo k z večjo natančnostjo. Obenem preverimo, ali linearna zveza zares velja, pa tudi, ali naša merska naprava dobro deluje v širšem intervalu spremenljivk. Zlasti se lahko zgodi, da ima merilec te ali druge količine premaknjeno ničlo. Tedaj se naša linearna zveza ne pokaže kot premica skozi izhodišče koordinatnega sistema, pač pa je nekoliko premaknjena. Zato velja, da iz vrste meritev xi, yi nikoli ne računamo koeficienta kot povprečje kvocientov yi / xi, pač pa vedno kot naklon premice, ki jo potegnemo skozi izmerjene točke.

Problem najboljše premice skozi dane merske točke je mogoče definirati na mnogo načinov, ki pa se vsi prevedejo na eno od dveh matematičnih oblik. Če smo za meritve že določili korelacijski koeficient (prim. 6.1-2), zadošča vedeti, da gre najboljša premica vedno skozi težišče oblaka točk \left(x_\mathrm{pov}, y_\mathrm{pov}\right) in da ima naklon R * sigmay / sigmax.

Sicer pa lahko koeficienta k in n najboljše premice y = kx + n določimo tudi z elementarnim računom. Zahtevamo, naj bo vsota kvadratov razdalj točk od premice najmanjša (načelo najmanjših kvadratov – least squares principle):

Ni mi uspelo razčleniti (Začasne mape za matematiko ne morem ustvariti ali pisati vanjo.): S=\sum\left(y_i–kx_i–n\right)^2=\textrm{min} .

Sistem dveh enačb za k in n rešimo z naslednjim programom:

sum1 := 0;
sumx := 0;
sumy := 0;
sumx2 := 0;
sumxy := 0;
for i:=1 to m do begin
  add(sum1, 1); 
  add(sumx, x[i]); 
  add(sumy, y[i]); 
  add(sumx2, x[i]*x[i]); 
  add(sumxy, x[i]*y[i])
end;
k := (sum1*sumxy – sumx*sumy)/(sum1*sumx2 – sumx*sumx);
n := (sumx2*sumy – sumx*sumxy)/(sum1*sumx2 – sumx*sumx)

V zaresni merilni tehniki se spodobi, da so meritve opremljene s statistično napako, torej y_i= y_i\pm\varepsilon_i. Kadar se \varepsilon_i od izmerka do izmerka znatno spreminja, je teža posameznih točk različna. Statistično neoporečen rezultat dobimo, če v gornjem programu vse sumande utežimo z \varepsilon_i^{-2}:

add(sumz, z[i]/sqr(ε[i]))

kjer je z[i] po vrsti 1, x[i], y[i], x[i]*x[i] in x[i]*y[i]. To je druga, popolnejša oblika za najboljšo premico. V njej vsoto S, ki smo jo minimizirali, običajno označimo s χ2 in jo lahko uporabljamo tudi za diagnozo kvalitete ujemanja. Za dobro ujemanje je njena pričakovana vrednost m\pm\sqrt{2m}. Govorimo o testu hi-kvadrat.

Mnoga računska orodja imajo že vgrajene ukaze za najboljše premice. Velja preveriti, katero od obeh oblik uporabljajo.

Naloge

  1. Za meritve[1] v datoteki "HitrostTokaOdFrekvence.txt" (naloga 6.1) določi parametra najboljše premice. Ker so podane napake hitrosti, lahko določiš tudi χ2.
  2. Skozi oblak podatkov "Tintin.dat" potegni najboljšo premico. Uporabiš lahko kar korelacijske rezultate iz naloge 6.2.
  3. Skozi točke v histogramu podatkov "Interval.dat" poskusi potegniti najboljšo eksponentno funkcijo w = Ae − λx, ki jo moramo najprej predelati v linearno zvezo. Z logaritmiranjem dobimo ln(w) = ln(A) − λx. V grafu y = ln(w) od x sta koeficienta premice k = − λ in n = ln(A). Po teoriji verjetnosti mora biti koeficient λ enak recipročni povprečni vrednosti histograma.
  4. Teorija kemijske kinetike napove za sigmoidno krivuljo iz podatkov "Adrenalin.dat" (naloga 1.1) naslednjo odvisnost F / Fmax = c / (a + c), kjer pomeni a koncentracijo s polovičnim maksimalnim učinkom. Določi koeficienta Fmax in a. Pretvori v linearno zvezo – ena pot je uvedba recipročnih spremenljivk 1 / F in 1 / c, druga pa je uvedba spremenljivke c / F.

Literatura

  1. Blaž Kavčič, Dušan Babič in Igor Poberaj, Mikrofluidično vezje z mikročrpalko, OMF 56 (2009) 1.