Bilgisayar Mühendisli§inde Matematik Uygulamalar Ders Notlar
Prof.Dr. Adnan Kavak
çindekiler
1
Bölüm1
1.1
1.2
1.3
1.4
1.5
1.6
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
LU Ayr³trmas . . . . . . . . . . . . . . . . . . . . . . . . . 17
Pivot Seçme le LU Ayr³trmas . . . . . . . . . . . . . . . . . 18
Bölüm3
3.1
3.2
3.3
3.4
5
6
6
7
8
9
10
11
12
12
12
12
13
13
13
. 14
. 15
Bölüm2
2.1
2.2
3
5
Ortagonal Alt Uzaylar . . . . . . . . . . . . . . . . . . . . .
1.1.1 zdü³üm Matrisi(Projection Matrix) . . . . . . . . . .
1.1.2 Vektör zdü³ümü . . . . . . . . . . . . . . . . . . . .
1.1.3 Ev Ödevi Sorusu . . . . . . . . . . . . . . . . . . . .
Gram-Schmidt Dikle³tirme Prosedürü . . . . . . . . . . . . .
1.2.1 Ev Ödevi Sorusu . . . . . . . . . . . . . . . . . . . .
1.2.2 Örnek . . . . . . . . . . . . . . . . . . . . . . . . . .
Range Space Of A Matrix(Bir Matrisin De§er Uzay ) . . . .
1.3.1 Bo³ Uzay(NULL Space) . . . . . . . . . . . . . . . .
Baz Önemli Matris Ayr³trmalar . . . . . . . . . . . . . . .
1.4.1 A=mxm ise . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 A->mxn matris ise m>n . . . . . . . . . . . . . . .
1.4.3 LU Matris ayr³trmas . . . . . . . . . . . . . . . .
1.4.4 Cholesky Matris ayr³trmas . . . . . . . . . . . . .
1.4.5 QR ayr³trmas . . . . . . . . . . . . . . . . . . . .
EigenValue Decomposition (EVD) Veya Singular Value Decomposition (SVD) . . . . . . . . . . . . . . . . . . . . . . .
LU Ayr³trmas Ve Denklem Sistemi Çözümü . . . . . . . .
23
EigenValue Decomposition(Özde§er Ayr³trmas) . . .
3.1.1 Özde§er Ve ÖzVektör Nasl Bulunur? . . . . . .
3.1.2 ÖzVektörlerin(EigenVectors)Lineer Ba§mszl§?
Matrisin Ayr³trlmas . . . . . . . . . . . . . . . . . .
Özde§er Ve Özvektörlerden Matris Olu³turma . . . . .
Self-Adjoint Matrislerin Kö³egenle³tirilmesi . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
24
26
26
27
29
3.5
3.6
4
Bölüm4
4.1
4.2
4.3
4.4
5
EVD Uygulamalar . . . . . . . . . . . . . . . . . . . . . . . . 30
Korelasyon Matrisi Özellikleri . . . . . . . . . . . . . . . . . . 31
QR Ayr³trmas . . . . . . . . . . . . . . . . . . .
Niçin QR ? . . . . . . . . . . . . . . . . . . . . .
HouseHolder Dönü³ümü: . . . . . . . . . . . . . .
QR Yöntemi le Denklem Sistemi Çözümü Matlab
Bölüm5
5.1
5.2
5.3
33
. . . . .
. . . . .
. . . . .
Örne§i .
.
.
.
.
.
.
.
.
33
34
35
40
47
Optimizasyon(En yileme) . . . . . . . . . . . . . . . . . . . . 47
Ko³ullu (Constraint) Optimizasyon . . . . . . . . . . . . . . . 52
Ara Snav Çözümleri . . . . . . . . . . . . . . . . . . . . . . . 55
Bölüm 1
Bölüm1
1.1
Ortagonal Alt Uzaylar
ekil 1.1: Ortagonal Alt Uzay
X1
X = X2 ∈
X3
•
S
S
= R3
• V ⊂S
• V1 =W
• W1 = V
5
XX ve W ortagonal altuzaylardr.
XX vektoru S'de bir vektordur.
0
XX v V altuzayinda X in izdü³üm vektörüdür.
0
XX w W altuzayinda X in izdü³üm vektörüdür.
1.1.1
zdü³üm Matrisi(Projection Matrix)
P 1 , P 2 , P 3 · · · P n V altuzayn tarayan ( span ) vektörleri olsun
X v = C1P 1 + C2 P 2 + C3P 3 + · · · + Cn P n
Am∗n = P 1 P 2 P 3 · · · P n
−1 H
P v = Am∗n (AH
m∗n Am∗n ) Am∗n > izdü³üm matrisi
1.1.2
Vektör zdü³ümü
3
1
0
a=
x=
y=
2
0
1
ax = ?
0
T
< a, x >= a ∗ x = 3 2 ∗
=3
1
3
ax = 3 ∗ x =
0
ay = ?
0
< a, y >= a ∗ y = 3 2 ∗
=2
1
0
ay = 2 ∗ y =
2
< a, x >= kak ∗ kxk ∗ cos(Θ) = kak ∗ cos(Θ) yandaki ifadede kxk = 1 dir.
T
1.1.3
Ev Ödevi Sorusu
Ev ödevi sorusu a³a§daki gibidir :
ekil 1.2: Ev Ödevi Sorusu
−→ Av = P 1 P 2 −→ P Av = · · ·
W −→ Aw = P 2 P 3 −→ P Aw = · · ·
X v = P Av · X · · ·
X w = P Aw · X · · ·
V
1.2
Gram-Schmidt Dikle³tirme Prosedürü
a ve b'yi kullanarak birbirine dik vektörler nasl olu³turulur?
k q1 k=1 , k q2 k=1
0
1- 41 −→ b nin
q1
üzerindeki bile³eni
0
2-
e1
−→ b nin 41 'den fark vektörü
3-
q2
−→ e1 'in normalize edilmi³ hali
Algoritma:
= P 1 , P 2 , · · · , P n vektörleri için birbirine dik olan
T = q1 , q2 , · · · , qk
k≤n
T
0
< qi , qj >= qTi · qj = δij
δij =
1)
q1
=
p1
kp1 k
1
kp1 k = (p1 T · p1 ) 2
1 i=j ise
0 i 6= j
2) ∆2 =< p2 , q1 > q1
nin q1 üzerindeki izdü³ümü
e2 = p2 − ∆2
e2
q2 =
ke2 k
..
.
k.admda P
k−1
ek = pk −
i=1 < pk , qi > qi
ek
qk =
kek k
∆2
0
p2
1.2.1
Ev Ödevi Sorusu
3
3
4
−1
P 1 = 2 , P 2 = −4 , P 3 = 3 , P 4 = −2
1
2
−2
−3
P 1 ,P 2 ,P 3 ve P 4 'ü kullanarak Gram-Schmidt yöntemiyle birbirine dik olan
vektörleri bulunuz ?
1.2.2
Örnek
R 2T
< x(t), y(t) >= 0 x(t)y(t)dt
1
kx(t)k = (< x(t), x(t) >) 2
1.3
Range Space Of A Matrix(Bir Matrisin De§er Uzay )
A = P1 P2 ···
Pm
A·x=y
x1
x2
x = .. ∈ Rm
.
xm
y = x1 P 1 + x2P 2 + · · ·+ xm P m
1 0 0
x1
Örnek: A = 0 0 0
x = x2
1 0 1
x3
1
0
0
x1
A · x = x1 0 + x2 0 + x3 0 = 0 = y
1
x 1 + x3
1 0
1
0
y vektörü 0 , 0 vektörlerinin lineer birle³imidir.
1 1
1
0
R(A)= span{ 0 , 0} ,R(A)99K de§er uzaydr .
1
1
1.3.1
Bo³ Uzay(NULL Space)
0
0 = 0
0
Ax = 0 i³lemini sa§layan x vektörüne A'nn bo³ uzay(null space) denir.N(A)
ile gösterilir.
Örnek:
Yukardaki
A matrisi için :
1 0 0 x1
0
0 0 0 x2 = 0
1 0 1 x3
0
x1 = 0, x1 + x3=
0 → x3 = 0 x2 herhangi bir α de§eridir
0
N (A) = span{α}
0
1.4
Baz Önemli Matris Ayr³trmalar
Ax = b denklem sistemi için
1.4.1
A=mxm ise
Klasik yöntem:x = A−1 · b
Baz durumlarda A−1 almak oldukça zor ve karma³k bir i³lem.
O(m3 ) 99K polinom derecesi en fazla m3 olan sayda (+)ve (*) i³lemi gerekir.
1.4.2
A->mxn matris ise m>n
Ax = b
H
(AH
n∗m · Am∗n )xn∗1 = An∗m bm∗1
x = (AH A)−1 AH · b
(AH A)−1 AH → A] : A'nn pseduo-inxers
1.4.3
LU Matris ayr³trmas
A:m
× m kare matris
,A = L · U
1 0 0 0
x 1 0 0
L=
=⇒ Lower-Triangular(alt üçgensel)
.
x .. . . . 0
x . . . x 1 m∗m
x x x x
0 x x x
U=
=⇒ Upper-Triangular(üst üçgensel)
.. . .
0 .
. x
0 . . . 0 x m∗m
Uygulamas:Ax = b denklem sistemi çözümünde kullanlr.(E§er A:m*m ise)
1.4.4
Cholesky Matris ayr³trmas
A = simetrik , pozitif-denite bir matris ise A→ m × m
xT · Ax > 0
x ∈ Rn vektör ise A pozitif denite bir matris
y = Ax
< x, Ax >= xT · Ax
x 0 0 0
0 x 0 0
H
A = LDL ,D⇒ kö³egen D =
.. . .
0 .
. 0
0 ...
0
x
Cholesky ayr³trmas a³a§daki gibidir:
A = U DU H
H
A = LDL
Uygulamas:Kestirim ve Kalman ltresi problemlerinin çözümünde
1.4.5
QR ayr³trmas
A : m × n kare olmayan bir matris ise
Am×n xn×1 = bm×1
A = QR
1 0 0 0
0 1 0 0
Q unitary bir matris ⇒ QH · Q = I =
.
0 .. . . . 0
0 ... 0 1
R = üst-üçgense bir matris ancak kö³egendeki de§erler ”1” de§il·
Ax = b
↓
Q·R·x=b
QH Q ·Rx = QH b
| {z }
|{z}
I
R·x=
c
1.5
−→ çözümü Ax = b ' ye göre daha kolay ·
EigenValue Decomposition (EVD) Veya Singular Value Decomposition (SVD)
A : m × m kare =⇒EVD
A : m × n kareP
de§il =⇒SVD
VH
SVD: A = U
Λ1 0 0 0
P
0 Λ2 0 0
=
.. . .
0
. 0
.
0 . . . 0 Λn n×n
Λi : singular(tekil)de§erler
U = m × n=⇒ unitary U H · U = In×n
V H = m × n=⇒ unitary V · V H = In×n
Uygulama:Sinyal i³leme , haberle³me , kestirim vs· · ·
Kullanc yönü Qi
1.6
i = 1, 2, · · · , N
LU Ayr³trmas Ve Denklem Sistemi Çözümü
Am×m xm×1 = bm×1
A=L·U
↓
LU x = b
Ux = y
Ly
= b =⇒ y =⇒ x
l11 0 · · ·
0
y1
b1
l21 l22 · · ·
y2 b 2
0
..
..
.. .. = ..
.
. ···
. . .
ym
bm
lm1 lm2 · · · lmm
b1
y1 =
l11 = 1 99K y1 = b1
l11
b2 − l21 · y1
l21 · y1 + l22 · y2 = b2 99K y2 =
= b2 − l21 · y1 99K l22 = 1
l22
↓
Pj−1
lji · yi
yj = bj − i=1
j = 2, 3, 4, · · · , m forward substitution (ileri yerine koyma)
Ux = y
↓
u11 u12
0 u22
0
0
..
..
.
.
0
0
1
xm =
umm
xm−1 =
..
.
u13 · · ·
u23 · · ·
u33 · · ·
..
.
0
0
···
u1m
u2m
u3m
..
.
umm
x1
y1
x2 y 2
x3 y 3
=
.. ..
. .
xm
ym
· ym
1
um−1·m−1
(ym−1 − xm · um−1,m )
P
1 yj − m
(u
·
x
)
99K Backward substitution(geriye yerine
k
k=j+1 jk
ujj
koyma)
m2
−1
O( ) i³lem gerektirir ve x = A · b yöntemine göre daha az i³lem yükü
2
gerektirir.
Zorluk:
xj =
1-) uii 'lerin ”0” olmas
2-) uii 'ler pivot olarak adlandrlr .
Bölüm 2
Bölüm2
2.1
A
LU Ayr³trmas
U
L
−→
−→
Gauss Elimination
Satr i³lemlerini saklayarak
(Birim Satr ³lemleri )
T
a1
satr1
satr2
aT
= ..
A = .2
.
..
satrm m×m
aTm m×m
Birim Satr ³lemi(B.S.)= satr i ← α satr i +β satr j
α, β ∈ R
Örnek:
2 4 −5
1 −→ A = LU ?, L =?, U =?
A = 6 8
4 −8 −3
Amaç BS ile kö³egen altndaki de§erleri sfrlamak
a21
1)S2 ←− S2 − 3S1
3=
a11
2 4 −5
1 0 0
2 4 −5
1 ←− Orjinal A matrisi
A1 = 0 −4 16 = −3 1 0 6 8
4 −8 −3
0 0 1
4 −8 −3
a31
2)S3 ←− S3 − 2S1
2=
a11
2 4 −5
1 0 0
2 4 −5
A2 = 0 −4 16 = 0 1 0 0 −4 16 ←− updated(Bir önceki
0 −16 7
−2 0 1
4 −8 −3
update edilmi³ A)
17
a32
3)S3 ←− S3 − 4S2
4=
a22
2 4 −5
1 0 0
2 4 −5
A3 = 0 −4 16 = U = 0 1 0 0 −4 16 ←− updated(Bir
0 0 −57
0 −4 1
0 −16 7
önceki update edilmi³ A)
U matrisi olu³turuldu .
L'yi bulmak için :
U = E3 E2 E1 A
=⇒ A = E1−1 E2−1 E3−1 U
−1 −1 −1
E1 A =
A1 E2 E
1 A = A2 L = E1 E2 E3
1 0 0
1 0 0
1 0 0
E1−1 = 3 1 0 , E2−1 = 0 1 0 , E3−1 = 0 1 0
0 0 1
0 4 1
2 0 1
1 0 0
E1−1 E2−1 E3−1 = 3 1 0 = L
2 4 1
1 0 0 2 4 −5
A = 3 1 0 0 −4 16
2 4 1 0 0 −57
L
2.2
U
Pivot Seçme le LU Ayr³trmas
Amaç : Pivot(kö³egen) elemanlarnn o sütunda en büyük de§er alacak ³ekilde satr yerlerinin de§i³tirilmesi (pivoting)
Örnek:
2 4 −5
6 8
1
4 −8 −3
1−)a11 max olacak ³ekilde S1 ←→ S2
Bunun anlam orjinal A matrisini yer de§i³tirme matrisi (P12 ) ile soldan çarpmak demektir.
0 1 0
P12 = 1 0 0
0 0 1
Yukardaki P12 matrisi birim matristeki 2.satrn yer de§i³tirilmi³ halidir.
1 0 0
0
I3×3 = 0 1 0 −→ P12 = 1
0 0 1
0
0 1 0
2 4
A1 = P12 A = 1 0 0 6 8
4 −8
0 0 1
6 8
1
= 2 4 −5
4 −8 −3
↓
2−)
=
a21 'i sfrlamak için katsay −1
3
−2
a31 'i sfrlamak için katsay 3 =
1 0
0 0
0 1
−5
1
−3
−a21
a11
−a31
a11
→ E1
→ E2
0 0
1 0 0
1 0 −1
1 0 A1
3
−2
0 1
0 0 1
3
↑
↑
↓
E2
P12 · A
E1
6 8
1
−→ 1. sütundaki a011 in altndaki elemanlar sfrland .
A2 = 0 43 −16
3
−40
−11
0 3
3
3−)
2.sütun için en son admda güncellenmi³ olan A2 matrisinin a22 eleman için
pivot seçilir .
1
A2 = 0
| −40
| > | 43 | oldu§undan S2 ←→ S3 (A02 de) ya da S1 ←→ S2 (A021 de)
3
A02 yi göz
önünealrsak :
1 0 0
1 0 0
6 8
1
P23 = 0 0 1
A3 = P23 · A2 = 0 0 1 0 43 −16
3
−40
−11
0 1 0
0 1 0
0 3
3
6 8
1
−11
99K a32 'yi sfrlamak için katsay =
A3 = 0 −40
3
3
4
−16
0 3
3
4−)
A4 = E3 · A3 = E3 · P23 · E2 · E1 · P12 · A
A1 = P12 · A
A2 = E2 · E1 · P12 · A
A3 = P23 · E2 · E1 · P12 · A
1
A4 = 0
0
0
1
1
10
0
0
1
6
0
0
8
−40
3
4
3
6
−11
= 0
3
−16
0
3
|
1
8
−40
3
0
{z
1
−4
3
−40
3
=
1
10
−11
3
−57
10
↑
E3
U
U = E3 P23 E2 E1 P12 A
−1 −1 −1 −1 −1
=⇒ A = P12
E1 E2 P23 E3 U
|
{z
}
V
1 0 0
1 0 0
1 0 0
−1
0 0 1 0 0 1 =
P23 = 0 0 1 = P23
0 1 0 0 1 0
0 1 0
1 0 0
1 0 0
−1
E3 = 0 1 0 → E3 = 0 1 0
1
0 −1
1
0 10
10
1
1 0 0
−1 −1
1
P23
E3 = 0 −1
10
0 1 0
1 0 0
1 0 0
E2 = 0 1 0 → E2−1 = 0 1 0
−2
2
0 1
3
3 0 1
1 0 0
1 0 0
1 0
−1
= 0 −1
1
E2−1 · P23
· E3−1 = 0 1 0 0 −1
10
10
2
2
0
1
0
1
0
1
3
3
1 0 0
1 0 0
→ E1−1 = 1 1 0
1
0
E1 = −1
3
3
0 0 1
0
0 1
1 0 0
1 0 0
1
−1
= 1
1
· E3−1 = 31 1 0 0 −1
E1−1 · E2−1 P23
10
3
2
2
0 0 1
1
0
3
3
}
1 0 0
0 1 0
0 0 1
0
1
0
0
−1
10
1
0
1
0
⇒ E3
0 1 0
−1
P12 = 1 0 0 = P12
0 0 1
0 1 0
1
−1
−1 −1
P12
· E1−1 E2−1 P23
E3 = 1 0 0 31
2
0 0 1
3
0
−1
10
1
1
0
3
1 = 1
2
0
3
−1
−1 −1
A = P12
· E1−1 E2−1 P23
E3 ·U
|
{z
}
V
−1 1 −1 −1 −1 −1
L = P23 P12 · V = P23 P12 P12
E1 E2 P23 E3
−1 −1
−1 −1 −1
E
= P12 P12 E1 E2 P23 P23
| {z } 3
| {z }
I
I
−1 −1 −1
= E1 E2 E3
1 0 0
⇒ L = 32 1 0
1
−1
1
3
10
Pivot seçme yönteminde
A=V ·U
P · A = LU
1P
−1
12 P12
I birim matrisine e³ittir
−1
10
0
1
1
0 =
0
V
Bölüm 3
Bölüm3
3.1
EigenValue Decomposition(Özde§er Ayr³trmas)
Fark denklemi (*):
y1 (t + 1) = −y1 (t) − 1.5y2 (t)
y2 (t + 1) = 0.5y1 (t) +y2 (t)
y1 (t + 1)
y1 (t)
y2 (t + 1) =
y(t) =
=?
y2 (t
y2 (t)
+ 1)
−1 −1.5
=⇒ y(t + 1) =
y(t) =⇒ y(t + 1) = Ay(t)
0.5
1
|
{z
}
A
Çözüm: y1 (t) = λt x1
y2 (t) = λt x2
t+1
t
t
λ x1 = −λ x1 − 1.5λ x2
λt+1 x2 = 0.5λt x1 + λt x2
-
x1
x
=λ 1
=⇒ A
x2
x2
| {z }
| {z }
x
x
=⇒ Ax = λx (∗∗)
(**)denklem siteminin çözümü ayn zamanda (*) denklem sisteminin çözümüdür.
x : eigenvector(özvektör)
λ:eigenvalue(özde§er)
23
3.1.1
Özde§er Ve ÖzVektör Nasl Bulunur?
Ax = λx
Genel olarak :
A:n×n
x:n×1
λ:1×1
=⇒ Ax = λx
(A − λI)x = 0
χA (λ) = det(A − λI) = |A − λI| karakteristik polinom
χA (λ) = det(A − λI) = 0 −→ çözümü λ de§erlerini verir.
Örnek:
−1 −1.5
A=
0.5 1
−1 −1.5
λ 0
−1 − λ −1.5
A − λI =
−
=
0.5
1
0 λ
0.5
1−λ
χA (λ) = det(A − λI) = (−1 − λ)(1 − λ) − (0.5)(−1.5)
λ − 0.25 = 0
(λ − 0.5)(λ + 0.5) = 0
↓
λ1 = 0.5
λ2 = −0.5
2
buldu§umuz bu λ de§erlerini (A − λI)x = 0'da yerine koyarsak :
λ1
x1
x1
−1 − λ −1.5
= 0.5 −→
x =0
0.5
1−λ 1
|
{z
}
B
vektörü
B'nin
null
space'ini olu³turur
α
1
=
α = 1 −→ x1 =
−α
−1
1
√
√
√
x1
2
2
2
kx1 k = α + α = 2α −→ x1 =
= −1
kx1 k
√
2
−0.5 −1.5
x2 = 0
λ2 = −0.5 −→ (A − λ2 I)x2 =
0.5
1.5
|
{z
}
C
x2 C'nin
null-space'idir.
√
√
−3α
x2 =
−→ kx2 k = 9α2 + α2 = 10α
α
−3
√
10
x2 = 1
√
10
ÖzVektör
Özde§er
1
√
2
λ1 = 0.5 −→ x1 = −1
√
2−3
√
10
λ2 = −0.5 −→ x2 = 1
√
10
Denklem sistemi çözümü :
1
√
y (t)
y 1 (t) = 1
= λt1 x1 = (0.5)t −12
y 2 (t)
√
2−3
√
y 1 (t)
t
t 10
y 2 (t) =
= λ2 x2 = (−0.5) 1
y 2 (t)
√
10
Hem y 1 (t) hem de y 2 (t) orjinal denklem sist. çözümünü sa§lyor.
Sistem linear bir sistem oldu§undan toplam çözüm:
y t (t) = C1 λt1 x1 + C2 λt2 x2
Denklem sisteminde ba³langç ko³ullar verilirse C1 ve C2 bulunabilir.
3.1.2
ÖzVektörlerin(EigenVectors)Lineer Ba§mszl§?
−3
√
x2 = 110
√
10
−3
√
1 −1 10
√ 1 = √−3 − √1
< x1 , x2 >= xT1 · x2 = √
20
20
2
2
√
10
−4
−2
√ = √
x1 ∗ x2 = √−4
=
20
2 5
5
Lema: n × n boyutlu A matrisinin tüm özde§erleri birbirinden farkl ise A
matrisinin özvektörleri brbirinden lineer ba§mszdr.
k1 x1 + k2 x2 = 0
k1 Ax1 + k2 Ax2 = k1 λ1 x1 + k2 λ2 x2 = 0(*)
k1 λ2 x1 + k2 λ2 x2 = 0(**)1
(∗) − (∗∗) −→ k1 (λ1 − λ2 )x1 = 0
λ1 6= λ2 , x1 6= 0 −→ k1 = 0 olmal ayn ³ekilde λ1 6= λ2 için −→ k1 = 0 olmal
.
1
√
x1 = −12
√
2
3.2
Matrisin Ayr³trlmas
A:n×n
Özvektörleri : x1 , x2 , x3 , · · · , xn
↓ ↓ ↓
↓
Özde§erleri : λ1 , λ2 , · · · , λn
A
xi = λi xn i = 1, 2 · · · , n Ax1 Ax2 Ax3 · · · Axn n×n = λ1 x1 λ2 x2 λ3 x3 · · · λn xn n×n
↓
λ1 0
0 λ2
An×n x1 x2 x3 · · · xn n×n = x1 x2 x3 · · · xn n×n
|
{z
} |
{z
} · · · · · ·
0
0
|
-
S
S
−→ AS = Sλ
1k
1 x1
+ k2 x2 = 0
denklemi
λ2
ile çarplrak elde edildi
0
0
···
0
{z
λ
···
···
···
···
0
0
· · ·
λn n×n
}
E§er eigenvector'ler lineer ba§msz iseler, S matrisi full rank ve tersi alnabilirler.
−1
−1
−→ A |SS
{z } = S ∧ S
I
−→ ASS −1 = S∧S −1 veya S −1 AS = ∧ Eigenvalue Decomposition(EVD)
An nasl bulunur?
ASS −1 = S ∧ S −1
−1
−1
2 −1
A2 = S ∧ S
| {zS} ∧S = S ∧ S
I
−1
3 −1
3
2 −1
A =S∧ S
| {zS} ∧S = S ∧ S
I
..
.
Ak =S ∧k S −1
e§er eigenvector'ler
lineer ba§msz ise
λ1 0
0 ··· 0
0 λ2 0 · · · 0
∧=
· · · · · · · · · · · · · · ·
0
0
0 · · · λn
k
0 ··· 0
λ1 0
0 λk2 0 · · · 0
∧k =
· · · · · · · · · · · · · · ·
0
0
0 · · · λkn
·····································································
eAt nasl bulunur?
P xi
ex = ∞
i=0
i!
P
Ai ti
∞
eAt = i=0
i!
3.3
Özde§er Ve Özvektörlerden Matris Olu³turma
λi , xi i = 1, 2, · · · , n
xH
i xj = 0 olsun (i 6= j )
n = 2 ele alalm.
kxi k = 1 V
x 0
S = x1 x2
= 1
0 x2
S −1 S = I
− xH
− 1 0
kx1 k2 xH
1
1 x2
x1 x2 = H
=
− xH
−
x2 x1 kx2 k2
0 1
2
−1
H
⇒S =S
A = S ∧ S −1 = S ∧SH
λ1 0
− xH
− xH
−
−
1
1
= x1 x2
= λ1 x1 λ2 x2 2×2
−
−
− xH
0 λ2 − xH
2
2
H
A = λ 1 x1 xH
1 + λ 2 x2 x2
Genel olarak ,özde§erleri(λi ) ve özvektörleri(xi ) verilen bir matris için , e§er
xH
i · xj = 0 ise bu matris ³u ³ekilde olu³turulabilir:
H
H
A = λ 1 x1 xH
1 + λ 2 x2 x2 + · · · + λ n xn xn
=⇒ A =
Pn
i=1
λ i xi xH
i
Pi = x i x H
i
Örnek:
λ1 =
λ2
= 1 λ3 = −1
0
0
1
1
1
√
√
x1 = 0 , x2 =
2 , x3 =
2
1
−1
√
√
0
2
2
A matrisini olu³turunuz?
Cevap:
1 0 0
A = 0 0 1 olmal .
0 1 0
Örnek:
λ1 = 5, λ1 = 10 3
−4
x1 =
x2 =
4
3
A =?
3 −4
=
=0
x1 ⊥ x2
4
3 x1
1 3
1 −4
u1 =
=5
u2 = 5
kx1 k
4 3
9 12
1 3
1
H
3 4 = 25
P1 = u1 u1 = 25
4
12 16
xH
1 x2
−4 16 −12
1
−4 3 = 25
P2 =
=
3
−12 9
9 12
16 −12
1
1
+10 · 25
A = λ1 P1 + λ2 P2 = 5 · 25
−12 9
12 16
9 + 32 12 − 24
= 15
12
− 24 16
+ 18
u2 uH
2
A=
1
25
41
5
−12
5
−12
5
34
5
Not:A simetrik bir matris.
3.4
Self-Adjoint Matrislerin Kö³egenle³tirilmesi
Self−adjoint matris −→ < Ax, x >=< x, AH x >
↓
↓
H
H
x Ax = x Ax
* A matrisinin elemanlar reel de§erler ise Self−adjoint matrise simetrik
matris denir ve AT = A
* A matrisinin elemanlar kompleks de§erler ise Self−adjoint matrise hermitian matris denir ve AT = A
Özellikleri:
1- Self−adjoint matrisin (AH = A ise) eigenvalue'lar reel de§erliklidir.
ispat:< Ax, x >=< λx, x >= λ < x, x >= λxH x
< x, AH x >= λ∗ < x, x >= λ∗ xH x
→ λxH x = λ∗ xH x → λ = λ∗ için λ reel de§erlikli olmal.
2- Self−adjoint(simetrik veya hermitian)matrisler için birbirinden farkl
eigenvalue'lara kar³lk gelen eigenvektörler birbirine diktir.
ispat:< Ax1 , x2 >=< x1 , AH x2 >=< x1 , λ2 x2 >= λ2 < x1 , x2 >=
λ2 xH
1 x2
ayn zamanda
< Ax, x >=< λ1 x1 , x2 >= λ1 xH
1 x2
H
H
⇒ (λ1 x1 x2 − λ2 x1 x2 ) = 0
⇒ (λ1 − λ2 )(xH
1 x2 ) = 0
λ1 6= λ2 ise x1 ⊥ x2 olmal.
Teorem: n × n boyutu A matrisi hermitian bir matris ise (AH = A ise) A
matrisinin EVD açlm :
V
P
H
³eklinde yazlr
.
A = U U H = ni=1 λi U i U i
Bu arada U matrisi U = U 1 U 2 U 3 · · · U n unitary bir matristir.
3.5
EVD Uygulamalar
X1
X2
x = ..
.
a1 (Θi )
a2 (Θi )
a(Θ) = .. =⇒ steering vector at θi
.
XM
aM (Θi )
x = a(θ1 )α1 S1 + a(θ2 )α2 S2 + · · · + a(θk )αk Sk
Korelasyon matrisi:R
R = E{xxH }
M>K
R −→ EV D −→ λi , U i
λ1 0
0 ··· ··· ··· 0
0 λ2 0 · · · · · · · · · 0
0
0 λ3 · · · · · · · · · 0
V
..
. ··· ··· 0
= · · · · · · · · ·
·
·
·
·
·
·
·
·
·
·
·
·
λ
·
·
·
0
r
· · · · · · · · · · · · · · · . . . · · ·
0
0
0 ··· ··· ··· 0
Dominant eigenvalue says −→ r , ortamda r adet kullanc vardr .
EVD −→ MUSIC,ESPRIT,· · · vs high resolution algoritmalarla Qi 'ler bulunabilir .
3.6
Korelasyon Matrisi Özellikleri
1) R −→ hermitian bir matris
örnek: x(t) = ejwt −→kompleks sinusoid
t = 0,
1, · · · , M− 1
1
ejw
j2w
x= e
..
.
j(M −1)w
e
1 PN
H
R = E{xxH } ∼
=
i= x(i)x (i)
N
1
ejw
ej2w
..
.
R = E{
1 ejw ej2w · · ·
j(M −1)w
e
ej(M −1)w }
e−jw
1
ejw
···
1
ejw
ej2w
···
= E{
ej(M −1)w ej(M −1)w
R hermitian bir matris
e−j2w · · ·
e−jw e−j2w
1
···
···
···
···
···
· · · e−j(M −1)w
· · · e−j(M −1)w
}
· · · e−j(M −3)w
···
···
···
1
m×m
2) R'nin eigenvalue'lar reel ve pozitif de§erlerden olu³ur .
λ1 6= λ2 6= · · · =
6 λm > 0
3) R'nin eigenvektörleri biribirine diktir.(q i ⊥ q j )
q1, q2, · · · , qm → qH
i · qj
4) Rk matrisinin eigenvalue'lar
ispat ? (ödev)
λk1 , λk2 , · · · , λkm
λ1
0
0
H
V
5) Q = q 1 q 2 · · · q m
Q RQ = = · · ·
· · ·
· · ·
0
Unitary− similarity transformation
6) tr[R] =
PM
i=1
λi
spat ?
···
···
···
···
···
..
.
···
··· ···
···
0
··· ··· ···
0 ··· ···
0
λ2
0
0
0
λ3
··· ···
··· ···
··· ···
···
λr
···
···
..
.
0
0
0
0
0
···
· · · λm
Bölüm 4
Bölüm4
4.1
QR Ayr³trmas
A = QR
Q:unitary matris
R:üst üçgensel matris
Unitary matris: QH · Q = I
E§er Q'nun sadece gerçek de§erlikli elemanlar varsa Q'ya ortogonal matris
denir.
Lema1: y = Qx kyk = kxk y ∈ Rm×1 , x ∈ Rm×1
Lema2: Y = QX , Y ve X birer matris
kY kF = kXkF
Not: kkF → matris Frobenius norm
P Pn
1
2 12
H
2
kXkF = ( m
i=1
j=1 |Xij |) = (tr(X X))
Örnek:
a b
a
c
X=
, XH =
c d
b d 2
a b a c
a + c2 ab + cd
H
X X=
=
c d b d
ab + cd b2 + d2
P P
tr(X H X) = a2 + b2 + c2 + d2 = ( 2i=1 2j=1 |Xij2 |)
33
4.2
Niçin QR ?
Am×n xn×1 = bm×1 −→çözümx̂ = (AH A)−1 AH ·b
|
{z
}
]
A :pseduo-inverse
-bu çözüm kAx − bk22 minimize eden bir çözümdür.
-ayn zamanda least−squares(en küçük kareler) çözümü olarakda adlandrlr.
H
kAx − bk2 = (Ax − b)H (Ax − b) = (xH AH − b )(Ax − b)
H
H
J(x) = xH AH Ax − xH AH b − b Ax + b b
↑
maliyet fonksiyonu
∂J(x)
vektörel türev →
= AH Ax + AH Ax − AH b − AH b = 0
∂x
⇒ 2AH Ax − 2AH b = 0
LS çözüm
⇒ x = (AH A)−1 AH b
pucu:
∂ H
(x A) = A,
∂x
∂
(Ax) = AH
∂x
Örnek:
x1
c1
x
x=
c = c2
2 ,
x3
c3
H
x c = x 1 c1 + x 2 c2 + x 3 c3
∂ H
∂ H
x c = c1 ,
x c = c2
∂x1
∂x2
∂
∂x1
c1
∂
∂
=
= c2 = c
∂x ∂x2
c3
∂
,
∂ H
x c = c3
∂x3
∂x3
R1
Am×n = Qm×m Rm×n
=Q
0
m>n
R1 : n × n, 0 : (m − n) × n
Am×n xn×1 = bm×1 (∗)
⇒ QRx = b
QH Q Rx = QH b
| {z }
I
Rx = QH · b
QH
m×m
· bm×1
c
=
→c:n×1
d
d : (m − n) × 1
Rx= QH b R1
c
⇒
x=
0
d
R1n×n xn×1 = cn×1
(∗∗)
(*) ve (**) denklemlerinin çözümü ayn x vektörüdür.
(**) kolaylkla çözülebilir çünkü R1 üst üçgensel bir matrisdir.
not: m < n ise QR kullanlamaz !
QR Ayr³trmas:
Gram−Scmidt algoritmas, Householder dönü³ümü veya Givens rotation yöntemlerinden birisi kullanlarak yaplabilir.
4.3
HouseHolder Dönü³ümü:
xv : x vektörünün v vektörü üzerine izdü³ümü
x⊥
v : (x − xv ) yani x'in xv 'ye dik olan bile³eni
H v x : x vektörünün x⊥
v 'ye göre yanstlm³(döndürülmü³ü)
x v = Pv · x
Pv =
VV
x⊥
v
=
H
H
(V V )
⇒ xv =
x⊥
v
v1
v2
, V = ..
.
vn
VV
H
·x
H
(V V )
⊥
Pv x
= (I −
⊥
,Pv
VV
= I = Pv = I −
VV
H
H
(V V )
H
)x = x − xv
H
(V V )
H
VV
Hv = I − 2 H
(V V )
Householder dönü³üm matrisi x'in yalnzca V vektörü üzerindeki bile³enin
yönünü de§i³tirir.
H
H
VV
VV
Hv = I − H
− H
(V V ) (V V )
|
{z
}
= Pv⊥ − Pv
⊥
Hv x = Pv⊥ x − Pv x = x⊥
v − xv = xv + (−xv )
H
2
Hv = I Hv = Hv
Ödev:
Hv .Hv = I oldu§unu gösteriniz.
V Nasl
seçilir?
X1
X2
X = ..
.
Xn n×1
Amaç ,bu X vektörünü öyle bir Hv ile çarpmak ve sonuçta
x2 = x3 = · · · = xn = 0 yapmak.
Amaç:
α
1
0
0
0
Hv x =
= α 0
= αe1
..
..
.
.
0 n×1
0 n×1
"
⇒ I −2
VV
H
#
x = αe1
H
(V V )
H
(V x)V
x−2
= αe1
H
(V V )
H
H
(V x)
(V x)
⇒ x − αe1 = 2 H
(2 H
·V
= 1kabul edersek)
(V V )
(V V )
kHv xk = kαe1 k
Hv :ünitary.
⇒ kxk = α)
(Not:Hv x = αe1
x − αe1 = V
x ± kxke1 = V
⇒ V = x + sign(x1 )kxke1
x
x
A =
x
x
Step1
α1
0
H1 A =
0
0
H1 : 4 × 4
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
genel olarak Am×n , m > n
v1 v H
1
kv 1 k2
v 1 = x + sign(x1 )kxke1 4 × 1
e1 = [1000]T
V1 : 4 × 1
Step2
H2 : 3 × 3
v2vH
2
H2 = I − 2
kv 2 k2
v 2 = y + sign(y1 )kyke1 3 × 1
"
#
0
T
1 0
Q2 = T
0 = 0
0 H2
0
H1 = Q = I − 2
2×2
Step3:
H3 : 2 × 2
V2 : 3 × 1
α1 x
0 α2
Q2 Q1 A =
0 0
0 0
x
x
x
x
v3vH
3
kv 3 k2
v 3 = z + sign(z1 )kzke1 2 × 1
V3 : 2 × 1
α1 x x
T
1 0 0
0 α2 x
0
0=
Q3 Q2 Q1 A =
Q3 = 0 1 0T
0 0 α3 = R
0
0 0 H3
0 0 0
3×3
H3 = I − 2
Sonuçta :
Q3 Q2 Q1 A = R
QH
Q Q Q A = QH
3 R
| 3{z }3 2 1
I
H
QH
Q Q A = QH
2 Q3 R
| 2{z }2 1
I
H H
QH
Q A = QH
1 Q2 Q3 R
| 1{z }1
I
H H
⇒ A = QH
1 Q2 Q3 R
| {z }
Q
⇒ A = QR
H H
Q = QH
, QH = Q3 Q2 Q1
1 Q2 Q3
Denklem sistemi
Ax = b
QRx = b
c
Rx = QH b =
d
Problem R1 X = C sistemi çözümüne indirgenmi³tir.
R1 üst üçgensel bir matris oldu§undan çözüm geri yerine koyma yöntemiyle
kolaylkla bulunabilir.
Not:
2. ve 3. admdaki Q2 ve Q3 'ler
Q2 4×4
Ṽ2 Ṽ2H
=I −2
kṼ2 k2
Q3 4×4 = I − 2
Ṽ3 Ṽ3H
kṼ3 k2
0
Ṽ2 =
Ṽ2 4×1
0
Ṽ3 = 0
Ṽ3 4×1
4.4
QR Yöntemi le Denklem Sistemi Çözümü
Matlab Örne§i
A = [788;
862; 173; 073; 695]
788
862
A=
173
073
695
0
b = [4726242339]
47
26
b=
24
23
39
[m, n] = size(A)
m=
5
n=
3
− − − − − − − − − − − − − − − − − − − − − − − − − − − − − − −−
function v = makehouse(x)
%
% Make the Householder vector v such that
Hx has zeros in
% all but the rst component
%
% function v = makehouse(x)
%
% x = vector to be transformed
%
% v = Householder vector
c 1999 by Todd K. Moon
%
v = x(:);
nv = norm(v);
if (abs(x(1)) == nv)
v = 0 ∗ v;
else
if (v(1))
v(1) = v(1) + sign(v(1)) ∗ nv;
else
v(1) = v(1) + nv;
end
end
. >> v = makehouse(A(:, 1));
−−−
− − − −− − − − − − − − − − − − − − − − − − − − − − − − − − − − − −
19.2474
8.0000
v=
0
6.0000
a =
A(:, 1)
7
8
a=
1
0
6
na = (a0 ∗ a)0 .5
na =
12.2474
e1 = [10000]
e1 =
[10000]
e1 = na ∗ e1
e1 =
[12.2474 0000]
e1 =
e01
12.2474
0
e1 =
0
0
0
v = a + e1
19.2474
8.0000
1.0000
v=
0
6.0000
eye(5, 5)
1 0 0 0 0
0 1 0 0 0
0
0
1
0
0
ans =
0 0 0 1 0
0 0 0 0 1
H1 = eye(5, 5) − 2 ∗ v ∗ v 0 /(v 0 ∗ v)
−0.5715 −0.6532 −0.0816
0
−0.4899
−0.6532 0.7285 −0.0339
0
−0.2036
−0.0816
−0.0339
0.9958
0
−0.0225
H1 =
0
0
0
1.0000
0
−0.4899 −0.2036 −0.0255
0
0.8473
Q1 = H1
−0.5715 −0.6532 −0.0816
0
−0.4899
−0.6532 0.7285 −0.0339
0
−0.2036
−0.0816
−0.0339
0.9958
0
−0.0225
Q1 =
0
0
0
1.0000
0
−0.4899 −0.2036 −0.0255
0
0.8473
A1 = Q1 ∗ A
−12.2474 −13.4722 −8.5732
−0.0000 −2.9247 −4.8885
−0.0000
5.8844
2.1389
A1 =
0
7.0000
3.0000
−0.0000
2.3065 −0.1664
a1 = A
1 (2 : 5, 2)
−2.9247
5.8844
a1 =
7.0000
2.3065
0
0
v2 = a1 − (sqrt(a
1 ∗ a1 )) ∗ [1000]
−12.7989
5.8844
v2 =
7.0000
2.3065
H2 = eye(4, 4) − 2 ∗ v2 ∗ v20 /(v20 ∗ v2 )
−0.2962 0.5959
0.7089
0.2336
0.5959
0.7260 −0.3259 −0.1074
H2 =
0.7089 −0.3259 0.6123 −0.1278
0.2336 −0.1074 −0.1278 0.9579
Q2 = zeros(5, 5)
0
0
Q2 =
0
0
0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
1 0 0 0 0
0 0 0 0 0
Q2 =
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
Q2 (2
: 5, 2 : 5) = H2
1.0000
0
0
0
0
0
−0.2962 0.5959
0.7089
0.2336
0
0.5959
0.7260
−0.3259
−0.1074
Q2 =
0
0.7089 −0.3259 0.6123 −0.1278
0
0.2336 −0.1074 −0.1278 0.9579
A2 = Q2 ∗ A1
−12.2474 −13.4722 −8.5732
0.0000
9.8742
4.8105
A2 = −0.0000 −0.0000 −2.3203
−0.0000 −0.0000 −2.3046
0
−1.9142
−0.0000
−2.3203
a3 = −2.3046
−1.9142
0
0
v3 = a3 − (sqrt(a
3 ∗ a3 )) ∗ [1 0 0]
−6.1096
v3 = −2.3046
−1.9142
H3 = eye(3, 3) − 2 ∗ v3 ∗ v30 /(v30 ∗
v3 )
−0.6123 −0.6082 −0.5052
H3 = −0.6082 0.7706 −0.1906
−0.5052 −0.1906 0.8417
Q3 = zeros(5, 5)
0 0 0 0 0
0 0 0 0 0
Q3 =
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
Q3(1 : 2, 1 : 2) = eye(2, 2)
1 0 0 0 0
0 1 0 0 0
0
0
0
0
0
Q3 =
0 0 0 0 0
0 0 0 0 0
Q3(3
: 5, 3 : 5) = H3
1.0000
0
0
0
0
0
1.0000
0
0
0
0
0
−0.6123
−0.6082
−0.5052
Q3 =
0
0
−0.6082 0.7706 −0.1906
0
0
−0.5052 −0.1906 0.8417
A3 = Q3 ∗ A2
−12.2474 −13.4722 −8.5732
0.0000
9.8742
4.8105
0.0000
0.0000
3.7893
A3 =
0.0000
−0.0000 −0.0000
−0.0000
0.0000
0
U = A3 (1 : 3, :)
−12.2474 −13.4722 −8.5732
9.8742
4.8105
U = 0.0000
0.0000
0.0000
3.7893
Qh = Q3 ∗ Q2 ∗ Q1
−0.5715 −0.6532 −0.0816
0
−0.4899
0.0304 −0.2836 0.5975
0.7089
0.2431
Qh = 0.7795 −0.5901 −0.1516 −0.1083 −0.0974
0.0695
0.1682 −0.6686 0.6944 −0.1940
−0.2448 −0.3413 −0.4078 −0.0596 0.8086
b
47
26
b=
24
23
39
Qh
−0.5715 −0.6532 −0.0816
0
−0.4899
0.0304 −0.2836 0.5975
0.7089
0.2431
Qh = 0.7795 −0.5901 −0.1516 −0.1083 −0.0974
0.0695
0.1682 −0.6686 0.6944 −0.1940
−0.2448 −0.3413 −0.4078 −0.0596 0.8086
z = Qh ∗ b
−64.9115
34.1800
11.3680
z=
0.0000
0
−64.9115
c = 34.1800
11.3680
m = 3;
x(3) = c(3)/U (3, 3)
x = [0 0 3.0000]
.........................................................
Geri yerine koyma Matlab kodu:
m=3;
x(m)=c(m)/U(m,m);
for j=m-1:-1:1;
tmp=0;
for k=j+1:m;
tmp=tmp+U(j,k)*x(k);
end
x(j)=(1/U(j,j))*(c(j)-tmp);
end
.........................................................
yukardaki kod kullanlabilir veya manual olarak tek tek ³u ³ekilde hesaplanabilir:
>> x(2) = (1/U (2, 2)) ∗ (c(2) − U (2, 3) ∗ x(3))
x=
0 2.0000 3.0000
>> x(1) = (1/U (1, 1)) ∗ (c(1) − [U (1, 2) ∗ x(2) + U (1, 3) ∗ x(3)])
x=
1.0000 2.0000 3.0000
Bölüm 5
Bölüm5
5.1
Optimizasyon(En yileme)
Tanm kümesi Ω : {x : x ≥ 0}
x1 :kesin lokal minimum
x2 : maksimum
x3 : lokal minimum
∂f (x)
∂f (x)
∂f (x)
|x=x1 = 0
,
|x=x2 = 0 ,
|x=x3 = 0
∂x
∂x
∂x
↓
↓
↓
∂ 2 f (x)
∂ 2 f (x)
∂ 2 f (x)
|x=x1 > 0
,
|x=x2 < 0
,
|x=x3 > 0
2
2
∂x2
∂x
∂x
Tanm: f : Rn → R
ε > 0 ve x ∈ R
|x − x∗ | < ε için f (x) ≥ f (x∗ ) sa§layan x∗ ∈ R noktasna lokal minimum
noktas denir.
E§er f (x) > f (x∗ ) ∀x için x∗ noktasna kesin lokal minimum denir.
47
Tüm x ∈ R kümesi içinde f (x) ≥ f (x∗ ) sa§layan x ∈ R noktasna global minimum
denir.
Gradyan Operatörü: (∇x )
x1
x2
x = ..
.
xn
∂f (x)
1
∂f∂x(x)
∂x2
∇x f (x) = .
..
∂f (x)
∂xn
f (x) : Rn → R
n×1
Hessian Matrisi(H)
∂ 2f
∂x1 ∂x1
2
∂ f
H = ∇x f (x) =
∂x2.∂x1
..
∂ 2f
∂xn ∂x1
∂ 2f
···
∂x1 ∂x2
∂ 2f
···
∂x2 ∂x2
..
..
.
.
∂ 2f
···
∂xn ∂x2
∂ 2f
∂x1 ∂xn
∂ 2f
∂x2 ∂xn
..
.
2
∂ f
∂xn ∂xn n×n
Minumum çin Gerekli Ko³ul:
1. E§er x∗ f fonksiyonun Ω tanm kümesinde lokal minimum noktas ise ,
[∇f (x∗ )]T d ≥ 0
d, x∗ noktasndaki uygulanabilir yön vektörü.
2. ∇f (x∗ ) = o
3. Verilen x∗ noktas için Hessian matrisi pozitif semidenite bir matris
olmal
T
< ∇2 f (x∗ ) d, d >= d · ∇2 f (x∗ )d ≥ 0
| {z }
H
Örnek:
x = [x1 x2 ]T
f (x) = 3x21 + 2x1 x2 + 3x21 − 20x1 + 4x2
x1 ≥ 0 x2 ≥ 0 için minimum noktas?
∂f
∂f
= 6x1 + 2x2 − 20
= 2x1 + 6x2 + 4
∂x1
∂x2
∂f
6x1 + 2x2 − 20
0
∂x1
∇f (x) = ∂f =
=
2x1 + 6x2 + 4
0
∂x∗ 2 x
4
Çözüm: x∗ = 1∗ =
x2
−2
f (x∗ ) = f (4, −2) = −44 x∗ ≥ 0 ko³ulunu sa§lamyor.
x∗1 ≥ 0 x∗2 ≥ 0 → snrlandrmalar(constraint)
gözönüne alrsak :
∗ 10 x1
minimum nokta → ∗ = 3
0
x2
10
fonksiyonun
10 lokal minimumu→10f ( 3 , 0) = −33,
33
+
2.0
−
20
6.
0
∗
∗
3
3
için → ∇f (x ) =
x =
= 32
10
0
2. 3 + 6.0 + 4
3
o:global minimum
x:snrlandrlm³(constraint)minimum
d
(f (g(x))) = f 0 (g(x))g 0 (x)
dx
Örnek:
f (x, y) = x2 y
g(x, y) = 3y 2 x
h(x, y) = x − 2y
F (x, y) = f (g(x, y), h(x, y)) = (3y 2 x)2 (x − 2y)
∂F
∂x
∂F
∂y
=?
=?
v = g(x, y) ,w = h(x, y) −→ u = f (v, w) = v 2 w
∂F
∂x
=
∂u
∂x
= 2vw = 2g(x, y).h(x, y) = 2(3y 2 x)(x − 2y) = 6x2 y 2 − 12xy 3
∂v
∂x
= 3y 2
∂u
∂w
= v 2 = (3y 2 x)2 = 9x2 y 4
∂w
∂x
=1
∂u
∂x
∂u
∂v
=
·
∂v
∂x
+
∂u
∂w
·
∂w
∂x
=
∂F
∂x
5
= (6x2 y 2 − 12xy 3 )3y 2 + 9x2 y 4 = 18x2 y 4 − 36xy 5 + 9x2 y 4 = 27x2 y 4 −
36xy Genel olarak x1 , x2 , · · · , xn ba§msz de§i³kenler
g1 (x1 , x2 , · · · , xn ), g2 (x1 , x2 , · · · , xn ), · · · , gm (x1 , x2 , · · · , xn )
F (x1 , x2 , · · · , xn ) = f (g1 , g2 , · · · , gn )
∂F
∂xj
=
=
∂f
∂g1
Pm
i=1
·
∂g1
∂xj
Di : i. argümann türevi
Di f gi
+
∂f
∂g2
·
∂g2
∂xj
+ ··· +
∂f
∂gm
·
∂gm
∂xj
Örnek:
f (x1 , x2 ) = 3x31 x32 − 2x21 x2 + 5
∇ f :?
H =? x1 = 1, x2 = 1
∂f
x
3
6x1 x2 − 4x1 x2
2
∂x1
|x1 =1,x2 =1 =
∇x f = =
∂f
9x21 x22 − 2x1
7
∂x2
Hessian
∂ ∂matrisi
f ∂x∂ 1 ∂x∂ 2 f
2 14
6x32 − 4x2
18x1 x22 − 4x1
∂x1 ∂x1
=
=
H=
∂ ∂
∂ ∂
2
2
18x1 x2
14 18
18x1 x2 − 4x1
f ∂x2 ∂x2 f
∂x2 ∂x1
x1 =1,x2 =1
Örnek:
Ölçüm de§erleri : (x1 , y1 ), (x2 , y2 ), · · · , (xn , yn )
least− squares çözümü a ve b'yi verir?
y = ax + b a =?, b =?
model:y = ax + b
ölçüm xi , yi
1.ölçüm:e1 = y − y1 = (ax1 + b) − y1
2.ölçüm:e2 = y − y2 = (ax2 + b) − y2
..
.
n.ölçüm:en = y − yn = (axn + b) − yn
Amaç: hatalarn karelerinin ortalamasn minimize eden a ve b de§erlerini
bulmak . P
J(a, b) = n1 ni=1 e2i −→ hatalarn karelerinin ortalamas(mean squared errorMSE)
∂J
∂a
0
→ MSE'yi minimum yapan de§er Minimum Mean Squ5J = =
0
∂J
∂b
ared Error(MMSE) -Least Squares(LS)
Ödev:
y = ax + b −→ J(a, b)
y = ax2 + bx + c −→ J(a, b, c)
5.2
Ko³ullu (Constraint) Optimizasyon
Problem tanm:minf (x)
Ko³ul
h1 (x) = 0
h2 (x) = 0
e³itlik ko³ullar
..
.
h (x) = 0
m
g1 (x) ≤ 0
g2 (x) ≤ 0
..
.
gp (x) ≤ 0
h̄ = (h1 , h2 , · · · , hm )
ḡ = (g1 , g2 , · · · , gp )
x∈ Ω , Ω ∈ Rn
Yukardaki problem tekrar yazlrsa
minf (x̄)
h̄(x̄) = 0̄
ḡ(x̄) ≤ 0 x̄ ∈ Rn
e³itsizlik ko³ullar
E³itlik ko³ulu:
Teorem: (E³itlik snrlamas için gerekli ko³ul)
x̄∗ noktas f fonksiyonunun h̄(x̄) = 0 ko³ulu altnda lokal ekstremum noktas
için a³a§daki ko³ulu sa§lamas gerekir.
∇f (x̄∗ ) + ∇h̄(x̄∗ ).Λ = 0
Λ ∈ Rm says
Pm lagrange∗ çarpan olarak adlandrlr.
∗
∇f (x̄ ) + i=1 ∇hi (x̄ ).Λi = 0
Lagrange fonksiyonu:
L(x̄, Λ̄) = f (x̄) + h̄(x̄)T .Λ̄
∇x L(x̄, Λ̄) = 0
∇Λ L(x̄, Λ̄)
min veya max oldu§unu bulmak için 2.derece ko³ullar:
P
∂ 2 h̄k (x̄)
Fn×n (x̄, Λ̄) = m
xk ← H matrisinin (i,j). eleman
k=1
∂xi ∂xj
∂ 2 f (x̄)
← F matrisinin (i,j). eleman
Hn×n (x̄) =
∂xi ∂xj
L(x̄∗ ) = H(x̄∗ ) + F (x̄∗ , Λ)
L(x̄∗ ) pozitif semidenite bir matris ise bulunan x̄∗ noktas minimum noktasdr.
Örnek:
f (x1 , x2 ) = 3x21 + 4x22 + 6x1 x2 − 8x2 − 6x1
Snrlama:h1 (x1 , x2 ) = x1 + x2 − 9 = 0
verilen ko³ulda f'yi minimize eden de§eri(x∗1 =?, x∗2 =?)
çözüm: x̄ = [x1
x2 ]T , Lagrange çarpan Λ1
L(x̄1 Λ1 )= f(x̄) + Λ1 h1 (x̄)
∇x L =
∂L
∂x1
∂L
∂x2
L(x̄, Λ1 ) = (3x21 + 4x22 + 6x1 x2 − 8x2 − 6x1 ) + Λ1 (x1 + x2 − 9)
∂L
∂x1
∂L
∂x2
∂L
∂Λ1
= 6x1 + 6x2 − 6 + Λ1 (∗)
= 8x2 + 6x1 − 8 + Λ1 (∗∗)
3 bilinmeyenli 3 denklem .
= x1 + x2 − 9(∗ ∗ ∗)
(∗∗) − (∗) → 2x2 − 2 = 0 ⇒ x∗2 = 1
(∗ ∗ ∗) → x∗1 = 8
(*)'de x∗1 ve x∗2 yerine yazlrsa → Λ1 = −48
∗ x
8
∗
x̄ = 1∗ =
x2
1
Örnek:
Bir önceki örnekte h1 (x̄) = x21 + x22 − 9 = 0 verilirse
Örnek:
üstteki örnekte
h1 (x1 , x2 ) = x21 + x22 − 9 = 0
x∗1 =? x∗2 =?
h1 (x1 , x2 ) = 2x1 − x2 − 4 = 0
L(x̄, Λ̄) = f (x̄) + Λ1 h1 (x̄) + Λ2 h2 (x̄)
x∗1 , x∗2 =?
5.3
Ara Snav Çözümleri
b)MATLAB
9 15
A(2 : 3, 1 : 2 : 4) =
20 30
c)B(1,:)*A(:,1)
d)B(2,:)*A(:,3)
α
2) x̄1 = −1
2
1
x̄2 = −1
1
a) < x̄1 , x̄2 >= x̄T1 .x̄2 = [α
1
− 1 2] −1 = α + 1 + 2 = 0 ⇒
1
α = −3
b) x̄1 ⊥x̄2 oldu§undan ē1 ve ē2 'yi bulurken normlarna bölmemiz
yeterli
12
−3
p
√
T
[−3 − 1 2] −1 = 14
kx̄1 k = x̄1 .x̄1 =
2
−3
x̄1
1
ē1 = kx̄1 k = √14 −1
2
12
1
p
√
T
[1 − 1 1] −1 = 3
kx̄2 k = x̄2 .x̄2 =
1
1
ē2 = kx̄x̄22 k = √13 −1
1
3
c) ȳ = −2
1
ȳ1
ȳ2 =?
−3
√
14
−1
< ȳ, ē1 >= [3 − 2 1] √ = √−5
14
14
2
√
14
1
√
3
−1
− 2 1] √ =
3
1
√
3
< ȳ, ē2 >= [3
√6
3
√
=2 3
ȳ =
−5
√
ē
14 1
√
+ 2 3ē2
2 5 9
3) A = 1 4 7
3 2 1
a) without pivoting −→ L =?
a31
a21
= 12 ,
= 32
a11
a11
1 0 0
2 5
9
−11
a32
−1
3
5
1
0
0
A1 = 2
A=
←−
= 23
2
2
a22
−3
−11
−25
2
2
2 0 1
0 2
1 0 0
2 5 9
1 0
3
5
A2 = 0 1 0 A1 = 0 2 2
L = 12 1
3
−11
0 11
1
0 0 −10
3
3
2
3
b) pivoting −→ E2 =?
| a31 |>|
a11 |−→
S3
0 0 1
P13 = 0 1 0
1 0
0
3 2
A1 = P13 A = 1 4
2 5
=
0
0 X
1
←→ S1
1
7 aa31
=
11
9
2
3
1
E2 = 0
−2
3
−11
3
0 0
1 0 X
0 1