Bilgisayar Mühendisli§inde Matematik Uygulamalar Ders Notlar Prof.Dr. Adnan Kavak çindekiler 1 Bölüm1 1.1 1.2 1.3 1.4 1.5 1.6 2 . . . . . . . . . . . . . . . 17 LU Ayr³trmas . . . . . . . . . . . . . . . . . . . . . . . . . 17 Pivot Seçme le LU Ayr³trmas . . . . . . . . . . . . . . . . . 18 Bölüm3 3.1 3.2 3.3 3.4 5 6 6 7 8 9 10 11 12 12 12 12 13 13 13 . 14 . 15 Bölüm2 2.1 2.2 3 5 Ortagonal Alt Uzaylar . . . . . . . . . . . . . . . . . . . . . 1.1.1 zdü³üm Matrisi(Projection Matrix) . . . . . . . . . . 1.1.2 Vektör zdü³ümü . . . . . . . . . . . . . . . . . . . . 1.1.3 Ev Ödevi Sorusu . . . . . . . . . . . . . . . . . . . . Gram-Schmidt Dikle³tirme Prosedürü . . . . . . . . . . . . . 1.2.1 Ev Ödevi Sorusu . . . . . . . . . . . . . . . . . . . . 1.2.2 Örnek . . . . . . . . . . . . . . . . . . . . . . . . . . Range Space Of A Matrix(Bir Matrisin De§er Uzay ) . . . . 1.3.1 Bo³ Uzay(NULL Space) . . . . . . . . . . . . . . . . Baz Önemli Matris Ayr³trmalar . . . . . . . . . . . . . . . 1.4.1 A=mxm ise . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 A->mxn matris ise m>n . . . . . . . . . . . . . . . 1.4.3 LU Matris ayr³trmas . . . . . . . . . . . . . . . . 1.4.4 Cholesky Matris ayr³trmas . . . . . . . . . . . . . 1.4.5 QR ayr³trmas . . . . . . . . . . . . . . . . . . . . EigenValue Decomposition (EVD) Veya Singular Value Decomposition (SVD) . . . . . . . . . . . . . . . . . . . . . . . LU Ayr³trmas Ve Denklem Sistemi Çözümü . . . . . . . . 23 EigenValue Decomposition(Özde§er Ayr³trmas) . . . 3.1.1 Özde§er Ve ÖzVektör Nasl Bulunur? . . . . . . 3.1.2 ÖzVektörlerin(EigenVectors)Lineer Ba§mszl§? Matrisin Ayr³trlmas . . . . . . . . . . . . . . . . . . Özde§er Ve Özvektörlerden Matris Olu³turma . . . . . Self-Adjoint Matrislerin Kö³egenle³tirilmesi . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . 23 24 26 26 27 29 3.5 3.6 4 Bölüm4 4.1 4.2 4.3 4.4 5 EVD Uygulamalar . . . . . . . . . . . . . . . . . . . . . . . . 30 Korelasyon Matrisi Özellikleri . . . . . . . . . . . . . . . . . . 31 QR Ayr³trmas . . . . . . . . . . . . . . . . . . . Niçin QR ? . . . . . . . . . . . . . . . . . . . . . HouseHolder Dönü³ümü: . . . . . . . . . . . . . . QR Yöntemi le Denklem Sistemi Çözümü Matlab Bölüm5 5.1 5.2 5.3 33 . . . . . . . . . . . . . . . Örne§i . . . . . . . . . 33 34 35 40 47 Optimizasyon(En yileme) . . . . . . . . . . . . . . . . . . . . 47 Ko³ullu (Constraint) Optimizasyon . . . . . . . . . . . . . . . 52 Ara Snav Çözümleri . . . . . . . . . . . . . . . . . . . . . . . 55 Bölüm 1 Bölüm1 1.1 Ortagonal Alt Uzaylar ekil 1.1: Ortagonal Alt Uzay X1 X = X2 ∈ X3 • S S = R3 • V ⊂S • V1 =W • W1 = V 5 XX ve W ortagonal altuzaylardr. XX vektoru S'de bir vektordur. 0 XX v V altuzayinda X in izdü³üm vektörüdür. 0 XX w W altuzayinda X in izdü³üm vektörüdür. 1.1.1 zdü³üm Matrisi(Projection Matrix) P 1 , P 2 , P 3 · · · P n V altuzayn tarayan ( span ) vektörleri olsun X v = C1P 1 + C2 P 2 + C3P 3 + · · · + Cn P n Am∗n = P 1 P 2 P 3 · · · P n −1 H P v = Am∗n (AH m∗n Am∗n ) Am∗n > izdü³üm matrisi 1.1.2 Vektör zdü³ümü 3 1 0 a= x= y= 2 0 1 ax = ? 0 T < a, x >= a ∗ x = 3 2 ∗ =3 1 3 ax = 3 ∗ x = 0 ay = ? 0 < a, y >= a ∗ y = 3 2 ∗ =2 1 0 ay = 2 ∗ y = 2 < a, x >= kak ∗ kxk ∗ cos(Θ) = kak ∗ cos(Θ) yandaki ifadede kxk = 1 dir. T 1.1.3 Ev Ödevi Sorusu Ev ödevi sorusu a³a§daki gibidir : ekil 1.2: Ev Ödevi Sorusu −→ Av = P 1 P 2 −→ P Av = · · · W −→ Aw = P 2 P 3 −→ P Aw = · · · X v = P Av · X · · · X w = P Aw · X · · · V 1.2 Gram-Schmidt Dikle³tirme Prosedürü a ve b'yi kullanarak birbirine dik vektörler nasl olu³turulur? k q1 k=1 , k q2 k=1 0 1- 41 −→ b nin q1 üzerindeki bile³eni 0 2- e1 −→ b nin 41 'den fark vektörü 3- q2 −→ e1 'in normalize edilmi³ hali Algoritma: = P 1 , P 2 , · · · , P n vektörleri için birbirine dik olan T = q1 , q2 , · · · , qk k≤n T 0 < qi , qj >= qTi · qj = δij δij = 1) q1 = p1 kp1 k 1 kp1 k = (p1 T · p1 ) 2 1 i=j ise 0 i 6= j 2) ∆2 =< p2 , q1 > q1 nin q1 üzerindeki izdü³ümü e2 = p2 − ∆2 e2 q2 = ke2 k .. . k.admda P k−1 ek = pk − i=1 < pk , qi > qi ek qk = kek k ∆2 0 p2 1.2.1 Ev Ödevi Sorusu 3 3 4 −1 P 1 = 2 , P 2 = −4 , P 3 = 3 , P 4 = −2 1 2 −2 −3 P 1 ,P 2 ,P 3 ve P 4 'ü kullanarak Gram-Schmidt yöntemiyle birbirine dik olan vektörleri bulunuz ? 1.2.2 Örnek R 2T < x(t), y(t) >= 0 x(t)y(t)dt 1 kx(t)k = (< x(t), x(t) >) 2 1.3 Range Space Of A Matrix(Bir Matrisin De§er Uzay ) A = P1 P2 ··· Pm A·x=y x1 x2 x = .. ∈ Rm . xm y = x1 P 1 + x2P 2 + · · ·+ xm P m 1 0 0 x1 Örnek: A = 0 0 0 x = x2 1 0 1 x3 1 0 0 x1 A · x = x1 0 + x2 0 + x3 0 = 0 = y 1 x 1 + x3 1 0 1 0 y vektörü 0 , 0 vektörlerinin lineer birle³imidir. 1 1 1 0 R(A)= span{ 0 , 0} ,R(A)99K de§er uzaydr . 1 1 1.3.1 Bo³ Uzay(NULL Space) 0 0 = 0 0 Ax = 0 i³lemini sa§layan x vektörüne A'nn bo³ uzay(null space) denir.N(A) ile gösterilir. Örnek: Yukardaki A matrisi için : 1 0 0 x1 0 0 0 0 x2 = 0 1 0 1 x3 0 x1 = 0, x1 + x3= 0 → x3 = 0 x2 herhangi bir α de§eridir 0 N (A) = span{α} 0 1.4 Baz Önemli Matris Ayr³trmalar Ax = b denklem sistemi için 1.4.1 A=mxm ise Klasik yöntem:x = A−1 · b Baz durumlarda A−1 almak oldukça zor ve karma³k bir i³lem. O(m3 ) 99K polinom derecesi en fazla m3 olan sayda (+)ve (*) i³lemi gerekir. 1.4.2 A->mxn matris ise m>n Ax = b H (AH n∗m · Am∗n )xn∗1 = An∗m bm∗1 x = (AH A)−1 AH · b (AH A)−1 AH → A] : A'nn pseduo-inxers 1.4.3 LU Matris ayr³trmas A:m × m kare matris ,A = L · U 1 0 0 0 x 1 0 0 L= =⇒ Lower-Triangular(alt üçgensel) . x .. . . . 0 x . . . x 1 m∗m x x x x 0 x x x U= =⇒ Upper-Triangular(üst üçgensel) .. . . 0 . . x 0 . . . 0 x m∗m Uygulamas:Ax = b denklem sistemi çözümünde kullanlr.(E§er A:m*m ise) 1.4.4 Cholesky Matris ayr³trmas A = simetrik , pozitif-denite bir matris ise A→ m × m xT · Ax > 0 x ∈ Rn vektör ise A pozitif denite bir matris y = Ax < x, Ax >= xT · Ax x 0 0 0 0 x 0 0 H A = LDL ,D⇒ kö³egen D = .. . . 0 . . 0 0 ... 0 x Cholesky ayr³trmas a³a§daki gibidir: A = U DU H H A = LDL Uygulamas:Kestirim ve Kalman ltresi problemlerinin çözümünde 1.4.5 QR ayr³trmas A : m × n kare olmayan bir matris ise Am×n xn×1 = bm×1 A = QR 1 0 0 0 0 1 0 0 Q unitary bir matris ⇒ QH · Q = I = . 0 .. . . . 0 0 ... 0 1 R = üst-üçgense bir matris ancak kö³egendeki de§erler ”1” de§il· Ax = b ↓ Q·R·x=b QH Q ·Rx = QH b | {z } |{z} I R·x= c 1.5 −→ çözümü Ax = b ' ye göre daha kolay · EigenValue Decomposition (EVD) Veya Singular Value Decomposition (SVD) A : m × m kare =⇒EVD A : m × n kareP de§il =⇒SVD VH SVD: A = U Λ1 0 0 0 P 0 Λ2 0 0 = .. . . 0 . 0 . 0 . . . 0 Λn n×n Λi : singular(tekil)de§erler U = m × n=⇒ unitary U H · U = In×n V H = m × n=⇒ unitary V · V H = In×n Uygulama:Sinyal i³leme , haberle³me , kestirim vs· · · Kullanc yönü Qi 1.6 i = 1, 2, · · · , N LU Ayr³trmas Ve Denklem Sistemi Çözümü Am×m xm×1 = bm×1 A=L·U ↓ LU x = b Ux = y Ly = b =⇒ y =⇒ x l11 0 · · · 0 y1 b1 l21 l22 · · · y2 b 2 0 .. .. .. .. = .. . . ··· . . . ym bm lm1 lm2 · · · lmm b1 y1 = l11 = 1 99K y1 = b1 l11 b2 − l21 · y1 l21 · y1 + l22 · y2 = b2 99K y2 = = b2 − l21 · y1 99K l22 = 1 l22 ↓ Pj−1 lji · yi yj = bj − i=1 j = 2, 3, 4, · · · , m forward substitution (ileri yerine koyma) Ux = y ↓ u11 u12 0 u22 0 0 .. .. . . 0 0 1 xm = umm xm−1 = .. . u13 · · · u23 · · · u33 · · · .. . 0 0 ··· u1m u2m u3m .. . umm x1 y1 x2 y 2 x3 y 3 = .. .. . . xm ym · ym 1 um−1·m−1 (ym−1 − xm · um−1,m ) P 1 yj − m (u · x ) 99K Backward substitution(geriye yerine k k=j+1 jk ujj koyma) m2 −1 O( ) i³lem gerektirir ve x = A · b yöntemine göre daha az i³lem yükü 2 gerektirir. Zorluk: xj = 1-) uii 'lerin ”0” olmas 2-) uii 'ler pivot olarak adlandrlr . Bölüm 2 Bölüm2 2.1 A LU Ayr³trmas U L −→ −→ Gauss Elimination Satr i³lemlerini saklayarak (Birim Satr ³lemleri ) T a1 satr1 satr2 aT = .. A = .2 . .. satrm m×m aTm m×m Birim Satr ³lemi(B.S.)= satr i ← α satr i +β satr j α, β ∈ R Örnek: 2 4 −5 1 −→ A = LU ?, L =?, U =? A = 6 8 4 −8 −3 Amaç BS ile kö³egen altndaki de§erleri sfrlamak a21 1)S2 ←− S2 − 3S1 3= a11 2 4 −5 1 0 0 2 4 −5 1 ←− Orjinal A matrisi A1 = 0 −4 16 = −3 1 0 6 8 4 −8 −3 0 0 1 4 −8 −3 a31 2)S3 ←− S3 − 2S1 2= a11 2 4 −5 1 0 0 2 4 −5 A2 = 0 −4 16 = 0 1 0 0 −4 16 ←− updated(Bir önceki 0 −16 7 −2 0 1 4 −8 −3 update edilmi³ A) 17 a32 3)S3 ←− S3 − 4S2 4= a22 2 4 −5 1 0 0 2 4 −5 A3 = 0 −4 16 = U = 0 1 0 0 −4 16 ←− updated(Bir 0 0 −57 0 −4 1 0 −16 7 önceki update edilmi³ A) U matrisi olu³turuldu . L'yi bulmak için : U = E3 E2 E1 A =⇒ A = E1−1 E2−1 E3−1 U −1 −1 −1 E1 A = A1 E2 E 1 A = A2 L = E1 E2 E3 1 0 0 1 0 0 1 0 0 E1−1 = 3 1 0 , E2−1 = 0 1 0 , E3−1 = 0 1 0 0 0 1 0 4 1 2 0 1 1 0 0 E1−1 E2−1 E3−1 = 3 1 0 = L 2 4 1 1 0 0 2 4 −5 A = 3 1 0 0 −4 16 2 4 1 0 0 −57 L 2.2 U Pivot Seçme le LU Ayr³trmas Amaç : Pivot(kö³egen) elemanlarnn o sütunda en büyük de§er alacak ³ekilde satr yerlerinin de§i³tirilmesi (pivoting) Örnek: 2 4 −5 6 8 1 4 −8 −3 1−)a11 max olacak ³ekilde S1 ←→ S2 Bunun anlam orjinal A matrisini yer de§i³tirme matrisi (P12 ) ile soldan çarpmak demektir. 0 1 0 P12 = 1 0 0 0 0 1 Yukardaki P12 matrisi birim matristeki 2.satrn yer de§i³tirilmi³ halidir. 1 0 0 0 I3×3 = 0 1 0 −→ P12 = 1 0 0 1 0 0 1 0 2 4 A1 = P12 A = 1 0 0 6 8 4 −8 0 0 1 6 8 1 = 2 4 −5 4 −8 −3 ↓ 2−) = a21 'i sfrlamak için katsay −1 3 −2 a31 'i sfrlamak için katsay 3 = 1 0 0 0 0 1 −5 1 −3 −a21 a11 −a31 a11 → E1 → E2 0 0 1 0 0 1 0 −1 1 0 A1 3 −2 0 1 0 0 1 3 ↑ ↑ ↓ E2 P12 · A E1 6 8 1 −→ 1. sütundaki a011 in altndaki elemanlar sfrland . A2 = 0 43 −16 3 −40 −11 0 3 3 3−) 2.sütun için en son admda güncellenmi³ olan A2 matrisinin a22 eleman için pivot seçilir . 1 A2 = 0 | −40 | > | 43 | oldu§undan S2 ←→ S3 (A02 de) ya da S1 ←→ S2 (A021 de) 3 A02 yi göz önünealrsak : 1 0 0 1 0 0 6 8 1 P23 = 0 0 1 A3 = P23 · A2 = 0 0 1 0 43 −16 3 −40 −11 0 1 0 0 1 0 0 3 3 6 8 1 −11 99K a32 'yi sfrlamak için katsay = A3 = 0 −40 3 3 4 −16 0 3 3 4−) A4 = E3 · A3 = E3 · P23 · E2 · E1 · P12 · A A1 = P12 · A A2 = E2 · E1 · P12 · A A3 = P23 · E2 · E1 · P12 · A 1 A4 = 0 0 0 1 1 10 0 0 1 6 0 0 8 −40 3 4 3 6 −11 = 0 3 −16 0 3 | 1 8 −40 3 0 {z 1 −4 3 −40 3 = 1 10 −11 3 −57 10 ↑ E3 U U = E3 P23 E2 E1 P12 A −1 −1 −1 −1 −1 =⇒ A = P12 E1 E2 P23 E3 U | {z } V 1 0 0 1 0 0 1 0 0 −1 0 0 1 0 0 1 = P23 = 0 0 1 = P23 0 1 0 0 1 0 0 1 0 1 0 0 1 0 0 −1 E3 = 0 1 0 → E3 = 0 1 0 1 0 −1 1 0 10 10 1 1 0 0 −1 −1 1 P23 E3 = 0 −1 10 0 1 0 1 0 0 1 0 0 E2 = 0 1 0 → E2−1 = 0 1 0 −2 2 0 1 3 3 0 1 1 0 0 1 0 0 1 0 −1 = 0 −1 1 E2−1 · P23 · E3−1 = 0 1 0 0 −1 10 10 2 2 0 1 0 1 0 1 3 3 1 0 0 1 0 0 → E1−1 = 1 1 0 1 0 E1 = −1 3 3 0 0 1 0 0 1 1 0 0 1 0 0 1 −1 = 1 1 · E3−1 = 31 1 0 0 −1 E1−1 · E2−1 P23 10 3 2 2 0 0 1 1 0 3 3 } 1 0 0 0 1 0 0 0 1 0 1 0 0 −1 10 1 0 1 0 ⇒ E3 0 1 0 −1 P12 = 1 0 0 = P12 0 0 1 0 1 0 1 −1 −1 −1 P12 · E1−1 E2−1 P23 E3 = 1 0 0 31 2 0 0 1 3 0 −1 10 1 1 0 3 1 = 1 2 0 3 −1 −1 −1 A = P12 · E1−1 E2−1 P23 E3 ·U | {z } V −1 1 −1 −1 −1 −1 L = P23 P12 · V = P23 P12 P12 E1 E2 P23 E3 −1 −1 −1 −1 −1 E = P12 P12 E1 E2 P23 P23 | {z } 3 | {z } I I −1 −1 −1 = E1 E2 E3 1 0 0 ⇒ L = 32 1 0 1 −1 1 3 10 Pivot seçme yönteminde A=V ·U P · A = LU 1P −1 12 P12 I birim matrisine e³ittir −1 10 0 1 1 0 = 0 V Bölüm 3 Bölüm3 3.1 EigenValue Decomposition(Özde§er Ayr³trmas) Fark denklemi (*): y1 (t + 1) = −y1 (t) − 1.5y2 (t) y2 (t + 1) = 0.5y1 (t) +y2 (t) y1 (t + 1) y1 (t) y2 (t + 1) = y(t) = =? y2 (t y2 (t) + 1) −1 −1.5 =⇒ y(t + 1) = y(t) =⇒ y(t + 1) = Ay(t) 0.5 1 | {z } A Çözüm: y1 (t) = λt x1 y2 (t) = λt x2 t+1 t t λ x1 = −λ x1 − 1.5λ x2 λt+1 x2 = 0.5λt x1 + λt x2 - x1 x =λ 1 =⇒ A x2 x2 | {z } | {z } x x =⇒ Ax = λx (∗∗) (**)denklem siteminin çözümü ayn zamanda (*) denklem sisteminin çözümüdür. x : eigenvector(özvektör) λ:eigenvalue(özde§er) 23 3.1.1 Özde§er Ve ÖzVektör Nasl Bulunur? Ax = λx Genel olarak : A:n×n x:n×1 λ:1×1 =⇒ Ax = λx (A − λI)x = 0 χA (λ) = det(A − λI) = |A − λI| karakteristik polinom χA (λ) = det(A − λI) = 0 −→ çözümü λ de§erlerini verir. Örnek: −1 −1.5 A= 0.5 1 −1 −1.5 λ 0 −1 − λ −1.5 A − λI = − = 0.5 1 0 λ 0.5 1−λ χA (λ) = det(A − λI) = (−1 − λ)(1 − λ) − (0.5)(−1.5) λ − 0.25 = 0 (λ − 0.5)(λ + 0.5) = 0 ↓ λ1 = 0.5 λ2 = −0.5 2 buldu§umuz bu λ de§erlerini (A − λI)x = 0'da yerine koyarsak : λ1 x1 x1 −1 − λ −1.5 = 0.5 −→ x =0 0.5 1−λ 1 | {z } B vektörü B'nin null space'ini olu³turur α 1 = α = 1 −→ x1 = −α −1 1 √ √ √ x1 2 2 2 kx1 k = α + α = 2α −→ x1 = = −1 kx1 k √ 2 −0.5 −1.5 x2 = 0 λ2 = −0.5 −→ (A − λ2 I)x2 = 0.5 1.5 | {z } C x2 C'nin null-space'idir. √ √ −3α x2 = −→ kx2 k = 9α2 + α2 = 10α α −3 √ 10 x2 = 1 √ 10 ÖzVektör Özde§er 1 √ 2 λ1 = 0.5 −→ x1 = −1 √ 2−3 √ 10 λ2 = −0.5 −→ x2 = 1 √ 10 Denklem sistemi çözümü : 1 √ y (t) y 1 (t) = 1 = λt1 x1 = (0.5)t −12 y 2 (t) √ 2−3 √ y 1 (t) t t 10 y 2 (t) = = λ2 x2 = (−0.5) 1 y 2 (t) √ 10 Hem y 1 (t) hem de y 2 (t) orjinal denklem sist. çözümünü sa§lyor. Sistem linear bir sistem oldu§undan toplam çözüm: y t (t) = C1 λt1 x1 + C2 λt2 x2 Denklem sisteminde ba³langç ko³ullar verilirse C1 ve C2 bulunabilir. 3.1.2 ÖzVektörlerin(EigenVectors)Lineer Ba§mszl§? −3 √ x2 = 110 √ 10 −3 √ 1 −1 10 √ 1 = √−3 − √1 < x1 , x2 >= xT1 · x2 = √ 20 20 2 2 √ 10 −4 −2 √ = √ x1 ∗ x2 = √−4 = 20 2 5 5 Lema: n × n boyutlu A matrisinin tüm özde§erleri birbirinden farkl ise A matrisinin özvektörleri brbirinden lineer ba§mszdr. k1 x1 + k2 x2 = 0 k1 Ax1 + k2 Ax2 = k1 λ1 x1 + k2 λ2 x2 = 0(*) k1 λ2 x1 + k2 λ2 x2 = 0(**)1 (∗) − (∗∗) −→ k1 (λ1 − λ2 )x1 = 0 λ1 6= λ2 , x1 6= 0 −→ k1 = 0 olmal ayn ³ekilde λ1 6= λ2 için −→ k1 = 0 olmal . 1 √ x1 = −12 √ 2 3.2 Matrisin Ayr³trlmas A:n×n Özvektörleri : x1 , x2 , x3 , · · · , xn ↓ ↓ ↓ ↓ Özde§erleri : λ1 , λ2 , · · · , λn A xi = λi xn i = 1, 2 · · · , n Ax1 Ax2 Ax3 · · · Axn n×n = λ1 x1 λ2 x2 λ3 x3 · · · λn xn n×n ↓ λ1 0 0 λ2 An×n x1 x2 x3 · · · xn n×n = x1 x2 x3 · · · xn n×n | {z } | {z } · · · · · · 0 0 | - S S −→ AS = Sλ 1k 1 x1 + k2 x2 = 0 denklemi λ2 ile çarplrak elde edildi 0 0 ··· 0 {z λ ··· ··· ··· ··· 0 0 · · · λn n×n } E§er eigenvector'ler lineer ba§msz iseler, S matrisi full rank ve tersi alnabilirler. −1 −1 −→ A |SS {z } = S ∧ S I −→ ASS −1 = S∧S −1 veya S −1 AS = ∧ Eigenvalue Decomposition(EVD) An nasl bulunur? ASS −1 = S ∧ S −1 −1 −1 2 −1 A2 = S ∧ S | {zS} ∧S = S ∧ S I −1 3 −1 3 2 −1 A =S∧ S | {zS} ∧S = S ∧ S I .. . Ak =S ∧k S −1 e§er eigenvector'ler lineer ba§msz ise λ1 0 0 ··· 0 0 λ2 0 · · · 0 ∧= · · · · · · · · · · · · · · · 0 0 0 · · · λn k 0 ··· 0 λ1 0 0 λk2 0 · · · 0 ∧k = · · · · · · · · · · · · · · · 0 0 0 · · · λkn ····································································· eAt nasl bulunur? P xi ex = ∞ i=0 i! P Ai ti ∞ eAt = i=0 i! 3.3 Özde§er Ve Özvektörlerden Matris Olu³turma λi , xi i = 1, 2, · · · , n xH i xj = 0 olsun (i 6= j ) n = 2 ele alalm. kxi k = 1 V x 0 S = x1 x2 = 1 0 x2 S −1 S = I − xH − 1 0 kx1 k2 xH 1 1 x2 x1 x2 = H = − xH − x2 x1 kx2 k2 0 1 2 −1 H ⇒S =S A = S ∧ S −1 = S ∧SH λ1 0 − xH − xH − − 1 1 = x1 x2 = λ1 x1 λ2 x2 2×2 − − − xH 0 λ2 − xH 2 2 H A = λ 1 x1 xH 1 + λ 2 x2 x2 Genel olarak ,özde§erleri(λi ) ve özvektörleri(xi ) verilen bir matris için , e§er xH i · xj = 0 ise bu matris ³u ³ekilde olu³turulabilir: H H A = λ 1 x1 xH 1 + λ 2 x2 x2 + · · · + λ n xn xn =⇒ A = Pn i=1 λ i xi xH i Pi = x i x H i Örnek: λ1 = λ2 = 1 λ3 = −1 0 0 1 1 1 √ √ x1 = 0 , x2 = 2 , x3 = 2 1 −1 √ √ 0 2 2 A matrisini olu³turunuz? Cevap: 1 0 0 A = 0 0 1 olmal . 0 1 0 Örnek: λ1 = 5, λ1 = 10 3 −4 x1 = x2 = 4 3 A =? 3 −4 = =0 x1 ⊥ x2 4 3 x1 1 3 1 −4 u1 = =5 u2 = 5 kx1 k 4 3 9 12 1 3 1 H 3 4 = 25 P1 = u1 u1 = 25 4 12 16 xH 1 x2 −4 16 −12 1 −4 3 = 25 P2 = = 3 −12 9 9 12 16 −12 1 1 +10 · 25 A = λ1 P1 + λ2 P2 = 5 · 25 −12 9 12 16 9 + 32 12 − 24 = 15 12 − 24 16 + 18 u2 uH 2 A= 1 25 41 5 −12 5 −12 5 34 5 Not:A simetrik bir matris. 3.4 Self-Adjoint Matrislerin Kö³egenle³tirilmesi Self−adjoint matris −→ < Ax, x >=< x, AH x > ↓ ↓ H H x Ax = x Ax * A matrisinin elemanlar reel de§erler ise Self−adjoint matrise simetrik matris denir ve AT = A * A matrisinin elemanlar kompleks de§erler ise Self−adjoint matrise hermitian matris denir ve AT = A Özellikleri: 1- Self−adjoint matrisin (AH = A ise) eigenvalue'lar reel de§erliklidir. ispat:< Ax, x >=< λx, x >= λ < x, x >= λxH x < x, AH x >= λ∗ < x, x >= λ∗ xH x → λxH x = λ∗ xH x → λ = λ∗ için λ reel de§erlikli olmal. 2- Self−adjoint(simetrik veya hermitian)matrisler için birbirinden farkl eigenvalue'lara kar³lk gelen eigenvektörler birbirine diktir. ispat:< Ax1 , x2 >=< x1 , AH x2 >=< x1 , λ2 x2 >= λ2 < x1 , x2 >= λ2 xH 1 x2 ayn zamanda < Ax, x >=< λ1 x1 , x2 >= λ1 xH 1 x2 H H ⇒ (λ1 x1 x2 − λ2 x1 x2 ) = 0 ⇒ (λ1 − λ2 )(xH 1 x2 ) = 0 λ1 6= λ2 ise x1 ⊥ x2 olmal. Teorem: n × n boyutu A matrisi hermitian bir matris ise (AH = A ise) A matrisinin EVD açlm : V P H ³eklinde yazlr . A = U U H = ni=1 λi U i U i Bu arada U matrisi U = U 1 U 2 U 3 · · · U n unitary bir matristir. 3.5 EVD Uygulamalar X1 X2 x = .. . a1 (Θi ) a2 (Θi ) a(Θ) = .. =⇒ steering vector at θi . XM aM (Θi ) x = a(θ1 )α1 S1 + a(θ2 )α2 S2 + · · · + a(θk )αk Sk Korelasyon matrisi:R R = E{xxH } M>K R −→ EV D −→ λi , U i λ1 0 0 ··· ··· ··· 0 0 λ2 0 · · · · · · · · · 0 0 0 λ3 · · · · · · · · · 0 V .. . ··· ··· 0 = · · · · · · · · · · · · · · · · · · · · · λ · · · 0 r · · · · · · · · · · · · · · · . . . · · · 0 0 0 ··· ··· ··· 0 Dominant eigenvalue says −→ r , ortamda r adet kullanc vardr . EVD −→ MUSIC,ESPRIT,· · · vs high resolution algoritmalarla Qi 'ler bulunabilir . 3.6 Korelasyon Matrisi Özellikleri 1) R −→ hermitian bir matris örnek: x(t) = ejwt −→kompleks sinusoid t = 0, 1, · · · , M− 1 1 ejw j2w x= e .. . j(M −1)w e 1 PN H R = E{xxH } ∼ = i= x(i)x (i) N 1 ejw ej2w .. . R = E{ 1 ejw ej2w · · · j(M −1)w e ej(M −1)w } e−jw 1 ejw ··· 1 ejw ej2w ··· = E{ ej(M −1)w ej(M −1)w R hermitian bir matris e−j2w · · · e−jw e−j2w 1 ··· ··· ··· ··· ··· · · · e−j(M −1)w · · · e−j(M −1)w } · · · e−j(M −3)w ··· ··· ··· 1 m×m 2) R'nin eigenvalue'lar reel ve pozitif de§erlerden olu³ur . λ1 6= λ2 6= · · · = 6 λm > 0 3) R'nin eigenvektörleri biribirine diktir.(q i ⊥ q j ) q1, q2, · · · , qm → qH i · qj 4) Rk matrisinin eigenvalue'lar ispat ? (ödev) λk1 , λk2 , · · · , λkm λ1 0 0 H V 5) Q = q 1 q 2 · · · q m Q RQ = = · · · · · · · · · 0 Unitary− similarity transformation 6) tr[R] = PM i=1 λi spat ? ··· ··· ··· ··· ··· .. . ··· ··· ··· ··· 0 ··· ··· ··· 0 ··· ··· 0 λ2 0 0 0 λ3 ··· ··· ··· ··· ··· ··· ··· λr ··· ··· .. . 0 0 0 0 0 ··· · · · λm Bölüm 4 Bölüm4 4.1 QR Ayr³trmas A = QR Q:unitary matris R:üst üçgensel matris Unitary matris: QH · Q = I E§er Q'nun sadece gerçek de§erlikli elemanlar varsa Q'ya ortogonal matris denir. Lema1: y = Qx kyk = kxk y ∈ Rm×1 , x ∈ Rm×1 Lema2: Y = QX , Y ve X birer matris kY kF = kXkF Not: kkF → matris Frobenius norm P Pn 1 2 12 H 2 kXkF = ( m i=1 j=1 |Xij |) = (tr(X X)) Örnek: a b a c X= , XH = c d b d 2 a b a c a + c2 ab + cd H X X= = c d b d ab + cd b2 + d2 P P tr(X H X) = a2 + b2 + c2 + d2 = ( 2i=1 2j=1 |Xij2 |) 33 4.2 Niçin QR ? Am×n xn×1 = bm×1 −→çözümx̂ = (AH A)−1 AH ·b | {z } ] A :pseduo-inverse -bu çözüm kAx − bk22 minimize eden bir çözümdür. -ayn zamanda least−squares(en küçük kareler) çözümü olarakda adlandrlr. H kAx − bk2 = (Ax − b)H (Ax − b) = (xH AH − b )(Ax − b) H H J(x) = xH AH Ax − xH AH b − b Ax + b b ↑ maliyet fonksiyonu ∂J(x) vektörel türev → = AH Ax + AH Ax − AH b − AH b = 0 ∂x ⇒ 2AH Ax − 2AH b = 0 LS çözüm ⇒ x = (AH A)−1 AH b pucu: ∂ H (x A) = A, ∂x ∂ (Ax) = AH ∂x Örnek: x1 c1 x x= c = c2 2 , x3 c3 H x c = x 1 c1 + x 2 c2 + x 3 c3 ∂ H ∂ H x c = c1 , x c = c2 ∂x1 ∂x2 ∂ ∂x1 c1 ∂ ∂ = = c2 = c ∂x ∂x2 c3 ∂ , ∂ H x c = c3 ∂x3 ∂x3 R1 Am×n = Qm×m Rm×n =Q 0 m>n R1 : n × n, 0 : (m − n) × n Am×n xn×1 = bm×1 (∗) ⇒ QRx = b QH Q Rx = QH b | {z } I Rx = QH · b QH m×m · bm×1 c = →c:n×1 d d : (m − n) × 1 Rx= QH b R1 c ⇒ x= 0 d R1n×n xn×1 = cn×1 (∗∗) (*) ve (**) denklemlerinin çözümü ayn x vektörüdür. (**) kolaylkla çözülebilir çünkü R1 üst üçgensel bir matrisdir. not: m < n ise QR kullanlamaz ! QR Ayr³trmas: Gram−Scmidt algoritmas, Householder dönü³ümü veya Givens rotation yöntemlerinden birisi kullanlarak yaplabilir. 4.3 HouseHolder Dönü³ümü: xv : x vektörünün v vektörü üzerine izdü³ümü x⊥ v : (x − xv ) yani x'in xv 'ye dik olan bile³eni H v x : x vektörünün x⊥ v 'ye göre yanstlm³(döndürülmü³ü) x v = Pv · x Pv = VV x⊥ v = H H (V V ) ⇒ xv = x⊥ v v1 v2 , V = .. . vn VV H ·x H (V V ) ⊥ Pv x = (I − ⊥ ,Pv VV = I = Pv = I − VV H H (V V ) H )x = x − xv H (V V ) H VV Hv = I − 2 H (V V ) Householder dönü³üm matrisi x'in yalnzca V vektörü üzerindeki bile³enin yönünü de§i³tirir. H H VV VV Hv = I − H − H (V V ) (V V ) | {z } = Pv⊥ − Pv ⊥ Hv x = Pv⊥ x − Pv x = x⊥ v − xv = xv + (−xv ) H 2 Hv = I Hv = Hv Ödev: Hv .Hv = I oldu§unu gösteriniz. V Nasl seçilir? X1 X2 X = .. . Xn n×1 Amaç ,bu X vektörünü öyle bir Hv ile çarpmak ve sonuçta x2 = x3 = · · · = xn = 0 yapmak. Amaç: α 1 0 0 0 Hv x = = α 0 = αe1 .. .. . . 0 n×1 0 n×1 " ⇒ I −2 VV H # x = αe1 H (V V ) H (V x)V x−2 = αe1 H (V V ) H H (V x) (V x) ⇒ x − αe1 = 2 H (2 H ·V = 1kabul edersek) (V V ) (V V ) kHv xk = kαe1 k Hv :ünitary. ⇒ kxk = α) (Not:Hv x = αe1 x − αe1 = V x ± kxke1 = V ⇒ V = x + sign(x1 )kxke1 x x A = x x Step1 α1 0 H1 A = 0 0 H1 : 4 × 4 x x x x x x x x x x x x x x x x genel olarak Am×n , m > n v1 v H 1 kv 1 k2 v 1 = x + sign(x1 )kxke1 4 × 1 e1 = [1000]T V1 : 4 × 1 Step2 H2 : 3 × 3 v2vH 2 H2 = I − 2 kv 2 k2 v 2 = y + sign(y1 )kyke1 3 × 1 " # 0 T 1 0 Q2 = T 0 = 0 0 H2 0 H1 = Q = I − 2 2×2 Step3: H3 : 2 × 2 V2 : 3 × 1 α1 x 0 α2 Q2 Q1 A = 0 0 0 0 x x x x v3vH 3 kv 3 k2 v 3 = z + sign(z1 )kzke1 2 × 1 V3 : 2 × 1 α1 x x T 1 0 0 0 α2 x 0 0= Q3 Q2 Q1 A = Q3 = 0 1 0T 0 0 α3 = R 0 0 0 H3 0 0 0 3×3 H3 = I − 2 Sonuçta : Q3 Q2 Q1 A = R QH Q Q Q A = QH 3 R | 3{z }3 2 1 I H QH Q Q A = QH 2 Q3 R | 2{z }2 1 I H H QH Q A = QH 1 Q2 Q3 R | 1{z }1 I H H ⇒ A = QH 1 Q2 Q3 R | {z } Q ⇒ A = QR H H Q = QH , QH = Q3 Q2 Q1 1 Q2 Q3 Denklem sistemi Ax = b QRx = b c Rx = QH b = d Problem R1 X = C sistemi çözümüne indirgenmi³tir. R1 üst üçgensel bir matris oldu§undan çözüm geri yerine koyma yöntemiyle kolaylkla bulunabilir. Not: 2. ve 3. admdaki Q2 ve Q3 'ler Q2 4×4 Ṽ2 Ṽ2H =I −2 kṼ2 k2 Q3 4×4 = I − 2 Ṽ3 Ṽ3H kṼ3 k2 0 Ṽ2 = Ṽ2 4×1 0 Ṽ3 = 0 Ṽ3 4×1 4.4 QR Yöntemi le Denklem Sistemi Çözümü Matlab Örne§i A = [788; 862; 173; 073; 695] 788 862 A= 173 073 695 0 b = [4726242339] 47 26 b= 24 23 39 [m, n] = size(A) m= 5 n= 3 − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − −− function v = makehouse(x) % % Make the Householder vector v such that Hx has zeros in % all but the rst component % % function v = makehouse(x) % % x = vector to be transformed % % v = Householder vector c 1999 by Todd K. Moon % v = x(:); nv = norm(v); if (abs(x(1)) == nv) v = 0 ∗ v; else if (v(1)) v(1) = v(1) + sign(v(1)) ∗ nv; else v(1) = v(1) + nv; end end . >> v = makehouse(A(:, 1)); −−− − − − −− − − − − − − − − − − − − − − − − − − − − − − − − − − − − − 19.2474 8.0000 v= 0 6.0000 a = A(:, 1) 7 8 a= 1 0 6 na = (a0 ∗ a)0 .5 na = 12.2474 e1 = [10000] e1 = [10000] e1 = na ∗ e1 e1 = [12.2474 0000] e1 = e01 12.2474 0 e1 = 0 0 0 v = a + e1 19.2474 8.0000 1.0000 v= 0 6.0000 eye(5, 5) 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 ans = 0 0 0 1 0 0 0 0 0 1 H1 = eye(5, 5) − 2 ∗ v ∗ v 0 /(v 0 ∗ v) −0.5715 −0.6532 −0.0816 0 −0.4899 −0.6532 0.7285 −0.0339 0 −0.2036 −0.0816 −0.0339 0.9958 0 −0.0225 H1 = 0 0 0 1.0000 0 −0.4899 −0.2036 −0.0255 0 0.8473 Q1 = H1 −0.5715 −0.6532 −0.0816 0 −0.4899 −0.6532 0.7285 −0.0339 0 −0.2036 −0.0816 −0.0339 0.9958 0 −0.0225 Q1 = 0 0 0 1.0000 0 −0.4899 −0.2036 −0.0255 0 0.8473 A1 = Q1 ∗ A −12.2474 −13.4722 −8.5732 −0.0000 −2.9247 −4.8885 −0.0000 5.8844 2.1389 A1 = 0 7.0000 3.0000 −0.0000 2.3065 −0.1664 a1 = A 1 (2 : 5, 2) −2.9247 5.8844 a1 = 7.0000 2.3065 0 0 v2 = a1 − (sqrt(a 1 ∗ a1 )) ∗ [1000] −12.7989 5.8844 v2 = 7.0000 2.3065 H2 = eye(4, 4) − 2 ∗ v2 ∗ v20 /(v20 ∗ v2 ) −0.2962 0.5959 0.7089 0.2336 0.5959 0.7260 −0.3259 −0.1074 H2 = 0.7089 −0.3259 0.6123 −0.1278 0.2336 −0.1074 −0.1278 0.9579 Q2 = zeros(5, 5) 0 0 Q2 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Q2 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Q2 (2 : 5, 2 : 5) = H2 1.0000 0 0 0 0 0 −0.2962 0.5959 0.7089 0.2336 0 0.5959 0.7260 −0.3259 −0.1074 Q2 = 0 0.7089 −0.3259 0.6123 −0.1278 0 0.2336 −0.1074 −0.1278 0.9579 A2 = Q2 ∗ A1 −12.2474 −13.4722 −8.5732 0.0000 9.8742 4.8105 A2 = −0.0000 −0.0000 −2.3203 −0.0000 −0.0000 −2.3046 0 −1.9142 −0.0000 −2.3203 a3 = −2.3046 −1.9142 0 0 v3 = a3 − (sqrt(a 3 ∗ a3 )) ∗ [1 0 0] −6.1096 v3 = −2.3046 −1.9142 H3 = eye(3, 3) − 2 ∗ v3 ∗ v30 /(v30 ∗ v3 ) −0.6123 −0.6082 −0.5052 H3 = −0.6082 0.7706 −0.1906 −0.5052 −0.1906 0.8417 Q3 = zeros(5, 5) 0 0 0 0 0 0 0 0 0 0 Q3 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Q3(1 : 2, 1 : 2) = eye(2, 2) 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Q3 = 0 0 0 0 0 0 0 0 0 0 Q3(3 : 5, 3 : 5) = H3 1.0000 0 0 0 0 0 1.0000 0 0 0 0 0 −0.6123 −0.6082 −0.5052 Q3 = 0 0 −0.6082 0.7706 −0.1906 0 0 −0.5052 −0.1906 0.8417 A3 = Q3 ∗ A2 −12.2474 −13.4722 −8.5732 0.0000 9.8742 4.8105 0.0000 0.0000 3.7893 A3 = 0.0000 −0.0000 −0.0000 −0.0000 0.0000 0 U = A3 (1 : 3, :) −12.2474 −13.4722 −8.5732 9.8742 4.8105 U = 0.0000 0.0000 0.0000 3.7893 Qh = Q3 ∗ Q2 ∗ Q1 −0.5715 −0.6532 −0.0816 0 −0.4899 0.0304 −0.2836 0.5975 0.7089 0.2431 Qh = 0.7795 −0.5901 −0.1516 −0.1083 −0.0974 0.0695 0.1682 −0.6686 0.6944 −0.1940 −0.2448 −0.3413 −0.4078 −0.0596 0.8086 b 47 26 b= 24 23 39 Qh −0.5715 −0.6532 −0.0816 0 −0.4899 0.0304 −0.2836 0.5975 0.7089 0.2431 Qh = 0.7795 −0.5901 −0.1516 −0.1083 −0.0974 0.0695 0.1682 −0.6686 0.6944 −0.1940 −0.2448 −0.3413 −0.4078 −0.0596 0.8086 z = Qh ∗ b −64.9115 34.1800 11.3680 z= 0.0000 0 −64.9115 c = 34.1800 11.3680 m = 3; x(3) = c(3)/U (3, 3) x = [0 0 3.0000] ......................................................... Geri yerine koyma Matlab kodu: m=3; x(m)=c(m)/U(m,m); for j=m-1:-1:1; tmp=0; for k=j+1:m; tmp=tmp+U(j,k)*x(k); end x(j)=(1/U(j,j))*(c(j)-tmp); end ......................................................... yukardaki kod kullanlabilir veya manual olarak tek tek ³u ³ekilde hesaplanabilir: >> x(2) = (1/U (2, 2)) ∗ (c(2) − U (2, 3) ∗ x(3)) x= 0 2.0000 3.0000 >> x(1) = (1/U (1, 1)) ∗ (c(1) − [U (1, 2) ∗ x(2) + U (1, 3) ∗ x(3)]) x= 1.0000 2.0000 3.0000 Bölüm 5 Bölüm5 5.1 Optimizasyon(En yileme) Tanm kümesi Ω : {x : x ≥ 0} x1 :kesin lokal minimum x2 : maksimum x3 : lokal minimum ∂f (x) ∂f (x) ∂f (x) |x=x1 = 0 , |x=x2 = 0 , |x=x3 = 0 ∂x ∂x ∂x ↓ ↓ ↓ ∂ 2 f (x) ∂ 2 f (x) ∂ 2 f (x) |x=x1 > 0 , |x=x2 < 0 , |x=x3 > 0 2 2 ∂x2 ∂x ∂x Tanm: f : Rn → R ε > 0 ve x ∈ R |x − x∗ | < ε için f (x) ≥ f (x∗ ) sa§layan x∗ ∈ R noktasna lokal minimum noktas denir. E§er f (x) > f (x∗ ) ∀x için x∗ noktasna kesin lokal minimum denir. 47 Tüm x ∈ R kümesi içinde f (x) ≥ f (x∗ ) sa§layan x ∈ R noktasna global minimum denir. Gradyan Operatörü: (∇x ) x1 x2 x = .. . xn ∂f (x) 1 ∂f∂x(x) ∂x2 ∇x f (x) = . .. ∂f (x) ∂xn f (x) : Rn → R n×1 Hessian Matrisi(H) ∂ 2f ∂x1 ∂x1 2 ∂ f H = ∇x f (x) = ∂x2.∂x1 .. ∂ 2f ∂xn ∂x1 ∂ 2f ··· ∂x1 ∂x2 ∂ 2f ··· ∂x2 ∂x2 .. .. . . ∂ 2f ··· ∂xn ∂x2 ∂ 2f ∂x1 ∂xn ∂ 2f ∂x2 ∂xn .. . 2 ∂ f ∂xn ∂xn n×n Minumum çin Gerekli Ko³ul: 1. E§er x∗ f fonksiyonun Ω tanm kümesinde lokal minimum noktas ise , [∇f (x∗ )]T d ≥ 0 d, x∗ noktasndaki uygulanabilir yön vektörü. 2. ∇f (x∗ ) = o 3. Verilen x∗ noktas için Hessian matrisi pozitif semidenite bir matris olmal T < ∇2 f (x∗ ) d, d >= d · ∇2 f (x∗ )d ≥ 0 | {z } H Örnek: x = [x1 x2 ]T f (x) = 3x21 + 2x1 x2 + 3x21 − 20x1 + 4x2 x1 ≥ 0 x2 ≥ 0 için minimum noktas? ∂f ∂f = 6x1 + 2x2 − 20 = 2x1 + 6x2 + 4 ∂x1 ∂x2 ∂f 6x1 + 2x2 − 20 0 ∂x1 ∇f (x) = ∂f = = 2x1 + 6x2 + 4 0 ∂x∗ 2 x 4 Çözüm: x∗ = 1∗ = x2 −2 f (x∗ ) = f (4, −2) = −44 x∗ ≥ 0 ko³ulunu sa§lamyor. x∗1 ≥ 0 x∗2 ≥ 0 → snrlandrmalar(constraint) gözönüne alrsak : ∗ 10 x1 minimum nokta → ∗ = 3 0 x2 10 fonksiyonun 10 lokal minimumu→10f ( 3 , 0) = −33, 33 + 2.0 − 20 6. 0 ∗ ∗ 3 3 için → ∇f (x ) = x = = 32 10 0 2. 3 + 6.0 + 4 3 o:global minimum x:snrlandrlm³(constraint)minimum d (f (g(x))) = f 0 (g(x))g 0 (x) dx Örnek: f (x, y) = x2 y g(x, y) = 3y 2 x h(x, y) = x − 2y F (x, y) = f (g(x, y), h(x, y)) = (3y 2 x)2 (x − 2y) ∂F ∂x ∂F ∂y =? =? v = g(x, y) ,w = h(x, y) −→ u = f (v, w) = v 2 w ∂F ∂x = ∂u ∂x = 2vw = 2g(x, y).h(x, y) = 2(3y 2 x)(x − 2y) = 6x2 y 2 − 12xy 3 ∂v ∂x = 3y 2 ∂u ∂w = v 2 = (3y 2 x)2 = 9x2 y 4 ∂w ∂x =1 ∂u ∂x ∂u ∂v = · ∂v ∂x + ∂u ∂w · ∂w ∂x = ∂F ∂x 5 = (6x2 y 2 − 12xy 3 )3y 2 + 9x2 y 4 = 18x2 y 4 − 36xy 5 + 9x2 y 4 = 27x2 y 4 − 36xy Genel olarak x1 , x2 , · · · , xn ba§msz de§i³kenler g1 (x1 , x2 , · · · , xn ), g2 (x1 , x2 , · · · , xn ), · · · , gm (x1 , x2 , · · · , xn ) F (x1 , x2 , · · · , xn ) = f (g1 , g2 , · · · , gn ) ∂F ∂xj = = ∂f ∂g1 Pm i=1 · ∂g1 ∂xj Di : i. argümann türevi Di f gi + ∂f ∂g2 · ∂g2 ∂xj + ··· + ∂f ∂gm · ∂gm ∂xj Örnek: f (x1 , x2 ) = 3x31 x32 − 2x21 x2 + 5 ∇ f :? H =? x1 = 1, x2 = 1 ∂f x 3 6x1 x2 − 4x1 x2 2 ∂x1 |x1 =1,x2 =1 = ∇x f = = ∂f 9x21 x22 − 2x1 7 ∂x2 Hessian ∂ ∂matrisi f ∂x∂ 1 ∂x∂ 2 f 2 14 6x32 − 4x2 18x1 x22 − 4x1 ∂x1 ∂x1 = = H= ∂ ∂ ∂ ∂ 2 2 18x1 x2 14 18 18x1 x2 − 4x1 f ∂x2 ∂x2 f ∂x2 ∂x1 x1 =1,x2 =1 Örnek: Ölçüm de§erleri : (x1 , y1 ), (x2 , y2 ), · · · , (xn , yn ) least− squares çözümü a ve b'yi verir? y = ax + b a =?, b =? model:y = ax + b ölçüm xi , yi 1.ölçüm:e1 = y − y1 = (ax1 + b) − y1 2.ölçüm:e2 = y − y2 = (ax2 + b) − y2 .. . n.ölçüm:en = y − yn = (axn + b) − yn Amaç: hatalarn karelerinin ortalamasn minimize eden a ve b de§erlerini bulmak . P J(a, b) = n1 ni=1 e2i −→ hatalarn karelerinin ortalamas(mean squared errorMSE) ∂J ∂a 0 → MSE'yi minimum yapan de§er Minimum Mean Squ5J = = 0 ∂J ∂b ared Error(MMSE) -Least Squares(LS) Ödev: y = ax + b −→ J(a, b) y = ax2 + bx + c −→ J(a, b, c) 5.2 Ko³ullu (Constraint) Optimizasyon Problem tanm:minf (x) Ko³ul h1 (x) = 0 h2 (x) = 0 e³itlik ko³ullar .. . h (x) = 0 m g1 (x) ≤ 0 g2 (x) ≤ 0 .. . gp (x) ≤ 0 h̄ = (h1 , h2 , · · · , hm ) ḡ = (g1 , g2 , · · · , gp ) x∈ Ω , Ω ∈ Rn Yukardaki problem tekrar yazlrsa minf (x̄) h̄(x̄) = 0̄ ḡ(x̄) ≤ 0 x̄ ∈ Rn e³itsizlik ko³ullar E³itlik ko³ulu: Teorem: (E³itlik snrlamas için gerekli ko³ul) x̄∗ noktas f fonksiyonunun h̄(x̄) = 0 ko³ulu altnda lokal ekstremum noktas için a³a§daki ko³ulu sa§lamas gerekir. ∇f (x̄∗ ) + ∇h̄(x̄∗ ).Λ = 0 Λ ∈ Rm says Pm lagrange∗ çarpan olarak adlandrlr. ∗ ∇f (x̄ ) + i=1 ∇hi (x̄ ).Λi = 0 Lagrange fonksiyonu: L(x̄, Λ̄) = f (x̄) + h̄(x̄)T .Λ̄ ∇x L(x̄, Λ̄) = 0 ∇Λ L(x̄, Λ̄) min veya max oldu§unu bulmak için 2.derece ko³ullar: P ∂ 2 h̄k (x̄) Fn×n (x̄, Λ̄) = m xk ← H matrisinin (i,j). eleman k=1 ∂xi ∂xj ∂ 2 f (x̄) ← F matrisinin (i,j). eleman Hn×n (x̄) = ∂xi ∂xj L(x̄∗ ) = H(x̄∗ ) + F (x̄∗ , Λ) L(x̄∗ ) pozitif semidenite bir matris ise bulunan x̄∗ noktas minimum noktasdr. Örnek: f (x1 , x2 ) = 3x21 + 4x22 + 6x1 x2 − 8x2 − 6x1 Snrlama:h1 (x1 , x2 ) = x1 + x2 − 9 = 0 verilen ko³ulda f'yi minimize eden de§eri(x∗1 =?, x∗2 =?) çözüm: x̄ = [x1 x2 ]T , Lagrange çarpan Λ1 L(x̄1 Λ1 )= f(x̄) + Λ1 h1 (x̄) ∇x L = ∂L ∂x1 ∂L ∂x2 L(x̄, Λ1 ) = (3x21 + 4x22 + 6x1 x2 − 8x2 − 6x1 ) + Λ1 (x1 + x2 − 9) ∂L ∂x1 ∂L ∂x2 ∂L ∂Λ1 = 6x1 + 6x2 − 6 + Λ1 (∗) = 8x2 + 6x1 − 8 + Λ1 (∗∗) 3 bilinmeyenli 3 denklem . = x1 + x2 − 9(∗ ∗ ∗) (∗∗) − (∗) → 2x2 − 2 = 0 ⇒ x∗2 = 1 (∗ ∗ ∗) → x∗1 = 8 (*)'de x∗1 ve x∗2 yerine yazlrsa → Λ1 = −48 ∗ x 8 ∗ x̄ = 1∗ = x2 1 Örnek: Bir önceki örnekte h1 (x̄) = x21 + x22 − 9 = 0 verilirse Örnek: üstteki örnekte h1 (x1 , x2 ) = x21 + x22 − 9 = 0 x∗1 =? x∗2 =? h1 (x1 , x2 ) = 2x1 − x2 − 4 = 0 L(x̄, Λ̄) = f (x̄) + Λ1 h1 (x̄) + Λ2 h2 (x̄) x∗1 , x∗2 =? 5.3 Ara Snav Çözümleri b)MATLAB 9 15 A(2 : 3, 1 : 2 : 4) = 20 30 c)B(1,:)*A(:,1) d)B(2,:)*A(:,3) α 2) x̄1 = −1 2 1 x̄2 = −1 1 a) < x̄1 , x̄2 >= x̄T1 .x̄2 = [α 1 − 1 2] −1 = α + 1 + 2 = 0 ⇒ 1 α = −3 b) x̄1 ⊥x̄2 oldu§undan ē1 ve ē2 'yi bulurken normlarna bölmemiz yeterli 12 −3 p √ T [−3 − 1 2] −1 = 14 kx̄1 k = x̄1 .x̄1 = 2 −3 x̄1 1 ē1 = kx̄1 k = √14 −1 2 12 1 p √ T [1 − 1 1] −1 = 3 kx̄2 k = x̄2 .x̄2 = 1 1 ē2 = kx̄x̄22 k = √13 −1 1 3 c) ȳ = −2 1 ȳ1 ȳ2 =? −3 √ 14 −1 < ȳ, ē1 >= [3 − 2 1] √ = √−5 14 14 2 √ 14 1 √ 3 −1 − 2 1] √ = 3 1 √ 3 < ȳ, ē2 >= [3 √6 3 √ =2 3 ȳ = −5 √ ē 14 1 √ + 2 3ē2 2 5 9 3) A = 1 4 7 3 2 1 a) without pivoting −→ L =? a31 a21 = 12 , = 32 a11 a11 1 0 0 2 5 9 −11 a32 −1 3 5 1 0 0 A1 = 2 A= ←− = 23 2 2 a22 −3 −11 −25 2 2 2 0 1 0 2 1 0 0 2 5 9 1 0 3 5 A2 = 0 1 0 A1 = 0 2 2 L = 12 1 3 −11 0 11 1 0 0 −10 3 3 2 3 b) pivoting −→ E2 =? | a31 |>| a11 |−→ S3 0 0 1 P13 = 0 1 0 1 0 0 3 2 A1 = P13 A = 1 4 2 5 = 0 0 X 1 ←→ S1 1 7 aa31 = 11 9 2 3 1 E2 = 0 −2 3 −11 3 0 0 1 0 X 0 1