MOLEKÜLER GENETİK II GEN ve GENOM GEN ANLATIMI GEN ANLATIMININ DÜZENLENMESİ Bir bireyin tüm karakterlerine (fenotip) ait bilgi kalıtsal molekülündeki birimlerde (genler) şifreli biçimde yazılıdır. Gen anlatımı, genlerde bulunan genetik bilginin bireyin fenotipinde ortaya çıkması. GENOTİP FENOTİP Gen Anlatımı G E N ve G E N O M GENOM Bir organizmanın dizilerinin tümü kalıtsal molekülündeki nukleotid (ökaryotlarda haploid kromozomlardaki ve organellerdeki DNA dizisi) G E N Tanımı, Yapısı ve İşlevi Bir organizmanın genomunu oluşturan genlerin çoğu, organizmanın karakterlerinin ortaya çıkmasından sorumlu olan proteinlerin birincil yapılarını oluşturan, polipeptidlere ait bilgileri taşıyan yapısal ( strüktürel, protein ) genler. Bir gen (ya da yapısal geni). bir polipeptidin yapısını (amino asit dizisini) tayin eden nukleotid dizisi. RNA genleri, transfer RNA, ribozomal RNA ve diğer RNA (miRNA vb)’lara ait bilgileri taşıyan genler. Düzenleyici (regülatör) genler, yapısal genlerin ve RNA genlerinin anlatımını düzenleyen genler. Düzenleyici genlerin ürünleri olan düzenleyici proteinler bu genlerin çalışmasını kontrol ederek dolaylı biçimde fenotipe katkıda bulunurlar. En geniş kapsamda tüm çeşitleri içeren gen tanımı: Bir polipeptide ya da bir transfer RNA (tRNA), ribozomal RNA (rRNA) ve diğer RNA’lara ait bilgiyi taşıyan nukleotid dizisi. Bir hücrede bulunan genlerin toplamı hücrenin ( organizmanın) genotipi Genin Yapısı Genin yapısındaki temel diziler onun ürününü (polipeptid ya da tRNA veya rRNA) şifreleyen kısmı. Bir gendeki nükleotid dizisi, genel kural olarak, tek bir ürünü şifreler (!!??) Genin ürününe ait genetik bilgiyi taşıyan DNA ipliği = anlamlı, şifreleyici iplik tamamlayıcı iplik = karşı anlamlı (karşı şifreleyici) iplik Genin (genellikle) iki ucunda bulunan nükleotid dizileri = kontrol edici elementler ( kontrol dizileri ) başlangıç tarafında promotör (başlatıcı) son kısmında terminatör (sonlandırıcı) Prokaryotlarda promotör ve terminatör arasındaki şifreleme yapan diziler kesintisiz genin nukleotid dizisiyle ürünü olan RNA arasında ortak doğrusallık ilişkisi Ökaryotlarda (ve bazı ökaryotik viruslarda) bazı genlerde, ürünlerine ait şifreleme yapan dizilerin arasında, şifreleme yapmayan dizilerin varlığı parçalı gen ( mozayik gen ) Parçalı genlerde, şifreleme yapan diziler ekson şifreleme yapmayan diziler intron Parçalı gen yapısı İntronlar sayı, boyut ve yerleşim açısından son derece çeşitli. (birkaç örnek dışında) tüm yapısal genlerde var, tRNA genlerinde oldukça sık, rRNA genlerinde çok ender. Bazı genlerde (örneğin, histon genleri) intron yok, bazılarında çok sayıda (örneğin, α-kollajen geninde 52 intron). İntron sayısında genellikle boyutuyla paralel olarak artış. şifreleme yapan dizinin Boyları ~10-10.000 baz çifti arasında değişken. Aynı gene ait intron sayısı farklı türlerde genellikle aynı fakat boyutları farklı. Yerleşim yerleri genellikle gelişigüzel değil. GENOM YAPISININ ARAŞTIRILMASI Bir organizmanın genom yapısının (boyutu, içerdiği genlerin sayısı, yerleşim düzenleri ve yapıları, gen dışında kalan bölgelerin özellikleri) anlaşılması genlerin nasıl anlatım yaptıklarının, anlatımlarının nasıl düzenlendiğinin, ürünlerinin etkilerinin nasıl olduğunun tek tek genler boyutunda ya da genom boyutunda anlaşılmasında ilk adım Genetik Haritalardan Genom Dizilemesine Sitolojik haritalar (karyotip analizleri bantlama teknikleri) Genetik haritalar ( rekombinasyon, delesyon vb) Fiziksel haritalar ( restriksiyon haritaları vb) Nukleotid dizilemesi ( Genom projeleri) Genom Projeleri http:/www.genomesonline.org/ Aralık 2007 kayıtları Tamamlanmış Bakteriler Devam eden 540 278 Arkeler 46 4 Ökaryotlar 19 21 687 0 Viruslar 2044 0 Toplam 3336 303 Plazmidler G E N O M İ K Organizmaların tüm genomunun (genleri, düzenleyici dizileri ve şifreleme yapmayan dizileri kapsayan tüm nukleotid dizisinin) yapısal ve işlevsel olarak araştırılması. Yapısal genomik – genomun nukleotidlerinin dizilenmesi, genom haritaları oluşturulması, genlerin ve düzenleyici ve diğer dizilerin kromozomlardaki yerlerinin ve moleküler yapılarının belirlenmesi. İşlevsel genomik – genlerin işlevlerinin, anlatımlarının ve düzenlenmelerinin belirlenmesi; farklı genler ve gen dışı bölgeler arasındaki etkileşimlerin araştırılması. Genomdaki tüm genler tarafından şifrelenen proteinlerin belirlenmesi. Genomu oluşturan diziler (anlamlarına göre) I. GENLER ve GENLERLE İLİŞKİLİ DİZİLER Genler Yalancı Genler İntronlar Translasyonu yapılmayan bölgeler (UTR’ler) Düzenleyici Diziler II. GEN ARASI DİZİLER Tek diziler Tekrarlanan diziler Kümelenmiş (ardışık) tekrarlar Genomda serpiştirilmiş (yaygın) tekrarlar I. GENLER ve GENLE İLİŞKİLİ DİZİLER GENLER Proteinlerin (polipeptidlerin) amino belirleyen yapısal genler (protein genleri) asit dizilerini Ürünleri tRNA, rRNA ve diğer RNA’lar (örn. miRNA’lar) olan RNA genleri Bir genin hangi hücre tipinde ve organizmanın yaşamının hangi zamanında anlatım yapacağını belirleyen düzenleyici genler ve diziler. genellikle tek (tekrarlanmayan) diziler bazıları orta derecede tekrarlanan diziler Bakteri genomlarında genler ve düzenleyici bölgeler genelde düzenli bir yerleşime sahip Çok hücreli organizmaların çoğunun genomunda genlerin yerleşimi son derece düzensiz. * Şifreleme yapan DNA dizileri görünüşte (!) anlamsız DNA dizileriyle ayrılmış durumda. * Genomda gen bakımından zengin ve fakir bölgeler var. * Hücrede birlikte çalışan proteinleri şifreleyen genler çoğunlukla farklı kromozomlarda. * Komşu genlerin pek azı birlikte çalışan proteinleri şifreler. GENLERLE İLİŞKİLİ DİZİLER Genlerin temel kısımları veya işlevsel genlerden kökenlenen diziler Herhangi bir bilgiyi şifrelemezler Mutant genler ve gen parçaları Rastgele mutasyonlar veya rekombinasyondaki hatalar sonucu ortaya çıkarlar Yalancı Genler Genin işlevsel olmayan kopyası. İşlevsel genlere yapısal olarak benzer fakat onların alleli değiller ve işlevsel genin ürününü meydana getirmezler. Fare genomunda işlevsel ve yalancı genler Olağan yalancı gen. İkilenmeyle oluşmuş ve mutasyonların birikimiyle aktivitesi yok olmuş gen kopyası. Mutasyonlar şifreleme yapan veya yapmayan bölgede ya da her ikisinde birikebilir yalancı genler ya hiç anlatım yapmazlar ya da bazen transkripsiyon yaparlar, hatta anormal proteinler oluştururlar. Çoğunlukla ilişkili oldukları işlevsel genlerle bağlantı gösterirler. Fakat mutasyonların birikmesi nedeniyle daha önce hangi genden türevlendiğini belirlemek her zaman kolay değildir. İşlenmiş yalancı gen. Bir genin mRNA kopyasının yeniden genom içine DNA kopyası olarak sokulduğunda oluşan gen. ( Replikasyonları ters transkriptaz ile yapılan virusların bulaştığı hücrelerde bu enzimler tarafından hücresel RNA’ların kopyalanmasıyla oluşan çift iplikli cDNA’ların genomda gelişigüzel yerlere düşük frekansta girmesi). İşlenmiş yalancı genlerin ayırt edici özellikleri: İlişkili oldukları işlevsel genlerle genelde bağlantılı değildirler; genomda başka yerlerde dağılmış şekilde bulunurlar. Yapıları genin mRNA kopyasına benzer. Anlatımlarını yöneten dizilerini kaybettikleri için işlevsizdirler. İntronlar Genin şifreleme yapan dizilerin arasına girmiş diziler. RNA kopyasında başlangıçta bulunur ve translasyondan önce yok edilirler (bkz. RNA’nın işlenmesi). Düzenleyici diziler Genin içinde veya yakınında bulunan kısa diziler (promotör ve operatör gibi). Translasyonu yapılmayan bölgeler (UTR’ler) Transkripsiyonu yapılan (mRNA’da bulunan) fakat proteine çevrilmeyen bölgeler (örneğin, mRNA’nın 5’ ucundaki ribozoma bağlanma bölgesi) (bkz. Gen Anlatımı) Gen Aileleri Ökaryotların genomunda sıklıkla, tek kopyalı genlerin benzeri olan birkaç ya da çok sayıda gen bulunur tek kopyalı bir gen genelde dizileri çok benzerlik gösteren genlerden oluşan bir ailenin üyesidir. Bir gen ailesi, biraz farklı proteinleri (izozimler gibi) şifreleyen birkaç geni içerebilir. aile üyeleri farklı düzenleyici sinyallerle ilişkili olabilirler üyeler farklı dokularda ya da gelişimin farklı zamanlarında anlatım yapabilir. bazı aile üyeleri yalancı genler olabilir. Üst aile - bazen birbiriyle çok uzaktan ilişkili dizilerden oluşan genleri kapsayan aile. Üst ailedeki genlerin nukleotid dizi benzerliği %95-50 (hatta daha az) arasında değişebilir ve çok farklı polipeptitleri şifreleyebilirler. Bacillus subtilis genomundaki gen aileleri II. GEN ARASI DİZİLER Genler ve genlerle ilişkili dizilerin dışındaki DNA bölgeleri. Çoğunun işlevi bilinmemektedir. Tek diziler. Gen arası dizilerin yaklaşık dörtte birini kapsarlar. Tekrarlanan diziler Birbirinin tamamen aynı ya da değişik biçimlerde. Kopya sayıları iki - birkaç milyon. (Aynı yönlü tekrarlar, ardışık aynı yönlü tekrarlar, ters yönlü tekrarlar) Tekrarlanan dizi ailelerinde üyelerin dizileri tamamen aynı ya da bir veya birkaç baz çifti bakımından farklı olabilir. Üyelerinde dizi farklılığı gösterenler polimorfik aileler. Alt aile polimorfizm derecesinin düşük olduğu (aile üyelerinin dizi benzerliğinin çok olduğu) aileler. Üst aile dizi benzerliğinin az olduğu aileler. Orta derecede tekrarlanan diziler Genomda ~101-103 kopyası olan diziler. Bazıları işlevsel genler (örneğin, rRNA genleri) Çok sayıda (yüksek derecede) tekrarlanan diziler En fazla oranda bulunan gen arası diziler Genomda ~103-106 kopyası olabilen diziler Kümelenmiş (ardışık) tekrarlar (satellit DNA) Yaygın tekrarlar (genom boyunca serpiştirilmiş tekrarlar) Kümelenmiş (ardışık) tekrarlar Ökaryotik genomların ortak özelliği. Boyları <5 - >200 bç (ort. 5-50 bç) olan tekrarlanma sayıları 1 milyona kadar olabilen diziler. satellit DNA Baz içeriği total DNA’nınkinde daha hafif (AT’ce zengin) veya daha ağır (GC’ce zengin) olabilir. Bir genomda boyları değişken birimlerden oluşan farklı satellit DNA tipleri bulunabilir. Satellit DNA kromozomların sentromerlerinde, telomerlerinde ve başka yerlerindeki heterokromatin bölgelerde bulunur. Transkripsiyonu yapılmaz. Mikrosatellit DNA Ardışık tekrarlanan çok kısa (~10 bç) dizilerin oluşturduğu boyları 100-1000 bç olan bölgeler. İnsan genomunda A veya T tekrarları çok yaygındır (genomda ~10 Mb’lik yer kaplar). Dinukleotid tekrarları, örneğin, CACACA genomun ~ %3-5’ini, CT/AG tekrarları ~% 2’ini kapsar. Minisatellit DNA Ardışık tekrarlanan kısa DNA dizilerinden oluşan ara boyda (1-20 kb) bölgeler. Örneğin, ortak bir diziyi (GGGCAGGAXG) içeren ve boyları farklı polimorfik bir minisatellit DNA özellikle telomerlerde ve diğer kromozom bölgelerinde bulunur. Genomda serpiştirilmiş (yaygın) tekrarlar Mikrosatellitlerden daha uzundurlar. Boyları 100-1000 bç (bazıları >1 kb). Genomda yayılmış tek kopyalar halinde ya da birbirlerine çok yakın tekrarların oluşturduğu kümeler halinde bulunurlar. Çok sayıda sınıfları vardır. Hepsinin ortak özelliği transpozabl elementler (yer değiştirebilen diziler) şeklinde olmaları (bkz. Moleküler Genetik I). SINE’ler, (“Short Interspersed Nuclear Elements”) Genomda serpiştirilmiş, kısa (~500 bç kadar) tekrarlar. Transkripsiyonları yapılır, translasyonları yapılmaz. İnsan genomunda kopya sayıları çok fazla. Alu tekrar ailesi insan genomunda en çok sayıda kopyaya sahiptir (~750.000 kopya). Dizi birimi ardışık tekrarlanan GC dimeridir, tekrarın boyu ~120 bç’dir ve bunu AT’ce zengin bir dizi izler. Genelde aynı yönlü kısa (~6-18 bç) tekrarlarla kuşatılırlar. LINE’ler, (“Long Interspersed Nuclear Elements”) Boyları 6-7 kb kadar olabilen uzun yaygın tekrarlar. Transkripsiyon ve translasyonları yapılır. Ters transkriptaz benzeri ürünü olan genleri taşırlar. İnsan genomunun yaklaşık %16’ini kapsarlar. SINE’ler ve LINE’lerin genomdaki hareketleri RNA aracılığıyla (bkz. Moleküler Genetik I) DNA transpozonları, hareketlerinde (bkz.Moleküler Genetik I) RNA aracılığı yok. Retrotranspozonlar. Hareketleri RNA aracılığıyla, memelilerde yaygın değil. (bkz.Moleküler Genetik I) LTR elementleri. Uzun uç tekrarları. Tekrarlanan DNA dizileri çöp (hurda) ya da asalak DNA ! ! ! ! ! ! ! F A KA T binlerce kuşak boyunca devamlılıklarını korumaları gen arası dizilerin konak organizmaya bir pozitif değer (veya seçici avantaj) kazandırdığının işareti Genomu Oluşturan Diziler (yapısal özelliklerine göre) Tek (tekrarlanmayan) diziler, genomda tek kopya olarak bulunan diziler (protein genleri, genlerle ilişkili diziler, yalancı genler vb) Tekrarlanan diziler, genomda birden fazla kopyası bulunan diziler: Orta derecede tekrarlananlar. Genomda 10-1000 kopyası bulunan oldukça kısa diziler (RNA genleri, bazı protein genleri) Yüksek derecede (çok sayıda) tekrarlananlar. Genomda binlerce (hatta milyonlarca) kopyası olan çok kısa (<100 bç) veya daha uzun (>1000 bç) diziler; genelde aynı yönlü uzun tekrarlar. GENOM BOYUTU Genom boyutu organizmanın karmaşıklık derecesiyle doğru orantılı Genomdaki toplam DNA miktarı (C değeri) her türün kendine özgü niteliğidir. C değeri, organizmalarda <106 (Mycoplasma’da) ile >1011 (bazı bitkiler ve kurbağalarda) arasında büyük bir çeşitlilik gösterir. prokaryotik hücrelerde <10 Mb tek hücreli ökaryotlarda <50 Mb daha karmaşık yapılı protozoanlarda >200 Mb çok hücreli organizmalarda >100.000 Mb Genel kural, her organizma grubunun bir üyesi için gerekli en az C değeri organizmaların karmaşıklık derecesiyle paralel olarak artar. Ancak, ökaryotlarda bazı filumların (özellikle, böcekler, kurbağalar ve bitkiler) içinde C değerlerinde çok fazla çeşitlilik görülür (örneğin kurbağalarda <109 - ~1011) genom boyutu ile genetik karmaşıklık derecesi arasında her zaman paralellik yok !!! Karmaşıklık derecesi daha düşük olduğu halde daha karmaşık yapılı gruba göre C değeri fazla olabilir (örneğin, Xenopus ile insanın genom boyutu hemen hemen aynıdır). Karmaşıklık derecesi aynı olan bir çok organizmanın genom boyutları çok farklı olabilir (örneğin, pirinç bitkisinin genomu buğdayınkinden ~40 kat küçük) bu tip organizmalarda karmaşıklık derecesi genom boyutundan çok, gen sayısı ilişkilidir. Gen sayıları En az gen sayısı: asalak bakterilerde ~500 serbest yaşayan bakterilerde ~1500 tek hücreli ökaryotlarda ~5000 çok hücreli ökaryotlarda ~13000 gelişmiş bitkilerde ~25.000 memelilerde ~25- 30.000 (!!??) Bakteri ve arkelerde genomun büyük kısmında (%85-90) protein ve RNA genleri bulunur. Genom boyutu <1,5 Mb olan asalak bakterilerde gen sayıları azdır (Mycoplasma’da ~470 gen). Arkelerin genom boyutu 1,5-3 Mb, gen sayısı 1500-2700. Arkeler ve serbest yaşayan küçük bakteriler bağımsız yaşamalarına olanak verecek en az sayıda gene sahiptirler. Bilinen en küçük genomlu serbest yaşayan bakteri olan Aquifex aeolicus’ta genom boyutu 1,5 Mb, gen sayısı 1512. Bakterilerde genomun hemen tamamı tek dizilerden oluşur. Basit ökaryotlarda çoğu tek dizilerdir; orta derecede tekrarlı diziler <%20. Gelişmiş ökaryotlarda gen kapsamındaki tek diziler genelde genomun çok az kısmını (örneğin, insan genomunda genler <%1.5) kapsar. Geri kalan kısımda en fazla yeri işlevi bilinmeyen gen arası diziler kaplar. Tek dizilerin (genlerin) sayısı genom boyutuyla paralel olarak artar ( tüm genleri kapsayan tek dizilerin sayısının organizmanın karmaşıklık derecesinin artmasında başlıca etken olması). Genom boyutlarındaki daha fazla artışların sorumlusu tekrarlanan dizilerdir. Gen yoğunluğu Genom DNA’sının 1 Mb’lık boyutundaki ortalama gen sayısı. Örneğin, bir organizmanın genom boyutu 50 Mb, genlerinin sayısı 5.000 ise gen yoğunluğu 100 gen/Mb. En yüksek gen yoğunluğu, üst üste çakışan genlerin bulunduğu viruslardadır. Bakterilerde de genomun hemen tümünü genler kapsar; gen yoğunluğu ~900-1.000 gen/Mb’dır. Daha karmaşık yapılı organizmalarda gen yoğunluğu azalır. organizmanın karmaşıklığı ile gen yoğunluğu arasında ters ilişki (örneğin, insanda ~ 9.3 gen/Mb). Gelişmiş Ökaryotlarda nedenleri: gen yoğunluğundaki azalmanın (1) Gen boyutundaki artış. (a) Transkripsiyonu yöneten ve düzenleyen dizilerin (düzenleyici diziler) boyutlarındaki artış. (b) İntron bölgelerin varlığı (örneğin, bir insan geninin transkripsiyon yapan bölgesinin ortalama boyu ~27 kb, proteini şifreleyen kısmının boyu ise ~1,3 kb). Basit yapılı ökaryotlar, gen yoğunluğundaki yüksekliğe ek olarak az sayıda intron taşırlar (örneğin, S. cerevisiae’de genlerin sadece %3,5’unda intron bulunur ve intronların boyu 1 kb’den daha kısa). (2) Çok kopyalı genlerde artış. Bakterilerde genlerin büyük çoğunluğu tek kopyalıdır. Ökaryotlarda ise çok kopyalı genlerin sayısında ve kopya sayılarında artış vardır (örneğin, memelilerde rRNA genleri en az birkaç yüz kopyalı). (2) Gen arası dizilerdeki artış. Örneğin, insan genomunun %60’ından fazlası gen arası dizilerdir ve bu dizilerin çoğunun işlevi bilinmemektedir. (a)Tek diziler (işlevsiz mutant genler, gen parçaları ve yalancı genler). Gen arası dizilerin yaklaşık dörtte birini kaplar. (b)Tekrarlanan diziler. Bakterilerde kısa (20-40 bç) ters yönlü palindromik diziler gen arası bölgelerde ~500 tekrar yaparlar ve genomun en fazla %0.5’lik kısmını kaplarlar. Ökaryotlarda ise tekrar diziler genomda kapladıkları alan ve çeşitleri bakımından önem kazanmışlardır. İnsan genomunun yarısından çoğu çok sayıda tekrarlanan DNA dizilerinden oluşur. Örneğin, CACACACA tekrarları insan genomunun yaklaşık %3’ünü kapsar. İnsan genomunda çeşitli dizilerin oranları İnsan genomunda çeşitli dizilerin oranları