A fehérjék hossza különféle élőlényekben eltérő átlagosan? Vannak ebből a szempontból komplexebb élőlények? A genom hosszával esetleg van valami korreláció?
Egy élőlényben is eltérő a fehérjék hossza... De ha pl. ortológ fehérjékről beszélünk, igen, egészen közeli csoportoknál is lehet eltérő.
"Komplexebb" élőlénynek nincsenek ilyen szmpontból. A fehérjén nem lehet húzni, ha ott 32 Å kell a két aminosav között az aktív centrumban, nem lehet se 30, se 35. Kisebb tényezőkön lehet ugyan rövidíteni, de az legjobb esetben is max. tíz aminosav különbséget jelent. Ha enél nagyobb a differencia, gyakran teljes domének, vagy egyéb kötőfelszínek hiányoznak, ami a celluláris környezettel magyarázható. (Minek kötődjön egy fehérje a vakuoláris aquaporinokhoz, ha állati sejtben van.) Ilyen szempontból a bacik (mondjuk úgy, hogy "prokarióták", noha az Archeák mindig másképp működnek, mint azt várnánk) a "legkomplexebbek", hiszen nagy mennyiségben és gyorsan kell szintetizálniuk a fehérjéiket, továbbá egy eukariótához képest kevésbé differenciáltak, nem kell annyi "speciális" igényt kielégítenei egy fehérjének.
Eukarióták között is változatos, hogy egy fehérje milyen. Az említett kompartmentalizáció miatt bizonyos fehérjék eltérő hosszúak lehtnek. Én vizsgáltam annak idején egy kedves kis fehérjét, ami majdnem minden élőlényben, ahol megtalálható volt, 777 aminosav hosszúságot mutatott. Kivétel a kacsacsőrű emlősben, ott 526 aa. hosszú volt. Hiányzott belőle három fő domén. (Olyanok is, amiről a nevét kapta a fehérje. Még mindig nem tudom, hogy ezek nélkül hogy képes ellátni a feladatát, de lehet, hogy csak hasonlít, és nem működőképes már. Kísérletesen ezt még nem vizsgálták.) Ilyenek vannak - de azért vedd igyelembe, hogy a többség konzervatívan 777 aa. maradt. Természetesen kevésbé konzervatív fehérjék esetén a hossz (és ezért a feladatkör) is erősebben változhat.
A genom hosszával való korreláció csak a legnagyobb átmenetnél, az eukarióta-prokarióta szembenállásnál mutatható ki. A baciknak kisebb a genomja, és kisebbek a fehérjéik. Az eukarióták között azonban iszonyú változatosság van. Az említett fehérjének természetesen meg kellett vizsgálni a génjét is: az Anopheles gambiae szúnyogban a gén kétszer olyan hossz volt, mint bármi más, mégis 777 aminosavat kódolt. Egyszerűen volt benne egy akkora intron, amivel nem tudtam mit kezdeni. De az ember genomja azért mind komplexitásában, mint méretében felülmúlja a szúnyogét, tehát nem azért volt nagyobb, mert amúgy a genom is az. A genom komplexitása sokkal erősebben függ az intronikus és a "junk" szekvenciák méretétől, mint az exonoktól. Azok mindössze 10%-ot tesznek ki, és akkor nagyon megengedőek voltunk. A maradék 90%-on lehet úgy húzni, hogy a szabályozó és térszerkezet-modifikáló régiókat nem érintve csökkentjük a genomméretet. Pl. az igen komplex rovargenomok, vagy a Takifugu rubripes genomja pont ezért kisebb, nem az exonikus szekvenciákon "spórol". Azaz nem a fehérjék hossza változik. Amennyiben ilyen váltázás is van, az elhanyagolható mértékű.
A fehérjék átlagos hossza nem függ az élőlénytől, és annak komplexitásától. Vannak ugyan nagyon hosszú fehérjéink, de mivel nagyon sok fehérjénk van ezért ezek a szélsőséges esetek kiátlagolódva kb ugyazt az értéket adják, mint a baktériumok esetén.
Az egyik legnagyobb fehérjénk a titin 34ezer aminosavból áll: [link]
Lehet, hogy írok egy programot, ami kiszámítja az átlagos hosszt.... Nem lenne több harminc sornál.
Na ja, a rendszerbiológiával az a gond, hogy minél többet tudunk, annál kevesebbet tudunk, mert mindig kiderül, hogy nem is úgy van, ahogy a modellbe illeszkedne. :) (Tisztelet a kivételnek. Azok rendes hálózatok, ahol egy újabb adat nem borít fel mindent. Szeretjük érte őket.)
A PPI ntework szerintem annyiban befolyásolhatja egy fehérje hosszát, hogy mekkora az adott pont kapcsolatainak száma. Sok kapcsolat - méghozzá közvetlen fehérje-fehérje interakció - mellett nehéz "kompaktabbá" tenni egy fehérjét, hiszen a sepcifikus felszíneket meg kell tartani (hacsaknem minden partnerrel ugyanazzal a felszínnel interaktál, de ez elég hülyén nézne ki). Hogy egy rendkívül komplex hálózatban mekkora esély van a fehérjelánc hosszának növelésére (interakciós felszínek térbeli elválasztása?), nem tudom.
Mindenesetre meg lehet vizsgálni, hogy az átlagos hossz mivel korrelál.
Meg lehet nezni... mindent meg lehet.... Az a baj, hogy NAGYON nehez eloellitani egy hiteles adatbazist, ami segitsegevel tesztelni lehetne a hipotezist. Amugy lehet az otletben valami eleg logikusan hangzik.
A fent linkelt hosszu feherjenek amugy nincs tul sok kotopartnere. Ellenben a kalmodulinnak (140 as), es a 14,3,3 (250 as) feherjenek sokkal tobb, mint 100... Szoval ki tudja.
"a titinnek "vonalzó" szerepe van, viszont ezt egy PPI-network adatból soha a büdös életben nem szeded ki."
Nem haragudj, de milyen feherjenek lehet kiszedni a szerepet az interakcios terkep ismereteben? Szerinem semelyiknek.... ha latsz egy feherjet, aminkel "sok" partnere van, abbol mit tudsz meg? Semmit. Egy csomo, teljesen kulonbozo funkcioju feherjenek van rengetek kotopartnere.
"És persze az ilyen "kiugró értékek" tolják el az átlagot (ilyen esetben ezért célszerűbb mediánt használni, bár nem tudom, lehet, hogy ferde lenne az eloszlás, akkor újfent nem)."
Nos igen, a median sok esetben informativabb az atlagnal. Ferde eloszlas? Log-normal eloszlasra gondolsz? De pontosan mindek az aloszlasa a kerdes? Kezemben vannak az ezkozok, barmit meg tudunk nezni... De nem vilagos, hogy mi a kerdes.
Persze, nem arra gondoltam, hogy az interakciós térkép segítségével felderíthető egy fehérje funkciója, hanem csak a korrelációról volt szó - ebből a szempontból a titin kiugró érték, mert viszonylag kevés interakciós partner mellett is hatalmas. Tehát feltehetően ki kéne zárni a kutatás során, mert eltolná az értékeket. Nopersze akkor lehet, hogy minden erősen kiugró értéket ki kéne zárni, és külön értékelni, különben a statisztika valami erősen fals adatot fog eredményezni.
Az eloszlás: a fehérjék hosszának eloszlása. Nem hiszem, hogy Gauss, vagy bármi hasonlóan szép, szimmetrikus görbét adna. Nem feltétlenül lognormál, azonban nekem nincsenek kezemben az adatok, így lehet, hogy ebben neked van igazad. És bár a szimmetrikus eloszlásoknál a medián és az átlag megegyezik, az átlag érzékeny a kiugró értékekre. Ellenben egy pl. lognormál eloszlásnál a mediánt kijelölni, mint "átlagos fehérje-hossz" szerintem nem célszerű.
Sok a probléma. Talán annak lehet bármiféle informatív értéke, hogy egy adott interakciós hálózatban megvizsgáljuk, a fehérjék hossza és az interakciós partnerek száma hogyan korrelál. Esetleg ortológ hálózatok vizsgálatával ezt ki lehet terjeszteni.
Kíváncsiságból megcsináltam a tesztet, és azt kaptam, amit kb gondoltam: a fehérjék hosszának eloszlása valóban lognormál eloszlást, mutat, és a különböző taxonómiai csoportok között viszonylag minimális az eltérés. A baktériumoknál a hossz mediánja 3oo, míg növényeknél 5oo. Az összes csoport e két szélső érték között oszlik el. Nekem ezek a különbségek nem meggyőzőek, nagy a hiba, nagyok a különbségek az adatszettek között... A hossz nem korrelál a komplexitással (már amit én koomplexitás alatt értek :-)...
Itt vannak a grafikonok (M - medián, zárójelben a feldolgozott szekvenciák száma): [link]
A teszhez minden esetben egy adott fajból származó, annotált fehérjéket használtam, 9o%-os similarity filter után. Akit érdekel, az itt találja a scriptet: [link]
Ami kitűnik a tesztből az az, hogy a legtöbb faj esetén messze nincs elég adat a filogenetikai összehasonlításhoz. A PPI adatbázisok pedig még a erősen kutatott élőlényekre is enyhén szólva foghíjasak...
"míg növényeknél 5oo."
Bocs, a muslicánál volt 5oo! :-)
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!