matematický & Statistické metody pro genetické analýzy

Genetika jeobor zabývající se studiem genů , variace a dědičný u zvířat a rostlin biologie . Matematika a statistika hrají velkou roli v oboru genetiky , zejména subdiscipline populační genetiky . Populační genetika studuje frekvenci a distribuci různých alel v určité populaci organismů a jejich vztah k jiným populace organismů . Alely jsou součástí genetického kódu, které jsou spojeny s jednotlivými atributy . Průměry

nejzákladnější formou statistické analýzy je průměrná . Existují tři druhy průměru : průměr , medián , a režim . Střední se nachází nalezením součet souboru dat a vydělením tohoto součtu počtem datových bodů . Medián je nalezen všech datových bodů v pořadí podle velikosti a výběru střední datový bod . Režim je prostěhodnota údaje , který se objeví nejčastěji . Všechny tři druhy průměru jsou použity v populační genetice , alenejčastější jestřední .
Variance

odchylka jeměřítkem toho, jak moc jsou hodnoty v soubor údajů lišit . Rozptyl je symbolizován s ^ 2 , nebosigma čtvercový symbol . Odchylka se vypočte najít součet čtverce rozdílů mezi každou hodnotu a střední hodnotou , a pak dělením o jednu menší , než je počet datových bodů . Příkladem rozptylu může zahrnovat počet míst na konkrétní druh brouka . Předpokládejme, že existuje pět brouci v sadě , apočet skvrn na každé brouka je 5 , 5 , 6, 6 a 8je průměr : . Celým

( 5 + 5 + 6 + 6 + 8 ) /5 = 6 celým

rozptyl se vypočítá následujícím způsobem : celým

[ ( 5-6 ) ^ 2 + ( 5-6 ) ^ 2 + ( 6-6 ) ^ 2 + (6 – 6 ) ^ 2 + ( 8-6 ) ^ 2 ] /( 5 – 1 ) = 1,5

To nám dává informaci o šíření hodnot

standardní odchylka

směrodatná odchylka je dalším měřítkem šíření . To je druhá odmocnina z rozptylu . To má tu výhodu, že má stejné jednotky jako datový soubor je odvozen od . Ve výše uvedeném příkladu je standardní odchylka : celým

( 1.5 ) ^ ( 0,5 ) = 1,22474 celým

To znamená, žestandardní odchylka v počtu skvrn na populaci brouků je přibližně 1.22 skvrny .
Korelace

Korelace jemírou množství spojení mezi dvěma sadami dat . V populační genetiky , korelace by mohl být použit ke studiu vztahu mezi držiteli jednotlivých genů a výskytů jednotlivých charakteristik . Korelace je symbolizován r s indexem xy , kde x a y jsou proměnné se dvěma sadami dat . Korelace jsou vždy mezi -1 a 1 . -1 Znamená, ženegativní korelace , 0 znamená, že neexistuje žádný vztah , a 1 znamená, že jepozitivní korelace .
Regresní

regrese jestatistický nástroj používaný najít vztah mezi dvěma proměnnými . Regresní koeficient je uveden symbol b s indexem yx , kde y a x jsou proměnné se dvěma sadami dat . Regresní koeficient měří předpokládané změny v ay proměnné za jednotkovou změnu v proměnné x .
Genetické poruchy Nomenklatura

Hovoříme-li o genetickou poruchu , existuje několik technické termíny, které popsat strukturu onemocnění v obecné populaci . Tyto podmínky zahrnují incidence, prevalence , mortalita , a celoživotní riziko . Výskyt genetickou poruchou , je podíl lidí v populaci s určitou genetickou poruchou . Prevalence genetické poruchy , jepočet lidí, kteří v určité podskupiny , jako jsou určité věkové skupiny , kteří mají konkrétní genetickou poruchu . Úmrtnost se vztahuje k počtu lidí v určité skupině, která zemře z určitého onemocnění za rok . Příkladem statistiky o úmrtnosti by mohlo být “ 10 000 lidí ve Spojených státech zemřelo na syndrom X v roce 2010 . “ Celoživotní riziko jestřední riziko vzniku určitého genetického onemocnění v určitém okamžiku v životě jednotlivce .

Napsat komentář