Co je R2 lineární regrese ?

Statistiky a vědci často požadavek na prozkoumání vztahu mezi dvěma proměnnými , obyčejně nazvaný x a y . Účelem testování nějaké dva takové proměnné je obvykle vidět, jestli tam je nějaká souvislost mezi nimi , známý jako korelace ve vědě. Napříkladvědec chtít vědět, jestli hodiny na slunci může být spojeno s výskytu rakoviny kůže. Matematicky popsat sílu korelace mezi dvěma proměnnými , takové vyšetřovatelé často používají R2 . Lineární regrese

Statistici použít techniku ​​lineární regrese najít přímku , která nejlépe odpovídá sérii x a y datových párů. Dělají to prostřednictvím řady výpočtů , které jsou odvozeny rovnice nejlepší linky . Tento matematický popis trati budelineární rovnice a mají obecný tvar y = mx + b , kde x a y jsou dvě proměnné v datové páry , m je sklon přímky a a b je její pořadnice průsečíku .
Korelační koeficient

výpočty , které najdete nejlepší přímku bude produkovat lineární rovnici , aby se vešly každý soubor dat , a to i v případě, že data nejsou ve skutečnosti velmi lineární. Chcete-li mít představu o tom, jak dobře jsou údaje skutečně vejde přímku , statistici také vypočítat číslo známé jako korelačního koeficientu . Tato skutečnost je dána symbol R nebo R a jeměřítkem toho, jak úzce spjaty datové páry jsou nejlepší přímce po nich .
Význam výzkumu

R může mít libovolnou hodnotu mezi -1 a 1.záporná hodnota R jednoduše znamená, ženejvhodnější přímka má sklon směrem dolů pohybující se zleva doprava , spíše než směrem nahoru . Blíže R je buďz obou extrémů ,lépehodí datových bodů na linii , a to buď s , nebo -1 1 jeperfektní aR hodnota nula znamená , že není vhodné a body jsou zcela náhodné . Pokud jsou datové body jsou dobře sladěny s přímkou ​​, je tam prý nějaký vztah mezi nimi , proto jméno korelační koeficient R.
R2

Některé statistici přednost práci s hodnotou R2 , který je potomkorelační koeficient na druhou , nebo násobí sama o sobě , a je známý jako koeficient určení . R2 je velmi podobný R a také popisuje vzájemný vztah mezi dvěma proměnnými , ale to je také poněkud liší . Měří procento variability v y proměnné , které lze připsat na kolísání v proměnné x . Hodnota R 2 0,9 , například znamená, že 90 procent je změna v y údajů je vzhledem k rozdílům v x dat . To nemusí nutně znamenat, že x je skutečně ovlivňuje y , ale zdá se, že dělá tak .

Napsat komentář