Úvod do jádra Hustota Odhad

Kernel Density Odhad jestatistická metoda představuje řadu údajů . Související ke histogramy , Kernel Density Odhad nabízí způsob, jak odhadnout rozložení proměnné v populaci . Tato metoda je poměrně sofistikované , ale výsledkyvizuální interpretace pravděpodobné hustoty dané proměnné , jinými slovy , četnosti, s jakouproměnnou se objeví v populaci . Používá

jádra odhady hustoty odhadu tvar funkce hustoty . Funkcehustotou zobrazuje četnost, s jakouproměnnou se objeví v náhodném odběru vzorků populace . Kernel Density Odhad je považován zaneparametrické metody . Ve statistikách , jsou parametrické a neparametrické metody . Parametrické metody , aby více předpokladů než ty neparametrické . Nejsou potřeba žádné předpoklady o rozdělení , prostředky nebo standardní odchylky v neparametrické statistiky . Například , pokud jste chtěli vědět, zdadesátý testu ve třídě by měly vyšší skóre než v prvních devíti měsících roku , v parametrickém uvažování budete muset znát průměr a směrodatnou odchylku odvodit odpověď . V non – parametrické uvažování , prostě znát počet testu je dost znátposlední test má 10 procentní pravděpodobnost, že jsou nad předchozích skóre .
Kernel

Kernel Density Odhad má dvě klíčové komponenty:jádra ašířku pásma . Kernel jefunkce hustoty . K dispozici je šest obyčejné druhy funkcí hustoty v neparametrické statistiky : normální , uniformy , trojúhelníkové , Epanechnikov , quartic , triweight a kosinová . Každá z těchto funkcí se používá k odhadu četnosti náhodné veličiny v populaci .
Pásma

Druhá složka ,šířka pásma , vyhlazuje Výsledná data z funkce hustoty jádra . Šířku pásma , proto , má silně dopadyvizuální reprezentace dat . Zubaté čáry může být postupně vyhladit až dodata byla tak parafrázoval , že již není vhodné . V Kernel odhadu hustoty vzorce ,šířka pásma je reprezentován písmenem h . To musí být pozitivní a vést k distribuci , která shrnuje do jednoho .
Výhody

Kernel Density Odhad má své výhody na další neparametrické metodami odhadování , zejména histogramy . Histogramy představují rozložení proměnné ve košů podél vodorovné řady . Skládaný nádoby představují větší hustotu proměnné v oblasti dat . Vzhledem k tomu, histogramy symbolizovat dat prostřednictvím zásobníků ,proměnná je roztříštěné a různé distribuce jsou zubaté a diskrétní , zkreslování rozložení tekutiny proměnné , které opravdu existuje v populaci . Kernel Density Odhad lépe reprezentuje tento tekutost s hladkou linii , jehož hladkost je určena zvoleným v hustotě jádra vzorce pásma .

Napsat komentář