Štrukturálne charakteristiky variačného radu distribúcie. Výpočet mediánu skupiny čísel Ako určiť strednú hodnotu

Na nájdenie mediánu na stranách trojuholníka si nemusíte pamätať ďalší vzorec. Stačí poznať algoritmus riešenia.

Na začiatok zvážte problém vo všeobecnosti.

Daný trojuholník so stranami a, b, c. Zistite dĺžku mediánu na stranu b.

AB = a, AC = b, BC = c.

Na lúči BF nastavte segment FD, FD = BF.

Spojte bod D s bodmi A a C.

Štvoruholník ABCD je rovnobežník (podľa prvku), pretože jeho uhlopriečky v priesečníku sú polovičné.

Vlastnosť uhlopriečok rovnobežníka: súčet druhých mocnín uhlopriečok rovnobežníka je rovný súčtu druhých mocnín jeho strán.

Preto: AC² + BD² = 2 (AB² + BC²), takže b² + BD² = 2 (a² + c²),

BD² = 2 (a² + c²) -b². Podľa konštrukcie je BF polovica BD, preto

Toto je vzorec na nájdenie mediánu trojuholníka po jeho stranách. Obvykle sa to píše takto:

Prejdeme k úvahe o konkrétnom probléme.

Strany trojuholníka sú 13 cm, 14 cm a 15 cm. Nájdite stred trojuholníka, nakreslený k jeho strednej strane.

Použitím podobného odôvodnenia získame:

AC² + BD² = 2 (AB² + BC²).

14² + BD² = 2 (13² + 15²)

Kvantily sú veličiny, ktoré rozdeľujú súčet na určitý počet rovnakých častí, pokiaľ ide o počet prvkov. Najznámejšie sú medián, kvartily, decily, percentily.

1) Najslávnejší kvantil je medián, rozdelenie populácie na dve rovnaké časti. Okrem mediánu sa často používajú aj kvartily, ktoré rozdeľujú zoradenú sériu na 4 rovnaké časti, decily - 10 dielov a percentily - na 100 dielov.

Medián pre diskrétnu sériu.

Na určovanie mediány v diskrétnych sériách najprv stredné radové číslo podľa vzorca: a potom O obmedzte, akú hodnotu má prvok akumulovanú frekvenciu rovnajúcu sa číslu mediánu.

Ak séria obsahuje párny počet prvkov, potom bude stredné číslo iné ako celé číslo a medián sa bude rovnať priemeru dvoch hodnôt prvku umiestneného v strede . Číslo prvého z týchto znakov je celočíselná časť mediánu, pre druhé - stredné číslo, zaokrúhlené na celé číslo.

Medián pre intervalový rad

Pri výpočte mediánu pre sériu variácií intervalov najskôr určte medián intervalu, v ktorom sa medián nachádza.

Pre to:

1) medián je určený vzorcom :,

2) potom sa podľa akumulovanej frekvencie určí interval, ktorý zahŕňa prvok s takým číslom,

3) potom - hodnota mediánu podľa vzorca:

- - požadovaný medián

- - dolná hranica intervalu, ktorý obsahuje medián

- i- šírka intervalu (horná hranica intervalu - dolná hranica)

- - súčet frekvencií alebo počtu prvkov v skupine

Kumulatívna frekvencia intervalu predchádzajúceho mediánu

- - frekvencia mediánu intervalu

Príklad... Nájdite režim a medián pre intervalové série.

Riešenie:

1) Definujte módu

V tomto prípade je modálny interval vo vekovej skupine 25-30 rokov, pretože tento interval má najvyššiu frekvenciu (1054).

Vypočítajme veľkosť režimu:

To znamená, že modálny vek študentov je 27 rokov.

2) Určte medián.

Medián intervalu je vo vekovej skupine 25-30 rokov, pretože v tomto intervale existuje variant, ktorý rozdeľuje populáciu na dve rovnaké časti (Σf i / 2 = 3462/2 = 1731). Ďalej do vzorca dosadíme potrebné číselné údaje a získame strednú hodnotu:

To znamená, že jedna polovica študentov má menej ako 27,4 rokov a druhá viac ako 27,4 rokov.


2) Kvartily

Kvartily predstavujú hodnotu prvku rozdeľujúceho zaradenú populáciu na štyri časti rovnaké počtom prvkov.

Rozlišujte kvartil prvého rádu (dolný kvartil) , kvartil tretieho rádu (horný kvartil). Prvý (dolný) kvartil oddeľuje ¼ jednotiek s minimálnymi hodnotami z populácie a tretí (horný) kvartil oddeľuje ¼ jednotiek s maximálnymi hodnotami, druhý kvartil je medián. Druhý kvartil rozdeľuje populáciu na dve rovnaké časti a je mediánom.

Na výpočet kvartilov môžete rozdeliť rad variácií podľa mediánu na dve rovnaké časti a potom nájsť medián v každej z nich.

Napríklad, ak vzorka pozostáva zo 6 prvkov, potom sa druhý prvok berie ako počiatočný kvartil vzorky a piaty prvok ako dolný kvartil.

medián

Ak variačný rad pozostáva napríklad z 9 prvkov, potom sa ako horný kvartil berú aritmy. priemer 2. a 3. prvku a pre nižší aritmus. priemer 7. a 8. elementu.

medián

1 kvartil 3 kvartil

Výpočet kvartilov pre diskrétne série:

Výpočet kvartilov pre diskrétnu sériu:

1. V diskrétnej sérii najskôr určte kvartilové čísla (pozície):

Pozícia 1. kvartilu

Pozícia 3. kvartilu

2. Ak je kvartilové číslo- celé číslo, potom sa hodnota kvartilu bude rovnať hodnote prvku radu, ktorý má kumulovanú frekvenciu rovnú číslu kvartilu. Napríklad kvartilové číslo je 20, jeho hodnota sa bude rovnať hodnote znaku s S = 20 (kumulovaná frekvencia sa rovná 20).

Ak je kvartilové číslo je celé číslo, potom bude kvartil podmienené číslo medzi dvoma pozorovaniami. Kvartilová hodnota bude súčtom hodnoty prvku, pre ktorý je kumulovaná frekvencia rovná celočíselnej hodnote kvartilového čísla, a určenej časti (neceločíselná časť kvartilového čísla) rozdielu medzi hodnotou tento prvok a hodnotu ďalšieho prvku.

Ak je napríklad kvartilové číslo 20,25, kvartil spadá medzi 20. a 21. prípad a jeho hodnota sa bude rovnať hodnote 20. prípadu plus 1/4 (0,25) rozdielu medzi hodnotou 20. a 21. prípadu. 21. pozorovanie.

Výpočet kvartilov pre intervalový rad:

Ak chcete vypočítať kvartily pre intervalový rad:

1) Určte kvartilové číslo,

2) Určte kvartilný interval,

3) Kvartil vypočítame podľa vzorca:

Dolná hranica intervalu obsahujúceho prvý kvartil. Interval je určený akumulovanou frekvenciou intervalov
- dolná hranica intervalu obsahujúceho tretí kvartil. Interval je určený akumulovanou frekvenciou intervalov
- šírka intervalu
- kumulatívna frekvencia intervalu predchádzajúceho intervalu obsahujúcemu prvý kvartil
- kumulatívna frekvencia intervalu predchádzajúceho intervalu obsahujúcemu tretí kvartil
- frekvencia intervalu obsahujúceho prvý kvartil
je frekvencia intervalu obsahujúceho tretí kvartil

Na výpočet mediánu v programe MS EXCEL existuje špeciálna funkcia MEDIAN (). V tomto článku poskytneme definíciu mediánu a naučíme sa, ako ho vypočítať pre vzorku a pre daný distribučný zákon náhodnej premennej.

Začnime tým mediány pre vzorky(t.j. pre pevný súbor hodnôt).

Vzorový medián

Medián(medián) je číslo, ktoré je stredom množiny čísel: polovica čísel v množine je väčšia ako medián a polovica čísel je menšia ako medián .

Kalkulovať mediány musíte najskôr (hodnoty v ukážka). Napríklad, medián pre vzorku (2; 3; 3; 4 ; 5; 7; 10) bude 4. Keďže iba v ukážka 7 hodnôt, tri z nich sú menšie ako 4 (t.j. 2; 3; 3), a tri hodnoty sú vyššie (t.j. 5; 7; 10).

Ak sada obsahuje párny počet čísel, potom sa vypočíta pre dve čísla v strede sady. Napríklad, medián pre vzorku (2; 3; 3 ; 6 ; 7; 10) bude 4,5, pretože (3 + 6) / 2 = 4,5.

Na určovanie mediány v MS EXCEL existuje funkcia s rovnakým názvom MEDIAN (), anglická verzia MEDIAN ().

Medián sa nemusí zhodovať. Zhoda nastane iba vtedy, ak sú hodnoty vo vzorke rozdelené symetricky vzhľadom na stredný... Napríklad pre vzorkovanie (1; 2; 3 ; 4 ; 5; 6) medián a priemerný sa rovnajú 3,5.

Ak je známy Distribučná funkcia F (x) alebo funkcia hustoty pravdepodobnostip(NS) potom medián možno nájsť z rovnice:

Napríklad analytickým riešením tejto rovnice pre Lognormálne rozdelenie lnN (μ; σ 2) získame, že medián vypočítané podľa vzorca = EXP (μ). Pre μ = 0 je medián 1.

Dávajte pozor na pointu Distribučné funkcie, pre ktoré F(x) = 0,5(viď obrázok vyššie) . Rovnica tohto bodu je 1. Toto je stredná hodnota, ktorá sa prirodzene zhoduje s predtým vypočítanou hodnotou pomocou vzorca em.

V programe MS EXCEL medián pre lognormálne rozdelenie LnN (0; 1) je možné vypočítať podľa vzorca = LOGNORM.OBR (0,5,0,1) .

Poznámka: Pripomeňme, že integrál z v celom rozsahu priradenia náhodnej premennej je rovná jednej.

Preto stredná čiara (x = medián) rozdeľuje oblasť pod grafom funkcie hustoty pravdepodobnosti na dve rovnaké časti.

sa nazýva variant umiestnený v strede zaradeného radu.

Medián rozdeľuje riadok na dve rovnaké časti tak, že na oboch jeho stranách je umiestnený rovnaký počet jednotiek populácie. Zároveň v jednej polovici jednotiek populácie nie je hodnota meniaceho sa atribútu väčšia ako medián, v druhej nie menšia. ...

Pre diskrétnu sériu

Medián nájdeme podľa nasledujúceho algoritmu:

Zoradíme sériu,

Ak vzorka obsahuje nepárny počet prvkov, medián je (n + 1) / 2-tretí prvok,

Ak vzorka obsahuje párny počet prvkov, medián leží medzi dvoma priemernými prvkami vzorky a je rovný aritmetickému priemeru vypočítanému z týchto dvoch prvkov.

Príklad 1... Nájdite medián diskrétnej série

16,13,15,10,19,22,25,12,18,14,19,14,16,10.

Riešenie. Poradie radíme: 10,10,12,13,14,14,15,16,16,18,19,19,22,25,25, vzorka obsahuje párny počet prvkov n = 14, preto sa medián nachádza medzi dva priemerné prvky vzorky-medzi 7 prvkami a 8 prvkami:

10,10,12,13,14,14,15,16, 16,18,19,19,22,25

a rovná sa aritmetickému priemeru týchto prvkov:

Me = (15 + 16) / 2 = 15,5

Medián diskrétnej série môžete nájsť online pomocou tejto kalkulačky. Kalkulačka automaticky zoradí sériu a vypočíta medián.

Pri výpočte mediánu pre série intervalových variácií Najprv sa určí mediánový interval, v ktorom sa nachádza medián, a potom je stredná hodnota určená vzorcom:

Príklad 2. Nájdite medián intervalového radu:


Riešenie:

Medián intervalu je vo vekovej skupine 25-30 rokov, pretože v tomto intervale existuje variant, ktorý rozdeľuje populáciu na dve rovnaké časti

(Σf i / 2 = 3462/2 = 1731).


To znamená, že jedna polovica študentov má menej ako 27,4 rokov a druhá viac ako 27,4 rokov.

ZVLÁŠTNOSTI

  • Medián vlastní vysoká robustnosť, to znamená necitlivosť na nehomogenity a chyby vzorkovania.
  • Súčet rozdielov medzi členmi série vzoriek a mediánom je menší ako súčet týchto rozdielov s akoukoľvek inou hodnotou. Vrátane aritmetického priemeru.

Medián je hodnota funkcie, ktorá rozdeľuje hodnotenú distribučnú sériu na dve rovnaké časti - s hodnotami vlastností menšími ako medián a s hodnotami vlastností vyššími ako medián. Ak chcete nájsť medián, musíte nájsť hodnotu prvku, ktorý je v strede usporiadaného radu.

Pozrite sa na riešenie problému nájdenia režimu a mediánu Môžeš

V hodnotených radoch nezoskupené údaje pre nájdenie mediánu sa zredukujú na nájdenie poradového čísla mediánu. Medián možno vypočítať podľa nasledujúceho vzorca:

kde Xm je dolná hranica mediánu intervalu;
stredný interval;
Sme je súhrn pozorovaní, ktoré boli nahromadené pred začiatkom mediánu intervalu;
fme je počet pozorovaní v mediáne intervalu.

Stredné vlastnosti

  1. Medián nezávisí na tých hodnotách charakteristiky, ktoré sa nachádzajú na oboch jeho stranách.
  2. Analytické operácie s mediánom sú veľmi obmedzené, preto pri kombinácii dvoch distribúcií so známymi mediánmi nie je možné vopred predpovedať hodnotu mediánu novej distribúcie.
  3. Medián vlastní vlastnosť minimality. Jeho podstata spočíva v tom, že súčet absolútnych odchýlok hodnôt x od mediánu je minimálna hodnota v porovnaní s odchýlkou ​​X od akejkoľvek inej hodnoty.

Grafická definícia mediánu

Na určovanie grafické mediány použiť kumulované frekvencie, pre ktoré je konštruovaná kumulatívna krivka. Vrcholy súradníc zodpovedajúce akumulovaným frekvenciám sú spojené priamočiarymi segmentmi. Rozdelením pop olamu na poslednú súradnicu, ktorá zodpovedá celkovému súčtu frekvencií, a nakreslením kolmice na ňu na priesečníku s kumulatívnou krivkou nájdite súradnicu požadovanej strednej hodnoty.

Definícia módy v štatistikách

Móda - význam funkcie, ktorý má najvyššiu frekvenciu v sérii štatistických distribúcií.

Definovanie módy produkované rôznymi spôsobmi a závisí to od toho, či je variabilný znak prezentovaný vo forme diskrétnych alebo intervalových sérií.

Hľadanie módy a k mediánu dochádza jednoduchým skenovaním stĺpca frekvencie. V tomto stĺpci nájdite najväčšie číslo, ktoré charakterizuje najvyššiu frekvenciu. Zodpovedá to určitej hodnote atribútu, ktorým je móda. V sérii intervalových variácií je režim približne považovaný za centrálny variant intervalu s najvyššou frekvenciou. V takom rade distribúcie móda sa počíta podľa vzorca:

kde ХМо je dolná hranica modálneho intervalu;
imo - modálny interval;
fm0, fm0-1, fm0 + 1 - frekvencie v modálnych, predchádzajúcich a nasledujúcich modálnych intervaloch.

Modálne rozstupy sú určené najvyššou frekvenciou.

Móda je v štatistickej praxi široko používaná pri analýze dopytu po nákupe, registrácii cien atď.

Vzťah medzi aritmetickým priemerom, mediánom a módou

V prípade unimodálnych symetrických distribučných sérií sa medián a režim zhodujú. Nie sú rovnaké pre šikmé distribúcie.

K. Pearson na základe vyrovnávania rôznych typov kriviek určil, že pre mierne asymetrické distribúcie platia také približné vzťahy medzi aritmetickým priemerom, mediánom a režimom:



chyba: Obsah je chránený !!