Ārējā formula | Rezultātu pakāpeniska aprēķināšana (ar piemēru)

Iepriekšējā formula nodrošina grafisku rīku, lai aprēķinātu datus, kas atrodas ārpus norādītā sadalījuma kopas, kas var būt iekšējā vai ārējā puse atkarībā no mainīgajiem lielumiem.

Kāda ir izteiktākā formula?

Rezultāts ir norādītā parauga vai novērojuma datu punkts vai sadalījums, kas atrodas ārpus kopējā modeļa. Parasti lietots noteikums, kas saka, ka datu punkts tiks uzskatīts par novirzi, ja tam ir vairāk nekā 1,5 IQR zem pirmās kvartiles vai virs trešās kvartiles.

Citiem vārdiem sakot, zemiem izslēgtajiem rādītājiem jābūt zem Q1-1,5 IQR un augstiem izslēgtajiem parametriem jābūt Q3 + 1,5IQR

Jāaprēķina mediāna, kvartiles, ieskaitot IQR, Q1 un Q3.

Iepriekšējā formula ir attēlota šādi,

Formula Q1 = ¼ (n + 1) th termins Formula Q3 = ¾ (n + 1) th termins Formula Q2 = Q3 - Q1

Soli pa solim Outlier aprēķināšana

Lai aprēķinātu iznākumu, ir jāievēro zemāk norādītās darbības.

  • 1. solis: Vispirms aprēķiniet kvartiles, ti, Q1, Q2 un starpkvartiles
  • 2. solis: Tagad aprēķiniet vērtību Q2 * 1,5
  • 3. solis: Tagad no 2. solī aprēķinātās vērtības atņemiet Q1 vērtību
  • 4. solis: Šeit pievienojiet Q3 ar vērtību, kas aprēķināta 2. solī
  • 5. darbība: izveidojiet 3. un 4. solī aprēķināto vērtību diapazonu
  • 6. darbība: sakārtojiet datus augošā secībā
  • 7. darbība: pārbaudiet, vai ir vērtības, kas atrodas zem vai augstākas par 5. darbībā izveidoto diapazonu

Piemērs

Apsveriet šādu skaitļu datu kopu: 10, 2, 4, 7, 8, 5, 11, 3, 12. Jums jāaprēķina visi izslēgtie rādītāji.

Risinājums:

Pirmkārt, mums jāsakārto dati augošā secībā, lai atrastu vidējo vērtību, kas mums būs Q2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Tā kā novērojumu skaits ir nepāra, kas ir 9, mediāna gulētu uz 5. pozīciju, kas ir 7, un tas pats būs Q2 šim piemēram.

Tāpēc Q1 aprēķins ir šāds -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 būs - 

Q1 = 2,5 termiņš

Tas nozīmē, ka Q1 ir vidējais novērojumu 2. un 3. pozīcijā, kas šeit ir 3 un 4, un vidējais rādītājs ir (3 + 4) / 2 = 3,5

Tāpēc Q3 aprēķins ir šāds -

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 būs - 

Q3 = 7,5 termiņš

Tas nozīmē, ka Q3 ir vidējais novērojumu 7. un 8. pozīcijā, kas šeit ir 10 un 11, un vidējais rādītājs ir (10 + 11) / 2 = 10,5

Tagad zemiem izslēgtajiem rādītājiem jābūt zem Q1-1,5IQR, bet augstajiem - Q3 + 1,5IQR

Tātad vērtības ir 3,5 - (1,5 * 7) = -7 un augstāks diapazons ir 10,5 + (1,5 * 7) = 110,25.

Tā kā nav novērojumu, kas būtu virs vai zemāki par 110,25 un -7, šajā izlasē nav neviena novirzes.

Ārējās formulas piemērs programmā Excel (ar Excel veidni)

Šo Outlier Formula Excel veidni varat lejupielādēt šeit - Outlier Formula Excel veidne

Radošās koučinga nodarbības apsver iespēju apbalvot studentus, kuri iekļuvuši labāko 25% skaitā. Tomēr viņi vēlas izvairīties no jebkādiem izcēlumiem. Dati attiecas uz 25 studentiem. Izmantojiet Outlier vienādojumu, lai noteiktu, vai ir kāds outlier?

Risinājums:

Zemāk ir doti dati, lai aprēķinātu kopējo vērtību

Novērojumu skaits šeit ir 25, un mūsu pirmais solis būtu konvertēt virs neapstrādātiem datiem augošā secībā.

Mediāna būs -

Vidējā vērtība = ½ (n + 1)

= ½ = ½ (26)

= 13. termiņš

Q2 jeb mediāna ir 68,00

Kas ir 50% iedzīvotāju.

Q1 būs -

Q1 = ¼ (n + 1) trešais termins

= ¼ (25 + 1)

= ¼ (26)

= 6.5. Termiņš, kas ir līdzvērtīgs 7. termiņam

Q1 ir 56,00, kas ir 25% apakšā

Q3 būs -

Visbeidzot, Q3 = ¾ (n + 1) trešais termins

= ¾ (26)

= 19,50 termiņš

Šeit jāņem vidējais rādītājs, kas ir 19. un 20. termins, kas ir 77 un 77, un vidējais rādītājs ir (77 + 77) / 2 = 77.00

 Q3 ir 77, kas ir top 25%

Zems diapazons

Tagad zemiem izslēgtajiem rādītājiem jābūt zem Q1-1,5IQR, bet augstajiem - Q3 + 1,5IQR

Augsts diapazons -

Tātad vērtības ir 56 - (1,5 * 68) = -46 un augstāks diapazons ir 77 + (1,5 * 68) = 179.

Neizteiksmju nav.

Atbilstība un lietojumi

Ārkārtas formulu ir ļoti svarīgi zināt, jo varētu būt dati, kurus šāda vērtība varētu izkropļot. Veikt 2., 4., 6., 101. novērojuma piemēru, un tagad, ja kāds ņem šo vērtību vidējo lielumu, tas būs 28,25, bet 75% novērojumu ir zem 7, un tādējādi viens būtu nepareizs lēmums attiecībā uz šīs izlases novērojumiem.

Šeit var pamanīt, ka 101, šķiet, skaidri izklāsta, un, ja tas tiek noņemts, tad vidējais rādītājs būtu 4, kas par vērtībām vai novērojumiem saka, ka tie atrodas 4 diapazonā. Tāpēc ir ļoti svarīgi veikt šo aprēķinu, lai izvairītos no jebkāda ļaunprātīga datu vadošā informācija. Tos plaši izmanto statistikas speciālisti visā pasaulē, kad viņi veic jebkādus pētījumus.


$config[zx-auto] not found$config[zx-overlay] not found