A statisztika alapjai Mi a különbség a diszkrét és a folytonos jellemzők között - és mikor vannak?
A statisztika alapjai: Mi a különbség a diszkrét és a folyamatos jellemzők között - és mikor lehet a jellemzőket felhalmozni?
A bevezető statisztikai előadás részeként általában azzal a fontos kérdéssel foglalkozunk, hogy mely tulajdonságokat lehetne felhasználni a statisztikai jellemzők vagy változók kategorizálására. Leggyakrabban az akkumulációs és a nem akkumulációs jellemzők, valamint a folyamatos és diszkrét jellemzők megkülönböztetéséről esik szó, amely ezért a mai blogcikk témája is.

Halmozott és nem halmozott jellemzők
A jellemző akkor tekinthető halmozódónak, ha ugyanazon statisztikai egység vonatkozásában többféle formát ölthet. Ez a helyzet például egy személyes felmérésben, olyan jellemzőkkel, mint a hobbi vagy a szakmai képzés, mivel teljesen hihető, hogy egy tesztelő nagyon különböző hobbikat folytathat, vagy akár több szakmai képzést is elvégezhetett. Tehát egy kérdésre egy vagy több érvényes válasz lehet. Más jellemzőket, például a születési évet vagy a (biológiai) nemet nem kumulatívnak kell tekinteni, mivel témánként csak egy helyes információ lehet.
A gyakorlatban a felhalmozás kérdése nagy jelentőséggel bír, ha a kérdőívvel összegyűjtött adatokat táblázatos struktúrává kell átalakítani. Ha a tábla készítésekor figyelmen kívül hagyjuk azt a tényt, hogy egy jellemző többféle formát ölthet, és ezt csak az n-edik adatrekord beírásakor észleljük, előfordulhat, hogy a táblázatot teljesen újra kell állítani, és az adatbevitellel - legalábbis részben - előről kezdeni. Az ideges dráma elkerülése érdekében ezért érdemes egy pillanatra szünetet tartani, mielőtt a számítógépre gyűjtött adatokat bevonná - más okokból is -, és elgondolkodni azon, hogy melyik tábla felépítése alkalmas a rendelkezésre álló adatokra.
Diszkrét és folyamatos jellemzők
Egyszerű igazságok egy bonyolult világ számára
A jellemző akkor tekinthető diszkrétnek, ha csak megszámlálható számú megnyilvánulást képes feltételezni. A gyakorlatban ez általában azt jelenti, hogy a lehetséges kifejezések száma véges. Ez vonatkozik például az iskolai évfolyamokra, a születési évre, a hajszínre, a nemre vagy az eseményen résztvevők számára - ezekben az esetekben a lehetséges értékek száma véges, és általában előre is teljesen korlátozható (pl. Iskolai évfolyamok 1-től 1-ig 6, a résztvevők száma 0 és legfeljebb 10 000 stb. Között. Sok tankönyvben a „megszámlálható sok kifejezés” mellett a „megszámlálhatatlan végtelen sok kifejezéssel” együtt megadják a diszkrét tulajdonságok második meghatározását, amely első ránézésre kissé zavarosnak tűnik - végül is azt gondolhatnánk, hogy egy halmaz vagy végtelen, vagy egy meg tudja számlálni őket.
Ez azonban azt jelenti, hogy az A halmaz az N természetes számok (szintén végtelen) halmazának végtelen részhalmaza, amelynek elemei megszámolhatók. A prímszámok halmaza például megszámlálhatatlanul végtelen halmaz, mert bár végtelen számú prímszám létezik, kisebb, mint a természetes számok halmaza (nem minden szám prímszám), és meg lehet számlálni annak elemeit: Az első prímszám 2, a második 3, a harmadik 5 - és így tovább, és így tovább ... A „megszámlálhatatlan végtelen” kifejezés formálisan helyes meghatározása („A halmazelméletben az A halmazt megszámlálhatatlannak nevezzük, ha ugyanolyan erejű, mint a Természetes számok halmaza. Ez azt jelenti, hogy az A és a természetes számok halmaza között van egy bijection. ”) A Wikipédiában is olvasható.
A diszkrét tulajdonságok párja a folyamatos jellemzők. Ezeket az a tény határozza meg, hogy végtelen számú formát ölthetnek. A gyakorlatban ezt az fejezi ki, hogy elméletileg mindig további új értékeket lehetne beilleszteni a folytonos jellemző két szorosan elosztott értéke közé, ha az alapjellemző csak megfelelő pontossággal mérhető. Erre példa a vízszint cm-ben történő megadása. A 10,5 cm és 10,6 cm közötti két információ közé tetszőleges számú kiegészítő információt tehet: 10,51 cm, 10,511 cm, 10,512 cm stb. A folyamatos jellemzők további gyakori példái a súlyok, az útvonal hosszai és az időintervallumok - im Alapvetően minden, ami fizikailag mérhető (növekvő pontossággal).
A folyamatos és diszkrét jellemzők megkülönböztetésének tipikus hibája, amelyet ezen a ponton még meg kell említeni, abban a feltételezésben rejlik, hogy a tizedesjegyek jelenléte automatikusan azt jelenti, hogy folyamatos jellemző van jelen. Például a Richter-skála, amelyet a földrengések erősségének mérésére használnak („A Richter-skálán 4,4-es erősségű földrengés ma megrázott ...”), tizedesjegyei ellenére, csak nagyon korlátozott számú lehetséges értékkel rendelkezik, ezért diszkrét fontolgat.
Kvázi folyamatos funkciók
Végül egy speciális esetet veszünk figyelembe a kvázi folytonos jellemzőkkel. Ezek olyan jellemzők, amelyek alapvetően diszkrétek (vagyis véges vagy megszámlálhatatlan számú megnyilvánulásuk van), de amelyeknek annyi lehetséges megnyilvánulása van, hogy a gyakorlati használat során folyamatos jellemzőkként kezelik őket (és így "kvázi állandóak") válnak - ezért a „kvázi folytonos” kifejezés). Ennek tipikus példája az árinformáció (például euróban és centben): Természetesen az árinformáció csak véges számú formát ölthet - de annyi (1,00 EUR; 1,01 EUR; 1,02 EUR. ...), hogy képes Érdemes úgy tenni, mintha végtelen számú megnyilvánulás létezne - és a valóban diszkrét változót folyamatos változóként kezelni.
Gyakorlat: skála szintek és változó típusok
Milyen skálaszint (lásd az előző blogbejegyzést) rendelkezik a következő jellemzőkkel - és folyamatosak vagy diszkrétek-e?
- egy medence vízmélysége
- A hajózási ügyfelek telefonszáma
- Fagylalt ízei
- Iskolai osztályzatok 1-től 6-ig terjedő skálán
- Két épület távolsága cm-ben
- Egy új autó ára euróban és centben
- A fodrász szalon vásárlóinak hajszíne
- Parázsló rönk hőmérséklete
- Termékértékelés 1-től 5-ig terjedő skálán
- Tanulmányi évfolyamok 1,0 és 5,0 közötti skálán
A megoldások megtekintéséhez kattintson ide.
Az itt bemutatott tartalom és feladatok a Harz Alkalmazott Tudományegyetem részmunkaidős üzleti igazgatási alapképzésében a „Statisztika alapjai” előadás részét képezik. A Science Tower előadásának teljes tartalmáról itt olvashat teljes áttekintést: A statisztika alapjai.