Súlyozott adatok
Míg az R sub-val való együttműködés meglehetősen lehetséges, ez a funkció nincs annyira integrálva, mint a legtöbb statisztikai feldolgozó szoftverben. Különösen számos módja van a. Amikor azonban egy komplexumot is figyelembe kell venni (lásd alább a külön szakaszt), R biztosítja az összes szükséges eszközt, míg a legtöbb szabadalmaztatott szoftverben megfelelő kiterjesztésre van szükség, amelyet nem mindig árusítanak a szoftverrel együtt.
A következőkben a Histoire de vie felmérés adatsorát és különösen annak súlyozó változó súlyát 1 fogjuk használni .
Egyes funkciók opciói
Először a R elfogadja argumentumként egy olyan vektort, amely lehetővé teszi a megfigyelések súlyozását (az opciót általában súlyoknak vagy soroknak hívják.w). Ez vonatkozik például a 2. (lm) lineáris modellekre vagy az általánosított 3. lineáris modellekre (glm) vonatkozó becslési módszerekkel, vagy az ade4 vagy a FactoMineR kiterjesztések 4. megfeleltetési elemzésében. .
Ez az opció azonban nem szerepel az olyan alapvető függvényekben, mint a mean, var, table vagy chisq.test .
Súlyozott adatok a felmérés kiterjesztésével
A felmérés kiterjesztése kifejezetten a felmérések feldolgozására szolgál, potenciálisan nagyon összetett mintavételi és súlyozási technikákkal.
A kiterjesztés úgy települ, mint a legtöbb más:
A hivatalos webhely sok információval rendelkezik, de nem feltétlenül túl hozzáférhető:
http://r-survey.r-forge.r-project.org/.
A kiterjesztés funkcionalitásának használatához először meg kell határoznunk a felmérésünket, vagyis meg kell jelölnünk, hogy milyen súlyozást szeretnénk alkalmazni rá.
Először a legegyszerűbb mintavételi tervet fogjuk használni, a súlyváltozóval már kiszámítva. A mintavételi terv más típusait lásd a komplex mintavételi tervek fejezetben.
Ez az svydesign függvény segítségével történik:
Ez a függvény létrehoz egy új objektumot, amelyet dw-nek neveztünk el. Ez az objektum nem szigorúan véve egy adattábla, hanem egy adattábla plusz egy súlyozási módszer. dw és d különálló objektumok, az egyiken végzett műveletek nincsenek hatással a másikon. A dw tartalmát azonban lekérhetjük a dw-ről a dw $ változók segítségével:
A mintavételi tervünk deklarálásakor számos funkciót alkalmazhatunk rá különféle statisztikai műveletek elvégzésére, figyelembe véve a súlyozást. Különösen megemlítjük:
- svymean, svyvar, svytotal, svyquantile: (,)
- svytable: és
- svychisq:
- svyby: statisztika egy tényező szerint
- svyttest: tól
- svyciprop:
- svyglm: (ne)
- svyplot, svyhist, svyboxplot: grafikus függvények
Egyéb funkciók is elérhetők, például a svyratio, de itt nem tárgyaljuk őket.
A helyzetet tovább rontja, hogy ezek a függvények az 5. képletként veszik fel az érveket, ami nem a megszokott módon történik. Általában a függvényhívást úgy hajtják végre, hogy először megadják az érdeklődésre számot tartó változókat mint képletet, majd a survey.design objektumot.
Nézzünk meg néhány példát 6: