1. İqtisadi vəziyyətin proqnozlaşdırılması, iqtisadi siyasətin işlənməsi və monitorinqi üçün statistikadan istifadə etməklə iqtisadi modellərin hazırlanması və təkmilləşdirilməsi Giriş


Tədqiqat zamanı əmələ gəlmiş səhvlər



Yüklə 2.59 Mb.
səhifə3/23
tarix05.05.2017
ölçüsü2.59 Mb.
1   2   3   4   5   6   7   8   9   ...   23

Tədqiqat zamanı əmələ gəlmiş səhvlər

Tədqiqatın mərhələləri

Buraxılmış səhvlərin qruplaşdırılması

Qeydlər

Planlaşdırma

- Sorğu aparılmış vahidlər seçmə planından aşağıdır. (non respond mövcuddur)
- sorğu vərəqəsinin yoxlanılması üçün pilot tədqiqatı aparılmışdır

- seçmə dispersiyası gözlənilən qiymətə yaxındır, lakin seçmə planı tam yerinə yetirilməmişdir (cavab verməyənlər var)

- sorğu üzrə səhvlərin və seçmə planının yerinə yetirilməsinə çalışmaq lazımdır (cavab verməyənlərin sayını azaltmaq)



Sayıcıların (sorğuçu) hazırlanması

- yoxlama, müşahidə aparmaq, klasterləşdirmə və əks əlaqə yaratmaq qabiliyyəti

- təcrübəli sayıcılar (sorğuçu) cavab verməyən respondentlərin (non-respondların) sayını və kənarlaşmanı azaltmağa meylli olurlar. Eyni zamanda hər seçilmiş vahidin tədqiqatı üçün xərclər də azalmış olur.

Məlumatların toplanması

- sorğu anketinin suallarına müxtəlif yollarla (telefonla, e-mail və s.) cavablar toplanır. Imtina hallarını azatmaq üçün müxtəlif üsullardan istifadə edilir.

- seçmə ərazisindən seçmə vahidinin əvəz edilməsi yol verilməzdir. Çünki, həmin vahid seçmə planında nəzərdə tutulmuş vahidin statistik xarakteristikalarına müvafiq olmaya bilər

- seçmə planının yerinə yetirilməsi üçün (cavab verməyənlərin sayını azaltmaq üçün) və ya seçmənin sayını artırmaq üçün ehtiyat seçmə fondundan istifadə sorğu səhvlərini artırır

- seçmə planından kənar seçim (cavab verməyənlərin alt seçimi)



- çox sayda suallar seçmə vahidinin dəyərinin çox olmasına və eyni zamanda sorğunun vaxtının artmasına səbəb olur. Seçmə planından kənar sorğunun azaldılması seçmə variasiyasının və seçmə planından kənarlaşmanın azalmasını təmin edir.

- seçmə variasıyası azala bilər, lakin seçmə və seçmə planından kənarlaşma mövcud ola bilər.

- seçmə variasiyası və seçmə planı üzrə xəta azalsa da, non respond üzrə kənarlaşma azalmır.

- artıq xərclər tələb edir. Non respond kənarlaşması azalır.



İşlənməsi

- sorğuda cavab verilməyən sualların bərpası (cavab verməyənlər üzrə şərti hesablamanın aparılması)

- işlənmə xərcləri əhəmiyyətli şəkildə artır. Çünki buraxılmış səhvlərin bərpası kompleks əməliyyatlar tələb edir.

- müşahidə məlumatlarının təhlilində çətinliklər yaradır.

- bərpa edilmiş məlumatlar haqqında istehlakçılara xəbərdarlıq da çətinlik törədir.

S11: Kodlaşdırma səhvi. Kodlaşma zamanı standart kodlardan istifadə edilməlidir.

S12: Bərpa (imputasiya). İmputasiya və çəkilərin hesablanması mərhələsində seçmə planının yerinə yetirilməsi daha ümumi metodlarla hesablanır. Sorğuda iştirak etməyən vahidlərin (non respond), eyni zamanda sorğu zamanı buraxılmış sualların bərpasının respondent arasında səmərəli təşkili lazımdır. Sorğuya cavab verən və cavab verməyən respondentlərə dair məlumatlardan seçmə müayınənin nəticəsinin baş məcmuya şamil edilməsi üçün çəkilərin hesablanması zamanı istifadə edilir.

S13: İşarələmə səhvi. Statistik məlumatların toplanması zamanı sorğu anketlərində xüsusi ayrılmış yerlərin doğru işarələnməməsi səhvlərin əmələ gəlməsinə səbəb olur. Belə səhvlərin qiymətləndirilməsi üçün xüsusi (inzibati) mənbələrdən də istifadə edilir. Onlar müəyyən edilir və keyfiyyətə təsiri hesablanır.

S14: Dispersiyanın təhlili (qiymətləndirilməsi) zamanı yaranan səhvlər. Klassik statistika nəzəriyyəsinə əsasən sadə təsadüfi seçmənin xətası kompleks layihələrdə baza səhvi kimi qəbul edilir. Yəni seçmə müşahidəsinin səmərəliliyini müəyyənləşdirmək üçün baza səhvi ilə faktiki səhv müqayisə edilir. Baza səhvi sadə təsadüfü seçmə üzrə seçmə vahidinin variasiyasına görə hesablanır. Tədqiqat aparıldıqdan sonra seçmə vahidinin variasiyası sadə təsadüfi seçmə metodu ilə tapılmış seçmə əlamətinin variasiyasına nisbəti hesablanır. Alınmış qismət tədqiqatın dizayn effekt adlanan keyfiyyətini göstərir və aşağıdakı düsturla hesablanır:

Burada, Vp – baş məcmunun seçmə əlamətinin variasiyası

V– seçmə məcmusunun seçmə əlamətinin variasiyası

- baş məcmu üçün seçmə əlaməti üzrə yekun qiymət

- seçmə əlaməti üzrə orta qiymətə görə baş məcmunun yekun qiyməti.

Əgər layihənin səmərəliliyi vahiddən kiçikdirsə, onda dəqiqlik təmin edilir. Əks halda isə, tədqiqatın keyfiyyəti aşağı hesab edilir.



Səhvlərin təsnifləşdirilməsi

Mərhələlər

Profilaktika zamanı

Diaqnostika zamanı

Xətaların qiymətləndirilməsi və nəzarət

Seçmə səbəkəsi

X




E5, E6, E7

Stratifikasiya




X

E2

Ərasi üzrə yerləşdirmə

X




E4

Ehtimalın yeniləşməsi

X




E5

Respondent xətası

X

x

E8, E9, E10

Seçmə xətası




x

E1, E14

Yenidən sorğu

X

x

E8, E9, E10

Sorğu aparılmayıb

X

x

E8, E9, E10

Məlumatların işlənməsi zamanı səhvlər

X

x

E11, E12, E13


Müşahidənin səmərəliliyi (yararlılığı). Müşahidənin səmərəliliyi məlumatların mənbəyindən, seçmə planından, məlumatların toplanması üsulundan, keyfiyyətli monitorinqdən, məlumatların işlənməsindən, qiymətləndirilməsindən, seçmə vahidlərinin ərazi üzrə paylanmasından və s. asılıdır. Müşahidənin səmərəliliyinin (yararlılığının) müəyyən edilməsi zamanı keyfiyyət göstəricilərilərinə xüsusi diqqət yetirilməlidir.

2.3. Statistik müayinələrdə səhvlərin hesablanması metodu
Texnoloji prosesin əməliyyatlarına uyğun olaraq keyfiyyəti göstərən səhvlər iki qrupa (hazırlıq mərhələsində və sonra yaranan səhvlər) bölünür. Onlardan 1-ci qrupa nümunələrin (seçmə vahidlərinin) seçilməsi ilə əlaqəli səhvlər (belə səhvlər seçmə layihəsinin hazırlanması zamanı yaranır), 2-ci qrupa isə secmə prosesi - hazırlıq mərhələsi ilə əlaqəli olmayan səhvlər daxil edilir. 1-ci qrup səhvlər tədqiqatın aparılmasına hazırlıq mərhələsinin səhvləri, 2-ci qrup səhvlərə isə tədqiqatın aparılması zamanı yaranan səhvlər daxildir. Bütün bu səhvlərin qiymətləndirilməsi seçmə müşahidəsinin məlumatlarından istifadənin mümkünlüyünü müəyyənləşdirmək üçün zəruridir. Seçmə müşahidədə istifadə edilən nümünəvi vahidlərin düzgün təyin edilməsi, nümunələrin siyahısının düzgün tərtib edilməsi, stratifikasiya üçün geniş məlumatlardan istifadə, məlumatların keyfiyyətinə nəzarət, seçmənin qiyməti və s. mərhələ və amillərdən tədqiqatın xətasının təyin edilməsində istifadə edilir.

Sorğunun dəqiqliyi müxtəlif amillərdən asılıdır. Bura sorğunun sayıcı (sorğuçu) vasitəsi ilə və sayıcısız toplanması daxildir.

Tutaq ki, N baş məcmudan təsadüfi yolla n vahid nümunə seçilmiş, həmin nümunənin Y dəyişəninin (göstəricisinin) orta qiyməti µ, yi (i=1,....,n) isə Y müşahidəsinin i-ci göstəricilərinin qiymətidir. isə nümunələrin y dəyişəninin orta qiymətidir. variasiyası aşağıdakı kimi tapıla bilər:

Var() = Var(s) + Var (r) (1)

Burada, Var(s) - nümunələrin seçmə əlaməti üzrə variasiyası

Var (r) - sorğu xətası variasiyasıdır

Əgər nümunələrin seçmə əlamətinin orta qiyməti baş məcmunun seçmə əlaməti üzrə orta qiymətindən (µ) fərqlənirsə onda nümunələrin (seçilmiş vahidlərin) seçmə əlaməti üzrə orta qiymətinin orta kvadratik xətası (Mse) aşağıdakı kimi tapılır.

Mse () = Var() + Δ2 (2)

Burada, Δ =E() - baş məcmunun seçmə əlaməti üzrə orta qiymətinin (µ) nümunələrin (seçmə vahidlərinin seçmə əlaməti üzrə) seçmə əlaməti üzrə orta qiymətlərindən kənarlaşmasını göstərir. E(y) bütün mümkün nümunələr üçün göstəricidir.

Seçilmiş nümunələrin seçmə əlamətinin variasiyası aşağıdakı düsturla tapılır.

Var(s) = (1-f)/n * Sy2 Deff (s) (3)

Burada, f=n/N nümunə vahidlərinin baş məcmu vahidlərinə nisbətini ifadə

edir. Seçmə dərəcəsidir (sampling fraction)

S2y- baş məcmunun seçmə əlaməti üzrə dispersiyası



Deff(s) – seçmə müayinənin (layihəsinin) səmərəliliyidir.

Nümunələrin seçmə layihəsinin səmərəliliyi (deff) seçmə əlamətinin variasiyası və sadə təsadüfi seçmə üzrə variasiya nisbəti (1-dən çıxılır) ilə tapılır. Xüsusi seçmə layihələri üzrə deff(s) ifadəsinin qiyməti hazır verilə bilər.

Sorğu səhvi üzrə variasiya aşağıdakı ifadə ilə tapılır.

Var(r) = 1/n * σ2r deff(r) (4)

Burada, σ2r - sadə sorğu variasiyası, yəni doğru olmayan sorğu üzrə səhvlərin

variasiyası

deff(r) – seçmə layihəsinin səmərəliliyidir. Bu göstəricini müəyyən etmək üçün sorğu üzrə səhvin variasiyasının cari qiymətini sadə sorğu üzrə variasiyasının (sıfırdan fərqli) qiymətinə nisbətini 1-dən çıxmaq lazımdır. Deff(r) ifadəsinin qiymətinin məlumatların toplanmasının xüsusi halından da götürmək olar.

Nümunələrin (seçmə vahidlərinin) müəyyən edilməsi zamanı klasterləşdirmə üsulundan istifadə edilərsə, onda klaster seçmə səmərəliliyi aşağıdakı düsturla tapılır.

Deff(cl) = 1+ρint ( (5)

Burada, ρint –klasterlər daxili (intraclas) korrelyasiya əmsalı



= n/a klasterdə müşahidə olunan vahidlərin orta sayı

  1. seçilmiş nümunə klasterlərin sayıdır.

Klasterlər daxili korrelyasiya əmsalından klasterlərə daxil olan vahidlərin həmcinsliyini (homogenliyini) təyin etmək üçün istifadə edilir. Əgər əmsal böyükdürsə, onda variasiya da böyük olur. Əgər klasterlərdə daxili korrelyasiya əmsalı böyükdürsə onda seçmə layihəsinin səmərəliliyi (deff(cl)) –də böyük olar. Bu zaman hər klasterdə olan kiçik vahidlər qiymətləndirilməlidir.

Məlum olduğu kimi, baş məcmunun vahidləri (göstəriciləri) dinamik dəyişir. Ona görə də nümunələrin dəyişdirilməsinə ehtiyac yaranır. Buna seçmə təcrübəsində rotasiya deyilir. Nümunələrin rotasiya üsulu mütənasib olmalıdır. Rotasiya layihələrinin səmərəliliyi 1 və 2 arasında dəyişir və aşağıdakı düsturla ilə hesablanır.

Deff(rot) = (1-ρ)/(1-Qρ) (6)

Burada, ρ – 2 müşahidə vahidlərinin korrelyasiya əmsalıdır.

Q – nümunələrin təkrarlanma faizini ifadə edir.

Son zamanlar dünyada bir çox müşahidələr kosmik tədqiqatlar vasitəsi ilə aparıldığından (xüsusilə kənd təsərrüfatında) məlumatların toplanması və keyfiyyətin müəyyən edilməsi metodunun təkmilləşdirilməsi prosesi həyata keçirilir.

Müşahidələrin yerinə yetirilməsi sayıcılar (sorğuçu) vasitəsi ilə sorğu üsulunda aparılarsa sorğu vərəqələri nəzarətçi-təlimatçılar (supervayzerlər) tərəfindən yoxlanılır, kodlaşdırılır, kompüterə daxil edilir və s. Sayıcıların, respondentlərin və nəzarətçilərin səhvləri sorğu prosesinin səhvlərinə daxildir. Bu məlumatların toplanması prosesinin səhvləri adlanır və onun qiyməti (design effekt) aşağıdakı üsulla tapılır.

Deff(r) = 1+δ(m-1) + τ(n-m) (7)

Burada, 1- respondentin zəruri səhvi

δ – sayıcılar-daxili korrelyasiya əmsalı

τ - nəzarətçilər arası korrelyasiya əmsalı

m = n/k –qaytarılmış tapşırıqların (sayıcılara) orta qiyməti

k- səhvi düzəltmək üçün qaytarılmış sayıcılar.

Təcrübədə sübut olunub ki, siyahıyaalma ilə seçmə müşahidələrin variasiyalararası əlaqəsi mövcuddur. Bu əlaqə aşağıdakı bərabərsizliklə ifadə edilir.

Var(census) >= Var(sample) (8)

(1-f) (1- δ) + δM(P-f) <= Ry/r

Burada, f=n/N nümunələrin baş məcmuda faizi,

δ – sayıcılar üzrə sorğu vahidlərinə görə daxili korrelyasiya əmsalı

P=m/M (P<<1) – siyahıyaalma zamanı bir sayıcının sorğu apardığı

vahidlərin sayının seçmə zamanı bir sayıçının sorğu apardığı vahidlərin sayına nisbəti. Ry/r – y-üzrə baş məcmunun variasiyasının həmin dəyişən üzrə respondentin variasiyasına nisbəti.



Respondentin səhvlərinin variasiyasının qiymətləndirilməsi

Hər bir sayıcı üzrə respondentlərin sorğusunun yoxlanılması yerinə yetirilir. Tutaq ki, hər bir stratada h(h=1,...,H) aşağıdakı işarələnmə aparılmışdır.

Ah- h stratada inzibati ərazilərin sayı

A - ölkə üzrə inzibati ərazilərin sayı

Nhi – i (i=1,...,Ah) inzibati ərazilərdə vahidlərin (fermer) sayı

Nh = - h stratada elementar vahidlərin sayı

N = - ölkə üzrə elementar vahidlərin sayı

- h-cı stratanın çəkisi, yəni h-cı stratanın elementar vahidlərinin sayının ölkə üzrə elementar vahidlərin sayına nisbəti

ah - h-cı nümünə seçilmiş stratada inzibati vahidlərin sayı

a - ölkə üzrə nümunə seçilmiş inzibati vahidlərin sayı

nhi – i-ci nümunə seçilmiş inzibati vahiddə (i=1,...,ah) seçilmiş elementar vahidlər

nh = -h-cı stratada seçilmiş elementar vahidlərin sayı

n = - ölkə üzrə bütün seçilmiş nümunələrin sayı

Yhij - hij-cu elementar vahidin Y dəyişəninin qiyməti

Yhij1 – 1-ci müayinənin hij elementar vahidinin Y dəyişəninin qiyməti

Yhij2 – 2-ci müayinədə hij-cu müşahidə olunmuş elementar vahidlərin Y-ci

dəyişəninin qiyməti.



hi1 - hi-ci interyerin ikinci müşahidədə dəyişənin orta qiyməti

h1 - əsas müayinədə h-cı stratada dəyişənin orta qiyməti

h1 - PES-də (post enumeration survey) – h-cı stratada dəyişənin orta qiyməti

Əsas müşahidədə tədqiqatın səhvi aşağıdakı hissələrə bölünür.

yhij1 = Yhij + άhi + rhij (9)

burada, άhi – sayıcının (hi) xətası,

rhij - hij respondentin xətasıdır

Bu səhvlər müşahidə mərhələsinə (strata, interviyer, respondent) uyğun olaraq müəyyənləşir.

Bərabər ehtimallı seçmədə yekun variasiyası aşağıdakı düstur ilə hesablanır.

Var()= (10)

Əgər sayıcı yenidən sorğu apararsa onda dispersiyanı (respondent səmərəliliyini) aşağıdakı düstur ilə hesablamaq olar.

( (11)

Burada, i’ – ci sayıcının j-cu vahiddə ikinci dəfə sorğu aparmışdır.

İkinci dəfə sorğu apardıqda fərq (12) və respondent variasiyası isə aşağıdakı düsturla tapılır.

(13)

Əgər yenidən aparılan sorğunun əvəzinə respondent variasiyası verilərsə onda kənarlaşma fərqi aşağıdakı düsturla təyin edilə bilər.



(14)

Əgər yenidən aparılan sorğunun məlumatları məlumdursa, onda sayıcı variasiyası aşağıdakı Feliqi formulası ilə hesablanır.



(15)

Əgər yenidən sorğu aparılmayıbsa onda variasiyanı müəyyənləşdirmək üçün aşağıdakı düsturdan istifadə edilir (Kish, 1962)


(16)

Əgər hər strata daxilində 2 nəzarətçi varsa onda onların sorğu vərəqinə nəzarəti zamanı aşkar olmuş səhvlər aşağıdakı düsturla təyin edilir (Bassi, 1991)



(17)

Burada, H strataların sayı, 2H strata daxili nəzarətçilərin sayıdır

Əgər sayıcı (sorğuçu) tərəfindən yenidən sorğu aparılarsa onda nəzarətçilərin səhvi aşağıdakı düsturla tapılır.

(18)

Qeyd edilməlidir ki, bu formulaları tətbiq etmək üçün sayıcıların, nəzarətçilərin və strataların kodlaşdırılması təhlilin düzgün aparılmasına müsbət təsir edir.



Kənarlaşmanın qiymətləndirilməsi.

Kənarlaşmanı qiymətləndirmək üçün əlamətin statistik xarakteristikasından (orta qiymət, tezlik, yekun və başqa paramertlərdən) istifadə edilir. Kənarlaşmanın mütləq qiyməti 12 saylı düsturla tapılır. Nisbi qiyməti isə aşağıdakı düsturla hesablanır.



(19)

Yuxarıda göstərilən düsturdan göründüyü kimi, səhvləri müəyyənləşdirmək üçün variasiya əmsalı, müayinənin əhatə dairəsi, sorğuya cavab vermə dərəcəsi, sorğuya cavabdan imtina dərəcəsi, klasterlərarası korrelyasiya və sair göstəricilərin hesablanması lazımdır. Bu göstəricilər üç səviyyədə - sayıcı (sorğuçu), nəzarətçi və klaster (strata) səviyyəsində hesablanmalıdır. Nəticədə keyfiyyət hesabatı tərtib edilir. Finlandiyanın Nəqliyyat Nazirliyi tərəfindən aparılmış seçmə müşahidənin keyfiyyət hesabatı nümunə üçün əlavə edilir (Əlavə 1 və 2).


Əlavə 1

1 nömrəli keyfiyyət hesabatı



Göstəricilərin adları

İyun

Artan yekunla

Qeyd

Seçilmiş obyektlərin sayı

1500

18250

Aylıq/illik

Telefonla aparılmış sorğuların sayı, %

84.7

84.2

Əhatə dərəcəsi

Birbaşa respondentlərlə əlaqə, %

77.3

77.5

İlk əlaqə

Evdə hər hansı bir şəxslə əlaqə, %

78.2

77.9

Ikinci dəfə əlaqə

Mobil telefonla əlaqə, %

16.1

12.5

Üçüncü dəfə əlaqə

Sorğuya cavab vermə dərəcəsi, %

63.9

64.2

Cavab vermə dərəcəsi

Cavab verməkdən imtina dərəcəsi, %

0.9

1.3

Cavabdan imtina dərəcəsi

Ünsiyyət (dil) problemi, %

0.0

0.2

Cavabdan imtina dərəcəsi

İmtina və səbəbləri, %

12.5

11.9

Cavabdan imtina dərəcəsi

- vaxtı yoxdur, məşğuldur, %

1.8

2.0




- prinsipcə əməkdaşlıq edilməyib, %

5.5

3.6




- məlumatlardan doğru istifadə edilmir, %

0.0

0.2




- stifadə edilməyən müşahidə, %

0.2

0.1




- tədqiqatın nəticəsindən istifadənin qeyri- müəyyənliyi, %

0.0

0.0





- müşahidə maraqlı deyil, %

1.3

1.6




- digər səbəblər, %

3.7

4.6




Sayıcı işi sona çatdırmamışdır, %

0.1

0.1

Cavabdan imtina dərəcəsi

Əlaqə olmamışdır, %

22.7

22.5

Əlaqə olmama dərəcəsi

Sona çatdırılmış sorğuların sayı, %

76.3

71.7

Xətaların ölçüsü

Sayıcıların sayı

10

19

Aylıq/illik

Hər sayıcı tərəfindən aparılmış sorğuların sayı

96

616

Sorğuçuların sorğu yükü

Klasterlərarası korrelyasiya (gedişin sayı üzrə)

0.017

0.017

Sorğuçuların səmərəliliyi

Klasterlərarası korrelyasiya əmsalı (gündəlik gedilən yol üzrə)

0.0024

0.0016

Sorğuçuların səmərəliliyi

Variasiya əmsalı (gedişlərin sayı üzrə),%

2.8

0.8

Seçmə xətası

Variasiya əmsalı (gündəlik gedilən yol üzrə),%

9.9

2.7

Seçmə xətası




Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   23


Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©www.azkurs.org 2019
rəhbərliyinə müraciət

    Ana səhifə