અપ્રાચલીય પદ્ધતિઓ

January, 2001

અપ્રાચલીય પદ્ધતિઓ (nonparametric methods) : માહિતીનાં અવલોકનો પ્રમાણ્ય, ઘાતાંકીય કે અન્ય પ્રાચલીય વિતરણ(parametric distribution)ને અનુસરતાં ન હોય તેવી પરિસ્થિતિ. એકત્ર કરેલી માહિતીનું પૃથક્કરણ કરવા માટે આ પદ્ધતિઓનો વિકાસ થયો છે.

પ્રાચલીય અનુમાનની પ્રશિષ્ટ પદ્ધતિઓના અભ્યાસમાં આપેલ સમષ્ટિના સંભાવના-વિતરણ(probability distribution)નું ગાણિતિક સ્વરૂપ કેટલીક વિશિષ્ટ ધારણાઓ હેઠળ નિર્દિષ્ટ કરવામાં આવે છે. આ સ્વરૂપમાં આવતા અજ્ઞાત પ્રાચલોનું આગણન કે પ્રાચલો વિશેની નિરાકરણીય પરિકલ્પનાનું પરીક્ષણ, સમષ્ટિમાંથી લેવામાં આવેલાં નિદર્શ (sample) અવલોકનોને આધારે વિવિધ પ્રાચલીય અનુમાનપદ્ધતિઓ દ્વારા આગણકો કે આગણનકારો(estimates or estimators)ની મદદથી કરવામાં આવે છે. પ્રયોગકારને આપેલી નિદર્શમાહિતી વિશિષ્ટ સંભાવનાવિતરણ ધરાવતી સમષ્ટિમાંથી લેવામાં આવી છે એવી પ્રતીતિ હોય તેવા સંજોગોમાં પ્રાચલીય અનુમાન પદ્ધતિઓનો ઉપયોગ યથાર્થ છે. અને આ પદ્ધતિઓ દ્વારા કરેલાં અનુમાનો સંભાવનાત્મક દૃષ્ટિએ ચોક્કસ અને વિશ્વસનીય હોય છે. પરંતુ વ્યવહારમાં પ્રયોગકારને નિદર્શમાહિતી જે સમષ્ટિમાંથી આવે છે તે સમષ્ટિના સંભાવનાવિતરણનું ગાણિતિક સ્વરૂપ કેવું છે કે કેવું હોઈ શકે તેની ચોક્કસ જાણકારી હોતી નથી. આ પરિસ્થિતિમાં સમષ્ટિનાં લક્ષણો કે ગુણધર્મો વિશે નિર્ણયપદ્ધતિ નક્કી કરવાનું અઘરું બને છે. જ્યારે પ્રયોગકાર પાસે સમષ્ટિ વિશેની જાણકારી સીમિત હોય અથવા પ્રયોગકારનું કૌશલ્ય સમષ્ટિના સંભાવના-વિતરણના જટિલ ગાણિતિક સ્વરૂપને સમજવા જેટલું ઉચ્ચ કક્ષાનું ન હોય, અથવા પ્રાપ્ત માહિતીના નિદર્શનું કદ ઘણું નાનું હોય, તેવી પરિસ્થિતિમાં પણ તેને માહિતીનું પૃથક્કરણ કરી અનુમાન તારવવું હોય તો વિતરણમુક્ત (distribution-free) અથવા અપ્રાચલીય પદ્ધતિઓનો ઉપયોગ ઉપકારક બને છે. આ પદ્ધતિઓના વિનિયોગમાં સમષ્ટિનું સંભાવના-વિતરણ સતત છે એવી ધારણા અભિપ્રેત છે; તેનું ગાણિતિક સ્વરૂપ કેવું છે તે વિશેની જાણકારી હોવી આવશ્યક નથી. આ પદ્ધતિઓના પ્રયોગમાં માહિતીના આધારે રચેલા આગણનકારોનું વિતરણ સમષ્ટિના વિતરણના ગાણિતિક સ્વરૂપથી મુક્ત હોય છે. આ પદ્ધતિઓ સમજવામાં સરળ, ગણતરીની દૃષ્ટિએ ઝડપી અને આંકડાશાસ્ત્રીય દૃષ્ટિએ સંગીન હોય છે.

1.1. પ્રવેશ : આંકડાશાસ્ત્રના વિકાસના પ્રારંભિક તબક્કામાં આંકડાશાસ્ત્રીય અનુમાન(statistical inference)ના પ્રશ્નોમાં ઉપયોગમાં લેવાતી પદ્ધતિઓ અને અવલોકનો પ્રમાણ્ય વિતરણ(normal distribution)ને અનુસરે છે, તેવી સ્પષ્ટ અને અસ્પષ્ટ ધારણા પર આધારિત હતાં. પ્રમાણ્ય વિતરણના અજ્ઞાત પ્રાચલોનું બિંદુ આગણન (point estimation of parameters) કે અંતરાલ આગણન(interval estimation)ની પદ્ધતિ દ્વારા આગણન કરવું અથવા આ વિતરણના પ્રાચલો વિશેની પરિકલ્પનાઓનું એકનિદર્શ (one sample), દ્વિનિદર્શ અથવા બહુનિદર્શના આધારે પરીક્ષણ કરવું વગેરે બાબતો આંકડાશાસ્ત્રના વિકાસના પ્રારંભિક તબક્કાના મુખ્ય પ્રશ્નો હતા. સમયાંતરે એમ માલૂમ પડ્યું કે અમુક પ્રકારની માહિતી જે સમષ્ટિઓ(populations)માંથી મેળવવામાં આવે છે તે સમષ્ટિઓનાં વિતરણો પ્રમાણ્ય હોતાં નથી. દાખલા તરીકે, સમયને આધારે એકત્ર થતી, જીવનવિષયક માહિતી (life data) ઘાતાંકીય વિતરણ (exponential distribution) અથવા આ વિતરણ સાથે સંબંધ ધરાવતા વિતરણમાંથી પ્રાપ્ત થાય છે. ઘણી વાર એવું પણ બને કે માહિતીનાં અવલોકનોના વિતરણ વિશે કે તેના ગાણિતિક સ્વરૂપ વિશે કોઈ સ્પષ્ટ જાણકારી હોતી નથી. અર્થાત્ માહિતીનાં અવલોકનો પ્રમાણ્ય, ઘાતાંકીય કે અન્ય પ્રચલીય વિતરણને અનુસરે છે, એમ કહેવું યથાર્થ ન ગણાય. એવા સંજોગોમાં એકત્રિત માહિતીનું પૃથક્કરણ કરવા માટે જે પદ્ધતિઓનો વિકાસ થયો તે પદ્ધતિઓને અપ્રાચલીય પદ્ધતિઓ તરીકે ઓળખવામાં આવે છે. અપ્રાચલીય પદ્ધતિઓ દ્વારા કરવામાં આવતા આંકડાશાસ્ત્રીય અનુમાનને અપ્રાચલીય અનુમાન કહે છે.

અપ્રાચલીય પદ્ધતિઓમાં યદૃચ્છ ચલના અજ્ઞાત વિતરણ વિશે લઘુતમ ધારણાઓ લેવામાં આવે છે. આ ધારણાઓ હેઠળ સૂચિત પદ્ધતિના સંભાવનાત્મક ગુણધર્મો મેળવવામાં આવે છે. આ ગુણધર્મોના અભ્યાસ સાથે સુસંગત હોય તેવી એક અગત્યની ધારણા એ છે કે અજ્ઞાત વિતરણ સતત હોય; તદનુસાર અપ્રાચલીય અનુમાનના સિદ્ધાંતમાં કોઈ વૈકલ્પિક સ્પષ્ટતા કરવામાં ન આવી હોય તો અવલોકનો જે અજ્ઞાત વિતરણ(કે સમષ્ટિ)માંથી લેવામાં આવ્યાં હોય તે વિતરણ સતત છે એમ માનવામાં આવે છે. આ ધારણા હેઠળ X1, X2,… Xn સતત વિતરણમાંથી લેવામાં આવેલ અવલોકનો હોય અને જો Ri અવલોકનો X1 …, Xn પૈકી Xiનો ક્રમાંક (rank) દર્શાવે તો P (R1 = r1, R2 = r2, …, Rn = rn) = 1/n થશે. અહીં (r1, r2, …, rn) પ્રાકૃતિક સંખ્યાઓ(1, 2, …, n)નો ક્રમચય દર્શાવે છે. જો Ri = Xiનો ક્રમાંક = j હોય તો Riની વ્યાખ્યા અનુસાર n પૈકી j અવલોકનોની કિંમત Xi જેટલી કે Xiથી નાની અને બાકીનાં n–j અવલોકનોની કિંમત Xiથી વધુ થશે. આ સરળ છતાં મૂળભૂત પરિણામ આપણને અપ્રાચલીય પરીક્ષણો માટે ઘણા પ્રકારનાં અવલોકનવિધેયો રચવામાં સહાયક બને છે. અવલોકનો જે વિતરણમાંથી લેવામાં આવ્યાં હોય તે વિતરણના સ્વરૂપની જાણકારી ન હોય તોપણ ક્રમ-આધારિત આગણકો Ri (i = 1, 2, …, n)નું ચોક્કસ કે અનંતલક્ષી વિતરણ મેળવી શકાય.

અપ્રાચલીય અનુમાન હેઠળ ઉદભવતા પ્રશ્નોનું સામાન્ય રીતે ચાર વિભાગોમાં વર્ગીકરણ કરી શકાય : (1) એકનિદર્શ (one sample) પ્રશ્નો, (2) દ્વિનિદર્શ (two sample) પ્રશ્નો, (3) બહુનિદર્શ (several or multisample) પ્રશ્નો, (4) દ્વિચલ નિદર્શમાં નિરપેક્ષતાના પ્રશ્નો.

1.2. એકનિદર્શ પ્રશ્નો : એકનિદર્શ પ્રશ્નો હેઠળ અપ્રાચલીય આગણન અને પરીક્ષણ માટે નીચેના પ્રશ્નો આવરી લઈ શકાય : (i) સંભાવના (probability) વિતરણના અજ્ઞાત મધ્યસ્થ (median) અથવા વિયોજક(quantile)નું આગણન કરવું. (ii) મધ્યસ્થ કે વિયોજક કોઈક નિર્દિષ્ટ કિંમતની બરાબર છે કે કેમ કે પરિકલ્પનાનું પરીક્ષણ કરવું. (iii) કોઈ જ્ઞાત સ્થાન બિંદુના સાપેક્ષ સમષ્ટિ વિતરણ સંમિત છે કે કેમ તે પરિકલ્પનાનું પરીક્ષણ કરવું. (iv) આપેલી માહિતી જેના પ્રાચલો જ્ઞાત કે અજ્ઞાત હોય તેવા પ્રાચલીય વિતરણસમુદાયમાંથી લેવામાં આવી છે તે પરિકલ્પનાનું પરીક્ષણ કરવું. આ પરીક્ષણને અન્વાયોજનની યોગ્યતા(goodness of fit)નું પરીક્ષણ કહે છે.

(i) ધારો કે સંભાવના-વિતરણની p-કક્ષાનો વિયોજક p છે. જો p = લઈએ તો વિતરણનું મધ્યસ્થ થશે. આપણે pનું 0 < p < 1 માટે આગણન કરવું છે. હવે ના આગણન માટે આપણે તેનો વિશ્વસનીય અંતરાલ (confidence interval) મેળવીશું.

ધારો કે X1, X2, …, Xn સતત વિતરણ વિધેય F ધરાવતી અજ્ઞાત સમષ્ટિમાંથી લેવામાં આવેલ યદૃચ્છ નિદર્શનાં અવલોકનો છે. ધારો કે (0 < p < 1) વિતરણ Fનો p કક્ષાનો વિયોજક છે. અર્થાત્  = inf {xF(x)≥p}-જો x(1) ≤ x(2) ≤ … ≤ x(n) યર્દચ્છ નિદર્શનાં અવલોકનોનાં ક્રમિક આગણકો હોય તો [એટલે કે X(Ri) = Xi હોય તો] વિવૃત અંતરાલ (open interval) X(r), X(s)] r < s નો વિશ્વસનીય અંતરાલ કહેવાય અને આ અંતરાલનો વિશ્વાસાંક

થશે. અહીં r અને s, 1થી n પૈકીના એવા ધન પૂર્ણાંકો છે કે જેથી r < s થાય.

(ii) જો વિતરણ F નો p-કક્ષાનો વિયોજક  હોય તો p = p0 માટે નિરાકરણીય પરિકલ્પના (null hypothesis) H0 : = નું પરીક્ષણ કરવું હોય તો સંજ્ઞા-પરીક્ષણ(sign test)નો ઉપયોગ કરવામાં આવે છે. અહીં ની કિંમત આપેલી છે. ધારો કે વિતરણ Fમાંથી લેવામાં આવેલ યદૃચ્છ-નિદર્શનાં અવલોકનો X1, X2, …, Xn છે. હવે આપણે Zi ને નીચે પ્રમાણે વ્યાખ્યાયિત કરીએ.

જો Xi ≤ હોય તો Zi = 1 લો.

જો Xi > હોય તો Zi = 0 લો.

ધારો કે  સ્પષ્ટ છે કે યર્દચ્છ ચલ S ગણ

{0, 1, 2, …, n}

માંની કોઈ એક કિંમત ધારણ કરશે, અને Sનું વિતરણ પરિકલ્પના H0 હેઠળ દ્વિપદી વિતરણ B(n, p0) થશે. આપેલ n અને p0 માટે આપેલ સાર્થકતાની કક્ષાએ દ્વિપદી વિતરણનાં કોષ્ટકોનો ઉપયોગ કરી સંજ્ઞા-પરીક્ષણના અસ્વીકૃતિક્ષેત્ર[critical (rejection) region]નાં અસ્વીકૃતિ-બિંદુઓ (critical points) નક્કી કરી શકાય.

(iii) ધારો કે નિરાકરણીય પરિકલ્પના H0 :  = છે. અહીં ની કિંમત નિર્દિષ્ટ છે. જો p0 = લઈએ તો નિરાકરણીય પરિકલ્પના H0ને સંમિતતાની પરિકલ્પના કહે છે. આ પરિકલ્પનાનું પરીક્ષણ (ii)માં વર્ણવેલ સંજ્ઞા-પરીક્ષણની મદદથી થઈ શકે. સંમિતતાની પરિકલ્પનાનું પરીક્ષણ વિલ્કૉક્સન સૂચિત સંજ્ઞાક્રમાંકપરીક્ષણ દ્વારા થઈ શકે છે. આ પરીક્ષણ નીચે પ્રમાણે મેળવી શકાય.

ધારો કે Yi = ।Xi। i = 1, 2, …,n અને Ri, Yi નો ક્રમાંક દર્શાવે છે. વધુમાં જો Yi = Xi હોય તો Zi = 1 અને Yi = –Xi હોય તો Zi = 0 લો. તો અવલોકન વિધેય W+ ZiRi નું નિરાકરણીય પરિકલ્પના H0 હેઠળ વિતરણ મેળવી શકાય. જો વૈકલ્પિક પરિકલ્પના દ્વિદિશ હોય તો W+ની ઘણી મોટી અથવા ઘણી નાની કિંમત માટે નિરાકરણીય પરિકલ્પનાનો અસ્વીકાર થશે.

nની નાની કિંમત માટે W+નું H0 હેઠળ વિતરણ મેળવી ક્રાફ્ટ અને વાન ઇડને કોષ્ટકો રચ્યાં છે. nની મોટી કિંમત માટે H0 હેઠળ W+નું અનંતલક્ષી વિતરણ n(n+1) / 4 મધ્યક અને n(n+1)(2n+1)/24 વિચરણ ધરાવતું પ્રમાણ્ય વિતરણ છે એમ બતાવી શકાય. આ હકીકતનો ઉપયોગ કરી H0નું પરીક્ષણ કરી શકાય.

(iv) અન્વાયોજનની યોગ્યતા માટેના પરીક્ષણમાં નિરાકરણીય પરિકલ્પના H0 : F = F0 લેવામાં આવે છે. અહીં સમષ્ટિનું વિતરણ F0 છે એમ નિર્દિષ્ટ કરવામાં આવે છે. યદૃચ્છ નિદર્શનાં અવલોકનો X1, X2, …, Xnના આધારે પરિકલ્પના H0નું પરીક્ષણ કરવામાં આવે છે. આ માટે સામાન્ય રીતે બે પરીક્ષણોનો ઉપયોગ કરવામાં આવે છે : (a) કાયસ્ક્વેર પરીક્ષણ, (b) કોલ્મોગોરોવ પરીક્ષણ.

(a) કાયસ્ક્વેર પરીક્ષણ : કાયસ્ક્વેર પરીક્ષણમાં અવલોકનોના વિસ્તારનું (આ વિસ્તાર વાસ્તવિક સંખ્યાનો ગણ R કે તેનો ઉપગણ હોઈ શકે) પરસ્પર નિવારક અને નિ:શેષ એવા K ઉપગણોમાં વિભાજન કરવામાં આવે છે. ધારો કે નિરાકરણીય પરિકલ્પના H0 હેઠળ નિદર્શનું અવલોકન i-મા ઉપગણમાં હોય તેની સંભાવના pi, i = 1, 2, …K છે. H0 હેઠળ વિતરણ F0 આપેલું હોવાથી p1,  p2, …pk ની કિંમત જ્ઞાત બને છે. k ઉપગણોમાં આવતાં નિદર્શનાં અવલોક્ધાો ધારો કે n1, n2…nk છે. અહીં

હવે અવલોકન વિધેય   લો.

જો T મૂલ્ય ઘણું મોટું હોય તો H0નો અસ્વીકાર થશે. npi (i = 1, 2, …, k)ની કિંમત ઓછામાં ઓછી 5 હોય તેવી nની મોટી કિંમત માટે H0 હેઠળ Tનું અનંતલક્ષી વિતરણ મેળવી શકાય અને આ વિતરણ k-1 સ્વાતંત્ર્યની માત્રા (degrees of freedom) ધરાવતું કાયસ્ક્વેર (સંકેત X2) વિતરણ છે, એમ સાબિત કરી શકાય. આમ નિદર્શક કદ nની પર્યાપ્ત રીતે મોટી કિંમત માટે X2–વિતરણનાં કોષ્ટકોનો ઉપયોગ કરી આપેલી સાર્થકતાની કક્ષા માટે અસ્વીકૃત બિંદુ (કે બિંદુઓ) મેળવી નિરાકરણીય પરિકલ્પના H0નું પરીક્ષણ કરી શકાય. શક્ય છે કે H0 હેઠળ નિર્દિષ્ટ F0ના કેટલાક અથવા બધા પ્રાચલો અજ્ઞાત હોય. આ સંજોગોમાં અજ્ઞાત પ્રાચલોના આગણકો (estimates) નિદર્શની માહિતીનો ઉપયોગ કરી મહત્તમ વિસંભાવનાની (maximum likelihood) રીત વડે મેળવી શકાય. અને પ્રાચલોને બદલે તેનાં આગણકોનો F0માં ઉપયોગ કરી F0ને બદલે મેળવી શકાય. અહીં એ વિતરણ Foનો આગણક દર્શાવે છે. આમ, piની આ રીતે મળતી કિંમતોને આપણે  વડે દર્શાવીએ તો ઉપર્યુક્ત વિધેય T હવે

વડે વ્યાખ્યાયિત થશે. જો Foમાં અજ્ઞાત પ્રાચલોની સંખ્યા r(r ≤ K-1) હોય તો nની મોટી કિંમત માટે Toનું અનંતલક્ષી વિતરણ k-r-1 સ્વાતંત્ર્ય માત્રાવાળું χ2– વિતરણ થશે. આ સંજોગોમાં પણ χ2– વિતરણનાં કોષ્ટકોનો ઉપયોગ કરી આપેલી સાર્થકતાની કક્ષા (level of significance) માટે અસ્વીકૃતિ-બિંદુ (કે બિંદુઓ) મેળવી નિરાકરણીય પરિકલ્પના H0નું પરીક્ષણ કરી શકાય.

(b) કોલ્મોગોરોવ પરીક્ષણ : નિરાકરણીય પરિકલ્પના H0 : F = F0નું પરીક્ષણ કરવા માટેનું કોલ્મોગોરોવ પરીક્ષણ અવલોકન-વિધેય Dn પર આધારિત છે. Dnની વ્યાખ્યા નીચે પ્રમાણે છે :

અહીં માહિતીનું આનુભવિક વિતરણ (empirical distribution) Fn(x) નીચે પ્રમાણે વ્યાખ્યાયિત થાય છે :

(i) Xi ≤ X ≤ X(i + 1) માટે Fn(x) = i/n લો. i = 1, 2, …, n

અહીં X(1) ≤ X(2)… ≤ X(n) આપેલાં અવલોકનોના ક્રમિક આગણકો છે. H0 હેઠળ Dnના વિતરણનાં કોષ્ટકો રચવામાં આવ્યાં છે. જો વૈકલ્પિક પરિકલ્પના દ્વિ-દિશ હોય તો Dnની મોટી કિંમત માટે H0નો અસ્વીકાર કરવામાં આવે છે. અને અસ્વીકૃતિ-ક્ષેત્રમાં અસ્વીકૃતિ-બિંદુઓ Dnના વિતરણનાં કોષ્ટકો પરથી મેળવવામાં આવે છે.

જો વૈકલ્પિક પરિકલ્પના એક-દિશ હોય તો અવલોકન-વિધેય અથવા  નો ઉપયોગ કરી અનુરૂપ વૈકલ્પિક એક-દિશ પરિકલ્પના અનુસાર D+n અને Dnના વિતરણનાં કોષ્ટકો પરથી નિરાકરણીય પરિકલ્પના H0નું આપેલી સાર્થકતાની કક્ષા માટે પરીક્ષણ કરી શકાય. Dn અને D+nના વિતરણનો ઉપયોગ કરી n અને કક્ષા α ની કેટલીક પસંદગીયુક્ત કિંમતો માટે મિલર, ઓવેન અને બર્નબોમે કોષ્ટકો રચ્યાં છે. ગુરુનિર્દેશ માટે કોલ્મોગોરોવે Dnનું અનંતલક્ષી વિતરણ મેળવ્યું છે. D+nના વિતરણ પરથી બર્નબોમ અને ટિન્જીએ કોષ્ટકો રચ્યાં છે અને સ્મિર્નોવે D+nનું અનંતલક્ષી વિતરણ મેળવ્યું છે. આ હકીકતોનો ઉપયોગ કરી H0નું આપેલ કક્ષા αએ પરીક્ષણ કરી શકાય.

1.3. દ્વિનિદર્શ પ્રશ્નો : દ્વિનિદર્શ પ્રશ્નોનું નીચેના પેટાવિભાગોમાં વર્ગીકરણ કરી શકાય.

(i) વ્યાપક પ્રશ્ન : વૈકલ્પિક પરિકલ્પનાનો ચોક્કસ નિર્દેશ કર્યા સિવાય બે નિદર્શો સમાન અથવા બે ભિન્ન વિતરણોમાંથી લેવામાં આવ્યા છે તે નિરાકરણીય પરિકલ્પનાનું પરીક્ષણ કરવું.

(ii) સ્થાનીય પ્રશ્ન : બે યર્દચ્છ નિદર્શો સ્થાન (location) સિવાય અન્ય ગુણધર્મોના સંદર્ભમાં એકરૂપ હોય તેવાં સમાન વિતરણ અથવા બે ભિન્ન વિતરણોમાંથી લેવામાં આવ્યા છે તે નિરાકરણીય પરિકલ્પનાનું પરીક્ષણ કરવું.

(iii) માપીય (scale) પ્રશ્ન : બે યર્દચ્છ નિદર્શો માપ (scale or dispersion) સિવાય અન્ય ગુણધર્મોના સંદર્ભમાં એકરૂપ હોય તેવાં સમાન વિતરણ અથવા બે ભિન્ન વિતરણોમાંથી લેવામાં આવ્યા છે તે નિરાકરણીય પરિકલ્પનાનું પરીક્ષણ કરવું.

(iv) પ્રાચલીય વિધેયોનું આગણન : પેટાવિભાગ (ii) અને (iii)માં નિર્દિષ્ટ પ્રશ્નોના પરીક્ષણની મદદથી સ્થાનોના તફાવત અથવા માપોના ગુણોત્તર માટે અંતરાલ આગણન(Interval estimation)ની રચના કરવી.

દ્વિનિદર્શ પ્રશ્નોમાં માહિતી બે નિરપેક્ષ યર્દચ્છ નિદર્શોનાં અવલોકનો X1, X2, …, Xn અને Y1, Y2, …,Ymના સ્વરૂપમાં મળે છે અને આ અવલોકનો અનુક્રમે સતત વિધેયો F અને Gમાંથી લેવામાં આવે છે. દ્વિનિદર્શ પ્રશ્નમાં નિરાકરણીય પરિકલ્પના H0 : F = G લેવામાં આવે છે. હવે આપણે દ્વિનિદર્શ પ્રશ્નના ઉપર દર્શાવેલા ચાર પ્રકારો માટેનાં પરીક્ષણોનો ખ્યાલ મેળવીએ.

(i) વ્યાપક પ્રશ્ન : અહીં વૈકલ્પિક પરિકલ્પના H : F = G લેવામાં આવે છે. અવલોકનો X1, …, Xn અને Y1, …, Ym ને ચઢતા ક્રમમાં ગોઠવી ક્રમ આગણકો X(1), X(2), …, X(n) અને Y(1), Y(2), …., Y(m) મેળવવામાં આવે છે. આ ક્રમ-આગણકોના આધારે આનુભવિક વિતરણો Fn(x) અને Gm(x) નીચે પ્રમાણે વ્યાખ્યાયિત કરવામાં આવે છે.

F(n)(x) = ૦, x < x(1)

= k/n, xk≤x<x(k+1), k = 1, 2, …, n-1

= 1, x ≥ x(n)

G(m)(x) = ૦, x < y1

= k/m, y(k) x < y(k+1) K = 1, 2, …, m–1

= 1, x ≥ ym

સ્પષ્ટ છે કે X1, …, Xn અને Y1, …, Ym અવલોકનોના સંયુક્ત નિદર્શ માટે અવલોકનોની ચડતા ક્રમની ગોઠવણીમાં Fn(x) xથી મોટાં તેવાં X-અવલોકનોનું પ્રમાણ દર્શાવે છે. તે જ પ્રમાણે Gm(x) xથી મોટાં નહિ તેવાં Y-અવલોકનોનું પ્રમાણ દર્શાવે છે. હવે આપણે અવલોકન-વિધેય  વ્યાખ્યાયિત કરીએ. Dn.mનો ઉપયોગ કરી આપણે પરિકલ્પના H0 : F(x) = G(x)નું H1 : F(x) ≥ G(x) વિરુદ્ધ પરીક્ષણ કરી શકીએ. આપેલ સાર્થકતાની કક્ષા α માટે જો  હોય તો આપણે H0નો અસ્વીકાર કરીશું. અહીં PH0 ( ) થશે.

જો વૈકલ્પિક પરિકલ્પના એકદિશ હોય તો D+n,m અને Dn,m અવલોકન વિધેયો નીચે પ્રમાણે વ્યાખ્યાયિત કરવામાં આવે છે :

 , 

જો D+m ≥ D+n.m હોય તો પરિકલ્પના H0 : F(x) = G(x)નો H : F(x) ≥ G(x) વિરુદ્ધ અસ્વીકાર કરવામાં આવે છે. જો  Dn,m ³ Dn,m α હોય તો H0નો H : F(x) ≤ G(x) વિરુદ્ધ અસ્વીકાર કરવામાં આવે છે.

m ≠ n હોય તેવી m અને nની લઘુ કિંમતો માટે એફ. જે. મેસેએ, કોલ્મોગોરોવસ્મિર્નોવ સૂચિત આગણનકાર Dn,mના એકદિશ અને દ્વિદિશ પરિકલ્પનાના પરીક્ષણ માટે કોષ્ટકો રચ્યાં છે, જેનો ઉપયોગ કરી Dn,m,α આપેલ α માટે મેળવી શકાય. m = n હોય તેવી m અને nની લઘુકિંમતો માટે ઝેડ. ડબ્લ્યૂ. બર્નબોમ અને આર. એ. હૉલે કોષ્ટકો રચ્યાં છે, જેનો ઉપયોગ કરી નિરાકરણીય પરિકલ્પના H0નું પરીક્ષણ કરી શકાય.

n અને mની ગુરુ કિંમતો માટે સ્મિર્નોવે Dn,m અને D+n,mના H0 : F(x) = G(x) હેઠળ અનંતલક્ષી વિતરણો મેળવ્યાં છે. આ અનંતલક્ષી વિતરણોનો ઉપયોગ કરીને m અને nની ગુરુ કિંમતો માટે પરિકલ્પના H0નું પરીક્ષણ થઈ શકે.

(ii) સ્થાનીય પ્રશ્ન : અહીં આપણે સ્થાનના તફાવતનું પરીક્ષણ કરવાની પદ્ધતિ વિશે ચર્ચા કરીએ.

(X1, …, Xn) અને (Y1, …, Ym) અનુક્રમે સતત વિતરણ F અને Gમાંથી મેળવેલાં નિરપેક્ષ અવલોકનો છે. આપણે એમ ધારીશું કે F અને Gનાં ઘટત્વ વિધેયો (density function) f અને gના આકાર સમાન છે પરંતુ તેમના સ્થાનમાં તફાવત હોઈ શકે. અર્થાત્ ધન અચલ θ માટે આપણે નિરાકરણીય પરિકલ્પના H : F(x) = G(x) વિરુદ્ધ Hi : F(x) = G(x–θ) α કક્ષાએ પરીક્ષણ કરવું છે.

આપણે બંને નિદર્શોનાં m + n અવલોકનોને ભેગાં કરી તેમને ચઢતા ક્રમમાં ગોઠવીશું. આ ગોઠવણીમાં m + n જગાઓ છે. તેમને ક્રમાંકો કહે છે. ધારો કે R1, R2, …, Rm Y-અવલોકનોના ક્રમાંકો છે. ઉદાહરણ તરીકે, n = 3, m = 4 માટે X1, X2, X3 અને Y1, Y2, Y3, Y4 બે નિદર્શોનાં અવલોકનો હોય અને આ m + n = 7 અવલોકનોની ચઢતા ક્રમમાં ગોઠવણી X1 Y1 Y2 Y3 X2 X3 Y4 હોય તો R1 = 2, R2 = 3, R2 = 4, R4 = 7 થશે. જો H0 સત્ય ન હોય તો X–અવલોકનો કરતાં Y–અવલોકનો મોટાં હોવાની શક્યતા વધશે અને તેથી Y-અવલોકનોના ક્રમાંકો પણ મોટા થશે. H0 માટેના વિલ્કૉક્સન પરીક્ષણમાં અવલોકન વિધેય નો એટલે કે Y–અવલોકનોના ક્રમાંકોના સરવાળાનો ઉપયોગ કરવામાં આવે છે. જો Wy ઘણો મોટો હોય તો HOનો અસ્વીકાર કરવામાં આવે છે.

વિલ્કૉક્સન પરીક્ષણ બીજા સ્વરૂપમાં પણ મેળવી શકાય. આ સ્વરૂપ માન અને વ્હિટનીએ મેળવેલું છે. ધારો કે Xi < Yi હોય તેવાં જોડકાં (i, j)ની સંખ્યા Uy છે, તો Wy = Uy + m(m+1)/2. થશે તે સહેલાઈથી દર્શાવી શકાય. અર્થાત્ Uy = Wy  m(m+1)/2. આમ Uy ઘણો મોટો હોય ત્યારે H0નો અસ્વીકાર કરતું માનવ્હિટનીનું પરીક્ષણ Wy પર આધારિત વિલ્કૉક્સન પરીક્ષણ જેવું જ છે. હવે નિરાકરણીય પરિકલ્પના H0 હેઠળ Uyનું વિતરણ મેળવવું જરૂરી છે. જ્યારે m અને n લઘુ હોય ત્યારે પરીક્ષણ કરવા માટે માન અને વ્હિટનીએ કોષ્ટકો તૈયાર કરેલાં છે. જ્યારે m અને n ગુરુ હોય ત્યારે Uyનું અનંતલક્ષી વિતરણ અનુક્રમે mn/2 મધ્યક અને mn(m + n + 1)/12 વિચરણ ધરાવતું પ્રમાણ્ય વિતરણ (normal distribution) છે એમ સાબિત કરી શકાય. તેથી m અને nની પર્યાપ્ત રીતે મોટી કિંમતો માટે H0નું H વિરુદ્ધ α–કક્ષાએ પરીક્ષણ કરવા માટે પ્રમાણ્ય વિતરણનો ઉપયોગ કરી શકાય.

અત્રે નોંધવું જોઈએ કે H0 હેઠળ Uyનું વિતરણ સમમિત (symmetrical) છે. આ હકીકતનો ઉપયોગ કરી આપણે નિરાકરણીય પરિકલ્પના H0 = F(x) = G(x) વિરુદ્ધ H : F(x) = G(x + θ), θ ≠ 0નું પરીક્ષણ કરી શકીએ. આમ વૈકલ્પિક પરિકલ્પના દ્વિ-દિશ હોય તો જ્યારે Uy ઘણો નાનો હોય અથવા ઘણો મોટો ત્યારે આપણે H0નો અસ્વીકાર કરવો જોઈએ. માનવ્હિટનીએ તૈયાર કરેલ કોષ્ટકો પરથી m અને nની કિંમતો માટે પરીક્ષણનાં અસ્વીકૃતિ-બિંદુઓ મેળવી નિરાકરણીય પરિકલ્પના H0નું પરીક્ષણ થઈ શકે.

સ્થાનના તફાવતનું પરીક્ષણ કરવા માટે મધ્યસ્થ પરીક્ષણનો પણ ઉપયોગ કરવામાં આવે છે. m અને nની લઘુ કિંમતો માટે આ પરીક્ષણમાં અતિ ગુણોત્તર વિતરણ(hypergeometric distribution)નો ઉપયોગ કરવામાં આવે છે. m અને nની ગુરુ કિંમતો માટે χ2 વિતરણનો ઉપયોગ કરી H0 વિરુદ્ધ Hનું પરીક્ષણ કરી શકાય.

(iii) માપીય પ્રશ્ન : અહીં નિરાકરણીય પરિકલ્પના H0 : F(x) = G(x) વિરુદ્ધ વૈકલ્પિક પરિકલ્પના H : F(x) = G(x), > ૦, ≠ 1 લેવામાં આવે છે. આ પરિકલ્પનાના પરીક્ષણ માટે અવલોકન-વિધેય નો ઉપયોગ કરવામાં આવે છે. અવલોકન-વિધેય M પર

 

આધારિત H0નું પરીક્ષણ કરવા માટેના આ પરીક્ષણને મૂડ-પરીક્ષણ કહે છે. Mની ઘણી મોટી કિંમત માટે H0નો અસ્વીકાર થશે. m અને nની મોટી કિંમત માટે Mનું અનંતલક્ષી વિતરણ m[(m + n)2–1] / 12 મધ્યક અને mn(m + n + 1)[(m + n)2 – 4]/ 180 વિચરણ ધરાવતું પ્રમાણ્ય વિતરણ થાય તેમ બતાવી શકાય. આ અનંતલક્ષી વિતરણનો ઉપયોગ કરી એક-દિશ અથવા દ્વિ-દિશ વૈકલ્પિક પરિકલ્પનાની વિરુદ્ધ H0નું પરીક્ષણ થઈ શકે. મૂડ-પરીક્ષણ ઉપરાંત માપીય પ્રશ્ન માટે ફ્રુન્ડ-અન્સારી-બ્રૅડલી-ડેવિડ-બાર્ટન, સિગલ-તુકી અને સુખાત્મે પરીક્ષણો મેળવવામાં આવ્યાં છે. પ્રાચલીય પદ્ધતિ(parametric methods)માં માપ માટે સ્નેડેકોર F-અવલોકન-વિધેયનો ઉપયોગ કરવામાં આવે છે. જો વિતરણો F અને G પ્રમાણ્ય હોય અને આ વિતરણો માપના સંદર્ભમાં ભિન્ન હોય તો મૂડ-પરીક્ષણની સ્નેડેકોર F-પરીક્ષણના સાપેક્ષ અનંતલક્ષી દક્ષતા 15/2p2 = 0.76 છે એમ સાબિત કરી શકાય.

(iv) પ્રાચલીય વિધેયોનું આગણન : અહીં આપણે બે વિતરણો F અને Gનાં સ્થાનોના તફાવતને પ્રાચલીય વિધેય તરીકે ગણીશું અને તેનો વિશ્વસનીય અંતરાલ મેળવીશું. ધારો કે Xi ~ F(x) અને Yj G(x + θ), i = 1, 2, …, n; j = 1, 2, …, m. અહીં સંકેત Xi ~ F(x) એમ સૂચવે છે કે અવલોકનો Xi દરેક i માટે વિતરણ-વિધેય Fને અનુસરે છે. ધારો કે Dij = Xi–Yj, i = 1, 2, …, n; j = 1, 2, …, m. Dijને ચઢતા ક્રમમાં ગોઠવવામાં આવે છે. ધારો કે Dijનાં ક્રમિત અવલોકનો D(1) ≤ D(2) ≤ … ≤ D(m) છે. અહીં M = nm. તો (D(k)), D(i), k < 1 સ્થાન તફાવતનો θનો વિશ્વસનીય અંતરાલ દર્શાવે છે. આ અંતરાલનો વિશ્વાસાંક વિતરણો F અને G પર આધારિત નથી તેની નોંધ લેવી જરૂરી છે. તે જ પ્રમાણે બે વિતરણોનાં માપ-ગુણોત્તર માટે વિશ્વસનીય અંતરાલની રચના થઈ શકે.

1.4. બહુનિદર્શ પ્રશ્ન : અહીં આપણે બે નિરપેક્ષ નિદર્શોને બદલે k( > 2) નિરપેક્ષ નિદર્શો લઈશું. ધારો કે સતત વિતરણ-વિધેય Fiમાંથી લેવામાં આવેલા નિદર્શનાં અવલોકનો Xi1, Xi2, … Xin, i = 1, 2, …, k છે. આપણી નિરાકરણીય પરિકલ્પના H0 : F1=F2=…= Fk થશે. બધાં N = ∑ni અવલોકનોને તેમના ચઢતા ક્રમમાં ગોઠવી તેમના ક્રમાંકો મેળવીશું. ધારો કે Rji, Xijનો ક્રમાંક દર્શાવે છે. હવે HOનું પરીક્ષણ કરવા માટે કૃસ્કલ–વૉલિસ અવલોકન-વિધેય

નો ઉપયોગ કરીશું.

અહીં 

જો Tની કિંમત ઘણી મોટી હોય તો આપણે H0નો અસ્વીકાર કરીશું. Nની મોટી કિંમતો માટે Tનું અનંતલક્ષી વિતરણ k – 1 માત્રાવાળું χ2–વિતરણ છે તેમ સાબિત કરી શકાય. આ હકીકતનો ઉપયોગ કરી સાર્થકતાની કક્ષા α માટે χ2–કોષ્ટકોમાંથી અસ્વીકૃતિ-બિંદુ મેળવી H0નું પરીક્ષણ કરી શકાય.

1.5. દ્વિ-ચલ નિદર્શમાં નિરપેક્ષતા : ધારો કે  સતત દ્વિ-ચલ વિતરણ-વિધેય F(x, y)માંથી લેવામાં આવેલ દ્વિ-ચલ નિદર્શનાં અવલોકનો છે. જો F1 અને F2 ચલ X અને Yનાં અનુક્રમે સીમાવર્તી વિતરણ દર્શાવે તો આપણે નિરાકરણીય પરિકલ્પના H0 : F(x,y) = F1(x) F2(y)નું પરીક્ષણ કરવું છે. જો F(x, y) દ્વિચલ પ્રમાણ્ય વિતરણ હોય તો આપણે નિદર્શ સહસંબંધાંક(correlation coefficient)ની ગણતરી કરી તેના આધારે દ્વિ-ચલ પ્રમાણ્ય સમષ્ટિનો સહસંબંધાંક શૂન્ય છે તે પરિકલ્પનાનું પરીક્ષણ કરી શકીએ. પરંતુ અહીં F(x,y) દ્વિ-ચલ પ્રમાણ્ય વિતરણ હોય તે જરૂરી નથી. તેથી આપણે X-અવલોકનોના ક્રમાંક Ri અને Y-અવલોકનોના ક્રમાંક Si મેળવીશું. ધારો કે Di = Ri – Si, i = 1, 2, …, n. હવે સ્પિયરમૅનનો ક્રમાંક સહસંબધાંક (Rank Correlation Coefficient),  લઈશું.

n ≤ 10 અને α ની વિશિષ્ટ કિંમતો માટે કેન્ડાલે Rનું વિતરણ મેળવી કોષ્ટકો રચ્યાં છે. n ≥ 11 માટે કોનોવરે રચેલાં કોષ્ટકોનો ઉપયોગ કરી શકાય. nની મોટી કિંમતો માટે ફ્રેઝરે સાબિત કર્યું છે કે નું અનંતલક્ષી વિતરણ પ્રમાણ્ય વિતરણ N(0, 1) બને છે. nની લઘુ કિંમતો માટે કેન્ડાલ અને કોનોવરનાં કોષ્ટકો અથવા nની મોટી કિંમત માટે પ્રમાણ્ય વિતરણનાં કોષ્ટકોનો ઉપયોગ કરી a-કક્ષાએ નિરાકરણીય પરિકલ્પના H0 : F(x, y) = F1(x)·F2 (y)નું પરીક્ષણ કરી શકાય. H0ના પરીક્ષણ માટે બીજું પણ એક પરીક્ષણ છે. આ માટે આપણે અવલોકન-વિધેય Tને નીચે પ્રમાણે વ્યાખ્યાયિત કરીશું.

1 ≤ ≤ ≤ n

અહીં Aij = Sign (Xi – Xj) Sign (Yj – Yj) અને

અવલોકન-વિધેય Tને વિવિધ સમતુલ્ય સ્વરૂપોમાં વ્યક્ત કરી શકાય, જે પૈકીનું એક સરળ અને અનુકૂળ સ્વરૂપ નીચે પ્રમાણે છે.

ધારો કે P Aijની ધન કિંમતોની સંખ્યા દર્શાવે છે. તો  થશે સ્પષ્ટ છે કે –1 ≤ T ≤ 1 જો |T| ની કિંમત ઘણી મોટી હોય તો પરિકલ્પના H0નો અસ્વીકાર થશે. H0 હેઠળ Tનું વિતરણ સમમિત છે એમ સાબિત કરી શકાય. 4 ≤ n ≤ 10 માટે કેન્ડાલે Tના ચોક્કસ વિતરણ પરથી કોષ્ટકો રચ્યાં છે અને n ≥ 11 કોનોવરનાં કોષ્ટકોનો ઉપયોગ કરી શકાય. આ બંને સંદર્ભોનો ઉલ્લેખ આપણે ઉપર કર્યો છે. n ≥ 8 માટે કેન્ડાલે સાબિત કર્યું છે કે,

આગણક નું અનંતલક્ષી વિતરણ N (0, 1) છે.

1.6. વિશિષ્ટ નોંધ : પરિચ્છેદ 1.2 થી 1.5માં વ્યવહારમાં વપરાતાં અપ્રાચલીય પરીક્ષણોની આપણે સંક્ષિપ્ત ચર્ચા કરી. અપ્રાચલીય પદ્ધતિઓના મુખ્ય લાભ નીચે પ્રમાણે છે.

1.પ્રમાણ્ય કે અન્ય પ્રાચલીય વિતરણોના સમુદાયને બદલે સતત વિતરણોનો સમગ્ર સમુદાય લઈએ તોપણ અપ્રાચલીય પદ્ધતિઓની અનુવિધિતા કે યથાર્થતા (validity) જળવાઈ રહે છે.

2. અપ્રાચલીય પદ્ધતિઓ નિદર્શ અવલોકનોના ક્રમાંક અને ક્રમાંક-આધારિત રાશિ પર અવલંબે છે. તેથી આ પદ્ધતિઓ ઉપયોગ કરનારને સહેલાઈથી સમજાવી શકાય છે અને આ પદ્ધતિઓ દ્વારા મળતાં અવલોકન-વિધેયો સરળતાથી મેળવી શકાય છે. પરિણામે પરીક્ષણવિધિ સહેલાઈથી પ્રયોજી શકાય છે.

3. અપ્રાચલીય પદ્ધતિઓ દ્વારા મળતાં પરીક્ષણોની ઇષ્ટતમતાના સંદર્ભમાં દક્ષતા-ક્ષતિ નહિવત્ છે.

જયંત વિષ્ણુ દેશપાંડે

ઈશ્વરભાઈ પટેલ