નિદર્શન સિદ્ધાંત (Theory of Sampling) અને નિદર્શ તપાસ

January, 1998

નિદર્શન સિદ્ધાંત (Theory of Sampling) અને નિદર્શ તપાસ : સમગ્ર સમુદાયમાંથી આંકડાશાસ્ત્રીય પદ્ધતિથી પસંદ કરેલા નાના સમૂહોના ઘટકોનો અભ્યાસ કરી તે વડે સમગ્ર સમુદાય વિશે તારણો કાઢવાની રીત તે નિદર્શન. નિદર્શન મેળવવાની પદ્ધતિઓ અને નિદર્શમાપનને આધારે સમષ્ટિની વિશિષ્ટતાઓ અંગેના નિષ્કર્ષ મેળવવાનો સિદ્ધાંત તે નિદર્શન સિદ્ધાંત. ઉદ્યોગ, વ્યાપાર, સમાજશાસ્ત્ર, અર્થશાસ્ત્ર, વિજ્ઞાન વગેરેને લગતી સમસ્યાઓનો ઉકેલ તેના દ્વારા મેળવી શકાય છે. નીચેનાં ઉદાહરણો દ્વારા તે દર્શાવ્યું છે :

(1) દેશનાં 214 વિશ્વવિદ્યાલયના આશરે 50 લાખ વિદ્યાર્થીઓને આજની શિક્ષણ-પરીક્ષણ-પ્રથા વિશે શા અભિપ્રાયો કે સૂચનો છે તે વિશે વિશ્વવિદ્યાલય અનુદાન પંચને જાણકારી મેળવવી છે. (2) વાર્ષિક એક લાખથી વધુ ટી.વી. સેટ બનાવતી એક કંપનીને પ્રત્યેક ટી.વી. સેટ નિયત કરેલી ગુણવત્તાના ધોરણ પ્રમાણે છે કે નહીં તે નક્કી કરવું છે. (3) શિયાળાના નવેમ્બર-ડિસેમ્બર માસ દરમિયાન અન્ય દેશોમાંથી ખૂબ મોટી સંખ્યામાં પક્ષીઓ નળસરોવરમાં આવે છે. તેમના રક્ષણની વ્યવસ્થા માટે આ પક્ષીઓની સંખ્યા કેટલી છે તે ગુજરાત સરકારના પ્રવાસન ખાતાને જાણવું છે.

વિશાળ સમુદાયના ઘટકોના કોઈ નિશ્ચિત અભિલક્ષણના માપન અંગેની આ સમસ્યાઓ છે. અહીં ઘટકોની સંખ્યા વિશાળ હોવાથી તે બધાને ધ્યાનમાં લઈ અભ્યાસ કરવાનું અવ્યવહારુ, ઘણો સમય લેનાર અને ખર્ચાળ છે. તેને બદલે આવી સમસ્યાને આંકડાશાસ્ત્રીય પદ્ધતિથી નિદર્શની પસંદગી કરીને ઉકેલવામાં આવે છે. નિદર્શન સિદ્ધાંત : u1, u2…….uN એ કોઈ સમુદાયના N ઘટકો છે. અહીં પ્રત્યેક ઘટક ut માટે કોઈ સામાન્ય અભિલક્ષણ y વ્યાખ્યાયિત છે. સમુદાય U= {u1, u2………uN}ને સમષ્ટિ (population) કહે છે. સંખ્યા yt એ એકમ Ut માટે yનું મૂલ્ય છે.

આને સમષ્ટિના પ્રાચલો કહે છે.

જેવાં yt નાં વિધેયોને સમષ્ટિના પ્રાચલો કહે છે. પ્રાચલોનું આગણન (estimation) કરવા (અટલે કે તેમને અંદાજવા) વિશાળ સમષ્ટિ Uમાંથી નિયત સંખ્યાના એકમો ધરાવતા નિદર્શ કે નિદર્શો પસંદ કરવાની રીતો મુખ્યત્વે નિદર્શન સિદ્ધાંતમાં આવે છે. સમષ્ટિ Uમાંથી આ રીતે પસંદ થયેલા એકમો  છે. અને એ એકમ ના અભિલક્ષણનું મૂલ્ય છે. તો

ને

પ્રાચલોના આગણકો (estimators) કહે છે. સમષ્ટિના પ્રાચલોને અંગ્રેજી મૂળાક્ષરોના કેપિટલ અક્ષરોથી અથવા લૅટિન મૂળાક્ષરોથી અને નિદર્શ આગણકોને અંગ્રેજી મૂળાક્ષરોના નાના અક્ષરો વડે દર્શાવવાની પ્રણાલિકા છે. જો પ્રત્યેક t= 1, 2,……..N માટે ytની કિંમત પ્રાપ્ત કરી હોય તો તેને સંપૂર્ણ તપાસ (census survey) કહે છે. સંપૂર્ણ તપાસ કરવામાં આગળ જણાવ્યા પ્રમાણે ખર્ચ, માનવશક્તિ અને સમયનો વધુ વ્યય થાય છે. સમષ્ટિમાંથી નિયત સંખ્યાનું નિદર્શ પસંદ કરવામાં આવે તો તેને નિદર્શ-તપાસ (sample survey) કહે છે. નિદર્શ-તપાસથી સર્વેક્ષણનો ખર્ચ ઓછો થાય છે. મળતાં પરિણામો ઝડપી, પૂરતી ચોકસાઈવાળાં અને વિશ્વસનીય હોય છે.

નિદર્શ સિદ્ધાંત આ બાબતો પર આધારિત છે : (1) સમષ્ટિના કોઈ પણ એકમનું નિદર્શમાં હોવું સંભાવના સિદ્ધાંત પર આધારિત છે. (2) આગણકની પસંદગી કુલ ખર્ચ ન્યૂનતમ થાય અને સરેરાશ વર્ગ ત્રુટિ ન્યૂનતમ થાય તે રીતે કરાય છે. યોગ્ય નિદર્શ યોજનાથી અવલોકનો દ્વારા મળેલ આગણક સમષ્ટિના પ્રાચલનું અનભિનત (unbiased) આગણન કરે છે આથી તે વધુ અસરકારક છે. નિદર્શ-તપાસની પદ્ધતિઓનો વ્યવસ્થિત અને સત્યશોધનના સાધન તરીકે બહોળા પ્રમાણમાં ઉપયોગ થાય છે. તેથી નિદર્શ-તપાસનો હેતુ શરૂઆતથી જ સ્પષ્ટ કરાય છે, જેથી જરૂરી પૈસા, માનવશક્તિ, સમય વગેરેનું આયોજન થઈ શકે. જેના પ્રાચલોનું આગણન કરવાનું હોય તે સમષ્ટિ સ્પષ્ટપણે વ્યાખ્યાયિત કરાય છે, જેથી જરૂર પ્રમાણે ભૌગોલિક, વસ્તીવિષયક કે અન્ય રીતે વિભાજન થઈ શકે. સમસ્યા પ્રમાણે સમષ્ટિમાં નિદર્શન એકમ વ્યાખ્યાયિત કરવામાં આવે છે. તેના સંદર્ભે સંબંધિત માહિતી મેળવી શકાય છે. નિદર્શના એકમોની સંખ્યા, નિદર્શનપદ્ધતિની પસંદગી અને પ્રાચલોનું આગણન એ નિદર્શયોજનાનાં અંગો છે. આને અનુરૂપ નિદર્શ-યોજનાની પસંદગી કરવી જોઈએ. નિદર્શ-તપાસ મુખ્યત્વે સર્વેક્ષણ-વ્યવસ્થા પર આધારિત છે. આથી સર્વેક્ષણ નિષ્ઠાપૂર્વક અને કાળજીથી થવું જોઈએ. નિદર્શન-પદ્ધતિઓનું સંભાવના નિદર્શન અને સંભાવનેતર નિદર્શન (probability and non-probability sampling) – એમ બે વર્ગોમાં વર્ગીકરણ કરવામાં આવે છે.

સંભાવના નિદર્શન : અહીં સમષ્ટિના કોઈ એકમના નિદર્શમાં હોવા ન હોવાનો નિર્ણય માત્ર સંયોગ (chance) પર આધારિત હોય છે. સમષ્ટિનો પ્રત્યેક એકમ અમુક શૂન્યેતર (non-zero) સંભાવના સાથે નિદર્શમાં સમાવિષ્ટ થશે તેની ખાતરી સંભાવના નિદર્શન યોજના આપે છે. કોઈ એક સમષ્ટિમાંથી આપેલ પ્રકારના શક્ય બધા જ નિદર્શો s1, s2, ………… sk છે. અહીં st ના પસંદ થવાની સંભાવના pt (t = 1, 2, ………… k) છે તો ગણ {(s1, p1), (s2, p2)…………(sk, pk)}ને સંભાવના નિદર્શન યોજના (sampling scheme) કહે છે.

સંભાવનેતર નિદર્શન : સમષ્ટિના પ્રત્યેક ઘટકનો કેટલી સંભાવના સાથે નિદર્શમાં સમાવેશ થશે તેનો ઉલ્લેખ ન કરતી યોજનાને સંભાવનેતર નિદર્શયોજના કહેવાય છે. અહીં સમષ્ટિના એકમનું નિદર્શમાં હોવું ન હોવું નિદર્શક(sampler)ની સગવડ અને નિર્ણાયકતા પર આધારિત છે. તે ઝડપી અભિપ્રાય તપાસ (opinion survey) માટે વપરાય છે. અહીં આગણકની દક્ષતાનું માપ કાઢી શકાતું નથી.

સંભાવના નિદર્શનની પદ્ધતિઓ : સરલ યાચ્છિક નિદર્શન : સમષ્ટિના N એકમોમાંથી પ્રત્યેક એકમ પસંદ થવાની સંભાવના સમાન રહે તે રીતે એક પછી એક n એકમો આ પદ્ધતિમાં પસંદ કરવામાં આવે છે. આમ વિવિધ નિદર્શો મળે છે. આમાંથી કોઈ એક નિદર્શ પસંદ થવાની સંભાવના  થાય. માટે પસંદ થયેલા નિદર્શમાં સમષ્ટિનું કોઈ પણ એકમ હોય તેની સંભાવના છે. પ્રત્યેક ડ્રૉ વખતે પસંદ થયેલા એકમની નોંધ કરી ફરીથી સમષ્ટિમાં મૂકી દઈ પછીનો ડ્રૉ કરવામાં આવે તેને પ્રતિસ્થાપનસહિત સરલ યાદૃચ્છિક નિદર્શન કહે છે. અન્યથા તેને પ્રતિસ્થાપનરહિત સરલ યાદૃચ્છિક નિદર્શન કહે છે.

વ્યવહારમાં સમષ્ટિમાંથી નિદર્શ મેળવવાની બે રીતો છે : (1) લૉટરીની રીતમાં સમષ્ટિના N એકમોને 1 થી N સુધીનો ક્રમ આપવામાં આવે છે. સરખા આકારની N ચિઠ્ઠીઓને 1 થી N સુધીનો ક્રમ આપવામાં આવે છે. ચિઠ્ઠીઓને સારી રીતે ભેળસેળ કરી એક પછી એક n ચિઠ્ઠીઓ ઉપાડવામાં આવે છે. આ n ચિઠ્ઠીઓમાં દર્શાવેલ ઓળખનંબરોના એકમનો ગણ તે પસંદ પામેલ નિદર્શ છે. (2) યાદૃચ્છિક સંખ્યાઓના કોઠાઓના ઉપયોગની રીતમાં શૂન્યથી નવ સુધીના અંકો યાદૃચ્છિક રીતે આવતા હોય તેમ પાંચ-પાંચ અંકોના જૂથમાં અનેક પંક્તિઓ અને સ્તંભોવાળા કમ્પ્યૂટરથી તૈયાર કોઠાઓનો ઉપયોગ કરી Nમાંથી n સંખ્યા યાદૃચ્છિક રીતે પસંદ કરી શકાય છે. સમષ્ટિના પ્રત્યેક એકમ ut ના કોઈ અભિલક્ષણ yની કિંમત yt (t = 1, 2, ……. N) છે. જો  સમષ્ટિ n મધ્યક અને સરળ યાદૃચ્છિક નિદર્શન પદ્ધતિ દ્વારા મળેલ નિદર્શનું મધ્યક હોય તો  આમ નિદર્શ મધ્યક નું અનભિનત આગણન કરે છે. અહીં E() અને E(yt) અનુક્રમે અને yt નાં અપેક્ષિત મૂલ્યો (expected values) સૂચવે છે.

ક્રમબદ્ધ (ordered) નિદર્શન : આ પદ્ધતિમાં સમષ્ટિના N એકમોમાંથી માત્ર પ્રથમ એકમ જ સરલ યાચ્છિક નિદર્શનથી પસંદ કરવામાં આવે છે. નિદર્શના બાકીના (n−1) એકમો પૂર્વયોજિત નિશ્ચિત ભાત(pattern)ના આધારે નક્કી કરવામાં આવે છે. સમષ્ટિમાં 1થી N સુધી ઓળખસંખ્યા આપેલ N એકમો છે, જેમાંથી ક્રમબદ્ધ નિદર્શન દ્વારા n એકમોનો એક નિદર્શ પસંદ કરવા માટે અહીં N = nk લઈ (k પૂર્ણાંક છે) સરલ યાચ્છિક નિદર્શનથી 1 થી k સુધીના પૂર્ણાંકોમાંથી એક પૂર્ણાંક પસંદ કરવામાં આવે છે. જો આ પૂર્ણાંક i હોય l ≤ i ≤ k તો {i, i+k, i+2k…….,i+ (n-1)k)} પસંદ થયેલ નિદર્શ છે. જો N≠nk હોય તો K= ની નજીકનો પૂર્ણાંક લઈ સરલ યાચ્છિક નિદર્શન પદ્ધતિથી પસંદ કરેલ પ્રથમ સંખ્યા i હોય તો {i, i+k, i+2k,……….i+tk, i + (t+1) kN, i+ (t+2) kN,……….i+ (N1) k−N} જ્યાં છે તે ક્રમબદ્ધ નિદર્શનથી મળેલ નિદર્શ છે. આવર્તિત (periodic) નિદર્શનફ્રેમમાં આ પદ્ધતિથી પસંદ કરેલ નિદર્શ દ્વારા મેળવેલ પરિણામોમાં મોટા પ્રમાણમાં અભિનતિ (bias) હોવાની શક્યતા છે.

સ્તરિત (stratified) નિદર્શન : સમષ્ટિના એકમ ut(t=1,2,…….N)ના રસ ધરાવતા અભિલક્ષણ yની કિંમતો  yt(t=1,2,…….N)  વચ્ચે મોટા પ્રમાણમાં વિચલન હોય તો મેળવેલ નિદર્શ સમગ્ર સમષ્ટિનું ઓછા પ્રમાણમાં પ્રતિનિધિત્વ કરશે. આવા સંજોગોમાં સમગ્ર સમષ્ટિમાંથી નિદર્શ પસંદ ન કરતાં પ્રથમ સમષ્ટિના N એકમોને કોઈ એક ગુણધર્મને આધારે k ઉપસમષ્ટિઓમાં વિભાજન કરવામાં આવે છે. ધારો કે i મા સ્તરમાં Ni એકમો છે. (i=1,2,…….k) અને છે. ત્યારપછી પ્રત્યેક સ્તરમાંથી સ્વતંત્ર રીતે અને યાચ્છિકપણે એક-એક નિદર્શ પસંદ કરવામાં આવે છે. i મા સ્તરમાંથી ni એકમોનું નિદર્શ (i=1,2,……….k) પસંદ કરાય છે અને છે. આ ni ની કિંમત સમાન નિયતન (allocation), અનુપાતી નિયતન, તેમજ નિયતન અને ઇષ્ટતમ નિયતનમાંની કોઈ એક રીતથી નક્કી કરવામાં આવે છે. આમાં ઇષ્ટતમ નિયતનથી મેળવેલ નિદર્શ આગણક બધી રીતોમાં સૌથી વધુ દક્ષ છે.

ગુચ્છ નિદર્શન : સ્તરિત નિદર્શનમાં સ્તરો એકબીજાની સરખામણીમાં વિષમાંગ (heterogeneous) હોય છે. પરંતુ પ્રત્યેક સ્તર પોતે સમાંગ (homogeneous) હોય છે. ઘણી વખત સમષ્ટિનું ભૌગોલિક કે અન્ય રીતે ઉપસમષ્ટિઓમાં વિભાજન કરવાનું ઉચિત ગણાય છે, જેમાં ઉપસમષ્ટિઓ એકબીજીની સરખામણીમાં સમાંગ હોય પરંતુ ઉપસમષ્ટિ પોતે વિષમાંગ હોઈ શકે. આ રીતે વિભાજિત ઉપસમષ્ટિને ગુચ્છ (cluster) કહે છે. સમષ્ટિનું ગુચ્છોમાં વિભાજન કર્યા પછી જુદા-જુદા ગુચ્છો સમાંગ હોવાથી યાચ્છિક રીતે સમાન અથવા અસમાન સંભાવના સાથે એક, બે કે કોઈ નિયત સંખ્યાના ગુચ્છો પસંદ કરવામાં આવે છે. અને ત્યારપછી પસંદ થયેલ ગુચ્છના બધા એકમોનો અભ્યાસ કરવામાં આવે છે. આ નિદર્શનને ગુચ્છ નિદર્શન (cluster sampling) કહે છે. ગુચ્છ પસંદ થયા પછી તે ગુચ્છના એકમોનો જ અભ્યાસ કરવાનો હોવાથી એક જ સ્થળે રહીને ઓછા ખર્ચે અને ઓછા સમયમાં આ કાર્ય થઈ શકે છે, જે ગુચ્છ નિદર્શનનો ફાયદો છે.

ચલિત સંભાવના નિદર્શન : સમષ્ટિના એકમ જ્યારે વિવિધ આમાપ(size)ના હોય ત્યારે આમાપના પ્રમાણમાં સંભાવના સાથેની એકમની પસંદગી કરવી વધુ યોગ્ય ગણાય. આ રીતને ચલિત સંભાવના નિદર્શન કહે છે. સમષ્ટિના N એકમોમાં i મા એકમનું આમાપ xi(i=1,2,…….N) છે. અને છે. પ્રથમ એકમ સાથે 1 થી x1, બીજા એકમ સાથે (x1 + 1) થી (x1 + x2) તે રીતે Nમા એકમ સાથે થી થી સંખ્યાઓ સાંકળવામાં આવે છે. હવે 1થી x સંખ્યાઓમાંથી યાચ્છિકપણે એક સંખ્યા પસંદ કરી તે સંખ્યા જે એકમ સાથે સંકળાયેલ હોય તે એકમ પસંદગીપાત્ર થશે. પ્રતિસ્થાપન સહિતના યાચ્છિક નિદર્શનથી આ રીતે n એકમોનું નિદર્શ પસંદ થશે. જ્યાં i મા એકમની પસંદ થવાની સંભાવના xi (i=1,2,…….N) છે.

બહુક (multiple) નિદર્શન : સમષ્ટિના N એકમોમાંથી N એકમોવાળા માત્ર એક જ નિદર્શનાં અવલોકનોને આધારે નક્કી કરેલા આગણક કે નિર્ણયને બદલે બે કે વધુ નિદર્શો પસંદ કરી સંયુક્ત અવલોકનો પરથી નિર્ણય લેવાનું વધુ દક્ષતાભરેલું હોય છે; દા. ત., N ઉત્પાદિત એકમોના એક જથ્થા માટે સ્વીકૃતિ કે અસ્વીકૃતિ વિશેની સમસ્યા જોઈએ. tમો એકમ ખામીવાળો હોય તો yt=1 અને ખામી-રહિત હોય તો yt=0 છે એમ ધારીએ તો n1 એકમવાળા કોઈ પસંદ થયેલ યાચ્છિક નિદર્શમાં એ નિદર્શમાં રહેલા ખામીવાળા એકમોની સંખ્યા દર્શાવશે. c1, c2 કોઈ પૂર્વનિશ્ચિત અચલો છે. જથ્થાના સ્વીકાર માટે d1 ≤ c1 અને અસ્વીકાર માટે d1 ≥ c1 લઈએ છીએ. જો c1 < d1 < c2 હોય તો n2 એકમોવાળો બીજો નિદર્શ યાચ્છિક રીતે પસંદ કરી નક્કી કરવામાં આવે છે. હવે d1 + d2 < c2 હોય તો જથ્થાનો સ્વીકાર અનેે ન હોય તો અસ્વીકાર કરવામાં આવે છે. નિદર્શની આ રીતને દ્વિનિદર્શન (double-sampling) કહે છે. બેથી વધુ નિદર્શો પસંદ કરવાની રીતને બહુક નિદર્શન કહે છે.

અનુક્રમિક (sequential) નિદર્શન : નિદર્શમાં પસંદ કરેલ એકમોની સંખ્યા n પૂર્વનિશ્ચિત અચલ લેવાને બદલે સમષ્ટિમાંથી એક પછી એક એકમ યાચ્છિક રીતે પસંદ કરવાનું વોડે(1934) સૂચવ્યું. તેને પરિણામે અનુક્રમિક નિદર્શન પદ્ધતિ વિકાસ પામી.

પ્ર. ન. જાની