બહુચલીય વિશ્લેષણ
(Multivariate analysis)
વ્યક્તિ અથવા વસ્તુઓ કે માનવીય પ્રક્રિયાઓ સાથે સંકળાયેલાં ચલલક્ષણો (x1, x2, ………, xp), p ≥ 1 પર જુદા જુદા સમયે કે પ્રસંગે પુનરાવર્તિત પ્રયોગો કે અન્વેષણ કરી પ્રાપ્ત થયેલી બહુચલીય માહિતી પરથી વ્યક્તિ કે વસ્તુની સમષ્ટિના ગુણધર્મો કે માનવીય પ્રક્રિયાના ગુણધર્મો વિશે અનુમાન કે નિર્ણય તારવવા માટે પ્રયોજવાની આંકડાશાસ્ત્રીય પદ્ધતિ.
માનવીય પ્રવૃત્તિઓનાં વિવિધ ક્ષેત્રોમાંથી સુઆયોજિત પ્રયોગો કે અન્વેષણો દ્વારા, તેમજ ભૌતિક, જૈવિક કે કુદરતી પ્રક્રિયાઓના સૂક્ષ્મ અને સંવેદનશીલ સાધનો વડે મેળવેલાં અવલોકનો દ્વારા એક કરતાં વધુ ચલલક્ષણો પર પ્રાપ્ત થયેલી સંખ્યાત્મક કે ગુણાત્મક માહિતીને બહુચલીય માહિતી કહેવામાં આવે છે; દા.ત., N વ્યક્તિઓની સમષ્ટિમાંથી વિશિષ્ટ પ્રકારે પસંદ કરેલી n (≤ N) વ્યક્તિઓ પૈકીની દરેક વ્યક્તિનાં ઊંચાઈ, વજન, માથાની લંબાઈ, પહોળાઈ, કાંડાથી કોણી સુધીની હાથની લંબાઈ, ખભાની લંબાઈ જેવાં ભૌતિક લક્ષણો(જે બહુચલો છે.)ના માપનો સમૂહ એ બહુચલીય માહિતી-(multivariate data)નું એક ઉદાહરણ છે.
વળી આર્થિક કે સામાજિક તપાસ માટે પસંદ કરેલાં n કુટુંબો પૈકી દરેક કુટુંબના સભ્યની સંખ્યા; આવક, ખોરાક, શિક્ષણ તેમજ વીજળી પાછળ થતા ખર્ચ(જે બહુચલો છે.)ની માહિતી એ બહુચલીય માહિતીનું બીજું ઉદાહરણ છે. આંકડાશાસ્ત્રીય પદ્ધતિઓ દ્વારા તારણો, અનુમાન કે નિર્ણય કરવામાં આવે છે. મોટાભાગની આંકડાશાસ્ત્રીય પદ્ધતિઓ [p-ચલીય પ્રમાણ્ય-વિતરણ(normal distribution)થી ઓળખાતા] સંભાવના-વિતરણ પર અને કેટલીક આનુભવિક સમર્થન કે અંત:પ્રજ્ઞા (intuition) પર આધારિત હોય છે. બહુચલીય માહિતીના વિશ્લેષણ માટે આ પદ્ધતિઓનો ઉપયોગ કરવા ગણકયંત્ર ઉપકારક અને અનિવાર્ય બને છે. વળી ઉચ્ચ કક્ષાનાં આંકડાશાસ્ત્રીય સૉફ્ટવેરનો ઉપયોગ માહિતી-પૃથક્કરણની ક્રિયાને ઝડપી, સરળ અને ગુણવત્તાની ર્દષ્ટિએ સર્વગ્રાહી અને તલસ્પર્શી બનાવે છે. વૈજ્ઞાનિક અન્વેષણના ઉદ્દેશ પૈકીનો એક બહુચલીય માહિતી સાથે સંકળાયેલા p ચલો x1, x2, ….., xp વચ્ચેનું સંબંધ-માળખું નક્કી કરવાનો છે. આ ચલો પૈકી કેટલા અને કયા ચલો અન્ય ચલો પર આધારિત છે તે નક્કી કરી p ચલોનું બે કે તેથી વધારે સમૂહમાં વર્ગીકરણ કરવામાં આવે છે. વર્ગીકરણ અનુસાર નિર્દિષ્ટ આંકડાશાસ્ત્રીય પદ્ધતિઓ લગાડી બહુચલીય માહિતીનું પૃથક્કરણ કરવામાં આવે છે. p ચલો વચ્ચે પારસ્પરિક સંબંધ પ્રવર્તતો હોય ત્યારે વર્ગીકરણને બદલે p ચલોનું સુરેખ પરિવર્તન (linear transformation) દ્વારા k નવા ચલો y1, y2, ……, ykમાં રૂપાંતર કરી મૂળ માહિતીનું k પરિમાણી માહિતીમાં સંક્ષેપન કરવામાં આવે છે.
બહુચલીય માહિતીના p ચલો પૈકી કેટલાક ચલો અન્ય ચલો પર આધારિત હોય તેવા સંબંધને આયત્તતા સંબંધ-માળખું (model of dependant relationship) અને p ચલો વચ્ચે પારસ્પરિક સંબંધ પ્રવર્તતો હોય તેવા માળખાને પારસ્પરિક આયત્તતા સંબંધ-માળખું (model of interdependence relationship) કહેવામાં આવે છે. આયત્તતા સંબંધ-માળખા નીચે બહુચલીય નિયત સંબંધ, વિહિત સંબંધ (canonical correlation), પૃથક્કરણ, વિવેચક પૃથક્કરણ અને લોજિટ (logit) પૃથક્કરણ જેવી પદ્ધતિઓનો સમાવેશ થાય છે. પારસ્પરિક આયત્તતા સંબંધ-માળખા નીચે મુખ્ય ઘટક-પૃથક્કરણ, અવયવ-પૃથક્કરણ, ગુચ્છ(cluster)-પૃથક્કરણ અને બહુપરિમાણી માપક્રમણ (multi dimensional scaling) જેવી પદ્ધતિઓનો સમાવેશ થાય છે.
બહુચલીય માહિતીના પૃથક્કરણ દ્વારા બહુચલીય માહિતીનું સંક્ષેપન કે માળખાગત સરળીકરણ, અંતર્ગત ચલોનું અલગીકરણ અને સમૂહીકરણ, અંતર્ગત ચલો વચ્ચે આયત્તતા સંબંધ-તપાસ અને માળખાગત ગાણિતિક સ્વરૂપનું નિરૂપણ, પૃથક્કરણ દ્વારા પૂર્વાનુમાન અને અંતર્ગત ચલોના સંયુક્ત વિતરણના પ્રાચલોનું આગણન (estimate) અને પરિકલ્પના પરીક્ષણ કરવામાં આવે છે.
બહુચલીય પ્રમાણ્ય-વિતરણ (multivariate normal distribution) : બહુચલીય વિશ્લેષણમાં p ચલો x1, x2, ….., xpનું સંયુક્ત સંભાવના-વિતરણ p ચલીય પ્રમાણ્ય-વિતરણ છે. = (x1, x2, ….., xp)ને p ચલોનો હાર-સદિશ (row-vector) કહેવામાં આવે છે. ને 1 x p કક્ષાનો શ્રેણિક (matrix) અને સદિશને p ચલોનો સ્તંભ-સદિશ (column vector) કહેવામાં આવે છે. તે p x 1 કક્ષાનો સ્તંભ-શ્રેણિક છે. સ્તંભ-સદિશ p ચલીય પ્રમાણ્ય-વિતરણ અનુસરે છે. આ વિધાનને થી દર્શાવવામાં આવે છે.
ચલોના મધ્યકોનો હાર-સદિશ (row vector) છે. શ્રેણિક ∑= (σij) એ p x p કક્ષાનો શ્રેણિક છે અને ચલોનો સહવિચરણ (co-variance) અથવા વિચરણ-સહવિચરણ શ્રેણિક (matrix) દર્શાવે છે. i ≠ j = 1, 2, 3, …….., p માટે σij = σji હોવાથી શ્રેણિક ∑ સંમિત છે. સહવિચરણ શ્રેણિક ∑નો (i,j)મો ઘટક(σij), xi અને xj (i ≠ j) ચલો વચ્ચેનું સહવિચરણ દર્શાવે છે; જ્યારે i = 1, 2, …., p માટે σii ચલ xiનું વિચરણ દર્શાવે છે. E (xi) = μi, i = 1, 2, ….., p અને σij = E{(xi-μi)(xj-μj)}, i = j = 1, 2, …, p છે. જો , i = j = 1, 2, …, p હોય તો ρijના p x p કક્ષાના શ્રેણિક ∧ = (ρij)ને સહસંબંધ (correlation) શ્રેણિક કહે છે.
જો ∑ ધનશ્રેણિક હોય, અસ્તિત્વ ધરાવતો હોય તો ઘટત્વ વિધેય છે……(1)
અહીં – ∞ < xi < ∞, – ∞ < μi < ∞, i = 1, 2, ……, p અને શ્રેણિકનો નિશ્ર્ચાયક છે. (1)માં p = 1 મૂકવાથી એક-ચલીય પ્રમાણ્ય-વિતરણનું ઘટત્વ વિધેય (density function) મળે છે.
n કદનાં નિદર્શનાં-અવલોકનો પરથી બહુચલીય માહિતી પ્રાપ્ત થાય છે એમ ધારવામાં આવે છે. મોટાભાગની આંકડાશાસ્ત્રીય પદ્ધતિઓ આ ધારણા નીચે પ્રયોજી તેમાં સમાયેલા આગણનકારો(estimator)નું નિદર્શ-વિતરણ પણ ઘણુંખરું આ ધારણા નીચે મેળવવામાં આવે છે.
નિરપેક્ષ અવલોકન લીધેલાં n કદનાં નિદર્શ-અવલોકનો કહેવામાં આવે છે. આ અવલોકનો પરથી p x n કક્ષાનો અવલોકન- શ્રેણિક X વ્યાખ્યાયિત કરવામાં આવે છે; જે
…(2)
X પરથી આગણનકારો જ્યાં
……..(3)
જ્યાં
(4)
(5)
અને
Z´ = (z1, z2, .., zp) જ્યાં p (6)
ઉપરનાં પરિણામોમાં ને p x 1 કક્ષાનો નિદર્શ-મધ્યક-સદિશ અને μનો અનભિનત (unbiased) આગણનકાર કહેવામાં આવે છે. p x p કક્ષાના સંમિત શ્રેણિક Sને વિશાર્ટ શ્રેણિક કે નિદર્શ-સહવિચરણ (co-variance) શ્રેણિક કહેવામાં આવે છે, જે સહવિચરણ શ્રેણિક ∑નો અનભિનત-આગણનકાર છે. નિદર્શ-સહસંબંધ શ્રેણિક R એ સહસંબંધ શ્રેણિક ∧ નો આગણનકાર છે. p ચલોના યાચ્છિક સદિશ હોય તો p-ચલીય પ્રમાણ્ય-વિતરણના ગુણધર્મો : (i) યાચ્છિક સદિશ xના ઘટકોના સુરેખ સંયોજન નું વિતરણ એકચલીય પ્રમાણ્ય-વિતરણ છે. (aના ઘટકો વાસ્તવિક સંખ્યાઓ છે.)
(ii) યાચ્છિક સદિશ xના ઘટકોના બધા ઉપગણોથી બનતા યાચ્છિક ઉપસદિશોનું વિતરણ બહુચલીય પ્રમાણ્ય-વિતરણ છે.
(iii) xi અને xj ચલો વચ્ચેનું સહવિચરણ σij = 0 હોય તો ચલો xi અને xj આંકડાશાસ્ત્રીય સંદર્ભમાં નિરપેક્ષ છે એમ કહેવાય છે; આથી ઊલટું, જો xi અને xj ચલો આંકડાશાસ્ત્રીય સંદર્ભમાં નિરપેક્ષ હોય તો σij = 0 થાય છે.
(iv) યાચ્છિક સદિશ x´નું બે ઉપસદિશો માં વિભાજન કરવામાં આવે એટલે કે . અહીં અનુક્રમે 1 x p1 અને 1 x p2 સ્વરૂપના હાર-સદિશો છે, તો આપેલા સ્તંભ-સદિશ x2માટે યાચ્છિક સ્તંભ-સદિશ x1નું શરતી p1-ચલીય પ્રમાણ્ય-વિતરણ NP1(δ,V) છે.
અહીં δ1 = μ1 + ∑12 μ´ = (μ‘1,μ‘2); ; p = p1 + p2
(v) p-ચલીય પ્રમાણ્ય-વિતરણનો વિષમતા-અંક (coefficient of skewness) 0 અને શિખરતા-અંક (coefficient of peakedness) pn+2 છે. p = 1 લઈએ તો એકચલીય પ્રમાણ્ય-વિતરણનો વિષમતા-અંક 0 અને શિખરતા-અંક 3 છે.
બહુચલીય પ્રમાણ્ય-વિતરણના ગુણધર્મોને કારણે બહુચલીય માહિતી અને તે પરથી અને S જેવા આગણનકારનાં વિતરણો મેળવી શકાય છે. નિદર્શ-મધ્યક , પ્રમાણ્ય-વિતરણ અનુસરે છે. (n-1)Sનું નિદર્શ-વિતરણ આંકડાશાસ્ત્રી જૉન વિશાર્ટે 1928માં મેળવ્યું તેથી તેને વિશાર્ટ-વિતરણ કહેવામાં આવે છે. આગણનકાર અને S નિરપેક્ષ રીતે વિતરિત છે. નિદર્શ-મધ્યક સદિશ નું વિતરણ અજ્ઞાત પ્રાચલ શ્રેણિક ∑ પર આધારિત હોવાથી સદિશ ના વિતરણનો ઉપયોગ કરી પ્રમાણ્ય સમષ્ટિના મધ્યક સદિશ μ વિશેની કોઈ પણ પરિકલ્પના(hypothesis)નું પરીક્ષણ થઈ શકે નહિ, જ્યારે નિદર્શ આગણનકાર Sનું વિતરણ, સમષ્ટિના મધ્યક સદિશ μ પર આધારિત ન હોવાથી Sનો ઉપયોગ કરી μ વિશેની કલ્પનાનું પરીક્ષણ કરી શકાય છે.
બહુચલીય પ્રમાણ્ય-વિતરણના મધ્યક સદિશનું પરિકલ્પના-પરીક્ષણ (test of hypothesis) : (i) એક-ચલીય પ્રમાણ્ય-વિતરણ N (μ,σ2)ના પ્રાચલ μ માટે પરિકલ્પના H0 : μ = μ0 વિરુદ્ધ H1 : μ ≠ μ0નું પરીક્ષણ કરવા માટે સ્ટુડન્ટ t-પરીક્ષણનો ઉપયોગ કરવામાં આવે છે. ડબ્લ્યૂ. એસ. ગોસેટ નામના આંકડાશાસ્ત્રીએ 1908માં ‘સ્ટુડન્ટ’નું તખલ્લુસ આ પરિણામને આપ્યુ. એક-ચલ પ્રમાણ્ય-વિતરણ N (μ,σ2)માંથી મેળવેલાં નિરપેક્ષ અવલોકનો (x1, x2, ….., xn) હોય તો
સાર્થકતાની કક્ષાએ જો | t | ≥ tn-1, α હોય તો નિરાકરણીય પરિકલ્પના H0નો α કક્ષાએ અસ્વીકાર કરવામાં આવે છે અને આપેલા α અને n માટે t-પરીક્ષણના વિભાજનબિંદુ tn-1, α ની કિંમત t–વિતરણના કોષ્ટકમાંથી મેળવી શકાય છે.
(ii) p-ચલીય પ્રમાણ્ય-વિતરણ માટે પરિકલ્પના-પરીક્ષણ : p-ચલીય પ્રમાણ્ય-વિતરણ Np(μ, ∑)ના પ્રાચલ સદિશ μ માટે પરિકલ્પના H0 : μ = μ0 વિરુદ્ધ H1 : μ ≠ μ0 નું પરીક્ષણ કરવા માટે T2 પરીક્ષણ આંકડાશાસ્ત્રી હેરોલ્ડ હોટેલિંગે 1931માં સૂચવ્યું.
હોટેલિંગનો T2 આગણક : p-ચલીય પ્રમાણ્ય-વિતરણ Np(x,∑) ધરાવતી સમષ્ટિમાંથી લીધેલાં n-કદનાં નિદર્શના-અવલોકનો x1, x2, …., xn હોય, મધ્યક સદિશ μનો અનભિનત-આગણક અને S સહવિચરણ ∑નો અનભિનત આગણક હોય તો T2નું આગણક સૂત્ર
અહીં μ0 પરિકલ્પના H0 હેઠળ μની નિર્દિષ્ટ કિંમત છે. સૂત્ર (2)માં p=1 મૂકીએ તો (1)માં વ્યાખ્યાયિત સ્ટુડન્ટ t–આગણકનો વર્ગ મળે છે. આમ હોટેલિંગનો T2 આગણક એ t–આગણકનું p પરિમાણી અવકાશમાં વ્યાપકીકરણ છે.
1931માં હોટેલિંગે સાબિત કર્યું કે નિરાકરણીય પરિકલ્પના (null-hypothesis) હેઠળ
અહીં Fp,n-1 એ p અને (n–1) સ્વાતંત્ર્ય-માત્રા ધરાવતું સ્નેડેકોરનું F-વિતરણ સૂચવે છે. સાર્થકતાની કક્ષા α હોય ત્યારે [(Fના વિતરણ કોષ્ટકમાંથી (α,p,n-1) માટે ] Fp,n-1,α સ્નેડેકોર કિંમત દર્શાવે છે.
હોય તો નિરાકરણીય (null) પરિકલ્પના Hpનો α કક્ષાએ અસ્વીકાર કરવામાં આવે છે.
વૈકલ્પિક પરિકલ્પના H1 હેઠળ
અકેન્દ્રીય વિતરણ ને અનુસરે છે અને
છે. દા.ત., 8 પુરુષોને અમુક દવા આપવાને કારણે તેમના લોહીની શર્કરા તથા લોહીના ઊંચા અને નીચા દ્બાણમાં થયેલા ફેરફારોની માહિતી નીચે પ્રમાણે છે :
લોહીની શર્કરા, લોહીનું ઊંચું દબાણ તથા લોહીનું નીચું દબાણ – તેમને અનુક્રમે (x1, x2, x3 વડે દર્શાવીએ તો યાચ્છિક ચલ-સદિશ x´ = (x1, x2, x3) મળે, જે 1 x 3 કક્ષાનો હાર-સદિશ દર્શાવે છે. યાચ્છિક ચલ-સદિશ x ત્રિચલ પ્રમાણ્ય-વિતરણ N3(μ,∑)ને અનુસરે છે. આ ધારણા અનુસાર કોષ્ટકમાં આપેલ બહુચલીય (અહીં ત્રિ-ચલીય) માહિતી પરથી μ અને ∑ના આગણકો અને Sની ગણતરી કરી શકાય. અર્થાત્
નિરાકરણીય પરિકલ્પના H0 : μ = 0 વિરુદ્ધ વૈકલ્પિક (alternative) પરિકલ્પના H1 : μ ≠ 0નું α = 0.05 પરીક્ષણ કરવા માટે સૂત્ર પરથી હોટેલિંગનો T2 આગણક (μ0 = 0) લેતાં T2 = n´ S-1 = 79.064 અને સૂત્ર= 18.825 અને α = 0.05, p = 3 n-p = 5 માટે સ્નેડેકોર Fના કોષ્ટક પરથી = 5.41 છે. આમ સ્પષ્ટ છે કે > F3,5,0.05 છે; તેથી α = 0.05ની કક્ષાએ નિરાકરણીય પરિકલ્પના H0નો અસ્વીકાર થાય છે. અહીં નિરાકરણીય પરિકલ્પના H0 : μ0 = 0 માં દવા આપવાથી પુરુષના લોહીની શર્કરા તથા ઊંચા અને નીચા દ્બાણમાં થતા ફેરફાર શૂન્ય છે તેનો દાવો કરવામાં આવ્યો છે; પરંતુ હોટેલિંગ T2–પરીક્ષણ પરથી જોઈ શકાશે કે નિરાકરણીય પરિકલ્પના H0નો અસ્વીકાર થાય છે; તેથી પુરુષના લોહીની શર્કરા તેમજ ઊંચા અને નીચા દ્બાણ પર દવાની અસર થાય છે એમ આપેલી બહુચલીય માહિતીના આધારે સમર્થન મળે છે.
બહુચલીય પરિસ્થિતિમાં જ્ઞાત અચલ વાસ્તવિક સંખ્યાઓના સદિશ a ≠ 0 માટે સ્નેડેકોરના પરિણામનો ઉપયોગ કરી p-ચલીય પ્રમાણ્ય સમષ્ટિના મધ્યકોના સદિશ μના સુરેખ સંયોજન a´μ માટે 100 (1-α) ટકાના વિશ્વાસાંક (coefficient of confidence) ધરાવતો વિશ્વસનીય અંતરાલ મેળવી શકાય. આ અંતરાલ માટે રૉયની યોગ-છેદ પદ્ધતિનો ઉપયોગ કરવામાં આવે છે. આ પદ્ધતિ અનુસાર પ્રત્યેક a ≠ 0 માટે a´μનો 100 (1-α) ટકાના વિશ્વાસાંક ધરાવતો વિશ્વસનીય અંતરાલ (confidence interval)
(5)
આ સૂત્ર મુજબ થશે.
અહીં છે. બોનફેરોની અસમતા દ્વારા a´ માટે મેળવેલ વિશ્વસનીય અંતરાલ (5) દ્વારા મેળવેલ અંતરાલ કરતાં લંબાઈની દ્રષ્ટિએ નાના હોય છે. પરિણામ (5) પરથી સદિશ aની વિશિષ્ટ પસંદગી માટે સમષ્ટિના મધ્યકોના સદિશ μના ઘટકો μ1, μ2, μ3 માટે 100 (1-α) ટકાના વિશ્વાસાંક ધરાવતા વિશ્વસનીય અંતરાલો મેળવી શકાય છે.
દ્વિ-નિદર્શ (double sampling) પ્રશ્ન : x ~ Np (μ1,∑) અને y ~ Np (μ2,∑) છે. વળી x1, x2, ….., xn1, p-ચલીય પ્રમાણ્ય સમષ્ટિ Np(μ1,∑)માંથી અને y1, y2, ….., yn2, p-ચલીય પ્રમાણ્ય સમષ્ટિ Np(μ2,∑)માંથી મેળવેલ યાચ્છિક નિદર્શોનાં અવલોકનો છે. બંને પ્રમાણ્ય સમષ્ટિના મધ્યક સદિશો ભિન્ન છે, જ્યારે બંનેના સહવિચરણ શ્રેણિક સરખા છે. અહીં બંને નિદર્શ-અવલોકનોને આધારે નિરાકરણીય પરિકલ્પના H0 : = વિરુદ્ધ H1 : μ1 ≠ μ2નું પરીક્ષણ કરવાનો હેતુ છે.
μ1, μ2 અને ∑ના અનભિનત આગણકો , અને છે.
અહીં અને (n2-1) છે.
આ આગણકોને આધારે પરિકલ્પના H0 હેઠળ દ્વિનિદર્શ હોટેલિંગ ……..(1)
થી વ્યાખ્યાયિત કરવામાં આવે છે. સાર્થકતાની કક્ષા α માટે જો
હોય તો નિરાકરણીય પરિકલ્પના H0 = μ1 = μ2 નો અસ્વીકાર કરવામાં આવે છે અને Fp,n1+n2-1,α, નીકિંમત α, p અને n1 + n2-1 માટે સ્નેડેકોર Fનાં વિતરણ કોષ્ટકોમાંથી મેળવી શકાય.
જ્ઞાત વાસ્તવિક સંખ્યાઓના શૂન્યેતર સદિશ a માટે
μ1 – μ2ના સુરેખ સંયોજન a´ (μ1 – μ2)ના 100(1-α) ટકા વિશ્વાસાંક ધરાવતા વિશ્વસનીય અંતરાલ
………………….(3)
અહીં
છે.
μ‘1= (μ11, μ12, ……., μ1p), μ‘2 = (μ21, μ22, ….., μ2p) અને a´ = (a1, a2, ……, ap) હોય તો ai = 1 અને aj = 0, j ≠ i = 1, 2, ……, p. માટે પરિણામ (3) પરથી μ1i – μ2i (i = 1, 2, ….., p)ના 100 (1-α)ટકા વિશ્વાસાંક ધરાવતા વિશ્વસનીય અંતરાલ મેળવી શકાય.
જો બે p-ચલીય પ્રમાણ્ય સમષ્ટિના સહવિચરણ શ્રેણિકો ∑1 અને ∑2 હોય અને n1 = n2 = n હોય તો નિરાકરણીય પરિકલ્પના H0 : μ1 = μ2નું α-કક્ષાએ પરીક્ષણ નીચે પ્રમાણે કરી શકાય.
બંને નિદર્શનાં કદ સરખાં હોવાથી આપણે યાચ્છિક ચલ-સદિશ Zi = xi – yi, i = 1, 2, ….., n વ્યાખ્યાયિત કરી શકીએ. સ્પષ્ટ છે કે i = 1, 2, ….., n માટે Zi ~ Np (μ1 – μ2, ∑1 + ∑2). સહવિચરણ અને μ1 – μ2 ના અનભિનત આગણકો અનુક્રમે ……(5) અને (n – 1)થશે. હવે નિરાકરણીય પરિકલ્પના H0 : μ1 – μ2 હેઠળ હોટેલિંગ T2,
T2 = સૂત્રથી વ્યાખ્યાયિત કરી શકાય છે. આપેલ α-કક્ષા માટે જો
T2 ≥ હોય તો નિરાકરણીય પરિકલ્પના H0 : μ1 – μ2નો અસ્વીકાર કરવામાં આવે છે. આમ બંને p-ચલીય પ્રમાણ્ય સમષ્ટિના સહવિચરણ શ્રેણિકો અસમાન હોય તોપણ બંને સમષ્ટિમાંથી સમાન કદના નિદર્શોના આધારે નિરાકરણીય પરિકલ્પના H0 : μ1 – μ2 નું પરીક્ષણ હોટેલિંગ T2ની મદદથી થઈ શકે છે. જે કિસ્સામાં p-ચલીય પ્રમાણ્ય સહવિચરણ શ્રેણિકો અને નિદર્શ-કદ બંને ભિન્ન હોય ત્યાં પરિકલ્પના H0 = μ1 = μ2 નું પરીક્ષણ કરવાના પ્રશ્નને ફિશર-બેહરેન પ્રશ્ન કહે છે. આ પ્રશ્નનો ઉકેલ યાઓએ 1965માં આપ્યો હતો.
બહુચલીય વિચરણ-પૃથક્કરણ (MANOVA) : MANOVA એ Multivariate Analysis of Variance(બહુચલીય વિચરણ પૃથક્કરણ)નું ટૂંકું રૂપ છે અને MANOVA પદ્ધતિ દ્વારા બેથી વધુ બહુચલીય સમષ્ટિઓના મધ્યક સદિશોની સમાનતાનું પરીક્ષણ થઈ શકે છે. એક-ચલીય વિચરણ-પૃથક્કરણ(univariate analysis of variance)નું MANOVA વ્યાપક સ્વરૂપ છે.
n1, n2, ….., ng વસ્તુઓને યાચ્છિક રીતે વિવિધ પ્રકારની g માવજતો t1, t2, ……, tg આપવામાં આવે છે. વસ્તુ તરીકે દર્દીઓ અને માવજત તરીકે વિવિધ પ્રકારની દવાઓ; વસ્તુ તરીકે જમીનના પ્લૉટો અને માવજત તરીકે વિવિધ પ્રકારનાં ખાતરો લઈ શકાય છે. માવજતો આપવાથી વસ્તુઓનાં વિવિધ લક્ષણો પર થતી અસરોનું અવલોકન કરી પ્રયોગને અંતે વિવિધ ચલલક્ષણો પરનાં અવલોકન કે માપ મળે છે. દર્દીઓના સમૂહો કે ભિન્ન ફળદ્રૂપતા ધરાવતી જમીનના પ્લૉટોના સમૂહોને સમષ્ટિ (population) કહેવામાં આવે છે. પ્રત્યેક સમષ્ટિના એકમ કે વસ્તુનાં p-લક્ષણો પરની માવજતને કારણે મળતાં અવલોકનોને સમષ્ટિનાં નિદર્શ-અવલોકનો કહેવામાં આવે છે. સમષ્ટિ πiના ni એકમો કે વસ્તુઓનાં p-લક્ષણોના સદિશ xi પર મળતાં અવલોકનોને xi1, xi2, ……, xini વડે દર્શાવી, g સમષ્ટિઓનાં અવલોકનોને અહીં કોઠામાં દર્શાવ્યાં છે.
ધારણાઓ : (i) p-ચલીય પ્રમાણ્ય સમષ્ટિ gમાંથી લીધેલ ni કદના નિદર્શનાં સદિશ અવલોકનો છે.
(ii) સદિશ અવલોકન
i = 1, 2, ….., ni j = 1, 2, …., g અનુસરે છે.
g સમષ્ટિઓનો સમગ્ર મધ્યક-સદિશ μ છે અને – iમી માવજતની અસર દર્શાવે છે અને અસરો શરત નું સમાધાન કરે છે. ધારણા (ii) અનુસાર i-મી p-ચલીય સમષ્ટિનો મધ્યક-સદિશ μi, સમગ્ર મધ્યક-સદિશ μ અને માવજત સદિશ ના સરવાળા બરાબર છે; અર્થાત્, …….., g નિદર્શ અવલોકનોને સદિશોના સ્વરૂપમાં આપેલી માહિતી પરથી સમષ્ટિના પ્રાચલ સદિશો μ,ના આગણકો મેળવી શકાય છે. આ આગણકોની મદદથી xij અવલોકનને સૂત્રથી દર્શાવી શકાય છે.
અહીં સમગ્ર સમષ્ટિના મધ્યક સદિશ μનો આગણક છે. i-મી માવજત નો આગણક છે; તેમજ આગણક છે. સદિશોના વર્ગો અને ગુણાકારોથી બનતા શ્રેણિક માં xijના સૂત્રનો ઉપયોગ કરવામાં આવે છે. તેથી દર્શાવેલું MANOVA કોષ્ટક પ્રાપ્ત થાય છે.
બહુચલીય વિચરણ પૃથક્કરણ (MANOVA) મૉડલ માટે નિરાકરણીય પરિકલ્પના લઈએ તો μi = μ + હોવાથી આ પરિકલ્પનાની સમતુલ્ય પરિકલ્પના H0 : μ1 = μ2 = ….. = μg = μ થશે. પરિકલ્પનાના પરીક્ષણ માટે
ઉપયોગ કરીશું. |B| અને |A+B| એ શ્રેણિકો A = (aij) અને A + B = (aij + bij)ના નિશ્ર્ચાયક દર્શાવે છે. સાર્થકતાની કક્ષા α માટે જો W < C હોય તો નિરાકરણીય પરિકલ્પના H0નો અસ્વીકાર થાય છે. અહીં વિભાજનબિંદુ C એવી રીતે નક્કી કરવામાં આવે છે કે જેથી P (W < C/H0) ≤ α છે. જો લઈએ તો p, g-1, n-g અને α ની વિશિષ્ટ કિંમતો માટે પિલ્લે અને ગુપ્તા; અને લીએ Wના વિતરણ માટેનાં કોષ્ટકો તૈયાર કરી નીકિંમતો મેળવી છે. ઉપરના પરિણામમાં દર્શાવેલ આગણક W સૌપ્રથમ વિલ્કસે 1932માં સૂચવ્યો હતો. જો n ઘણો મોટો હોય તો બતાવી શકાય કે આગણક
…..(6)નું અનંતલક્ષી વિતરણ f = p (g-1) સ્વાતંત્ર્યની માત્રા ધરાવતા x2 વિતરણને અનુસરે છે. આમ nની ઘણી મોટી કિંમત માટે નિરાકરણીય પરિકલ્પના
H0 : અથવા H0 : μ1 = μ2 = ….. = μg = μ નું α કક્ષાએ પરીક્ષણ કરવા માટે પરિણામ P ( > , α) = α….(7)નો ઉપયોગ કરી શકાય. અહીં = – f = p (g–1)ની માત્રાવાળા X2 – વિતરણ કોષ્ટકમાંથી α ની આપેલ કિંમત માટે મેળવી શકાય.
બહુચલીય સહસંબંધ અને બહુચલીય નિયત સંબંધ (regression) : p ચલ ઘટકો x1, x2, ….., xp ધરાવતા એક યાચ્છિક ચલ-સદિશ xના મધ્યક સદિશ અને સહવિચરણ શ્રેણિક અનુક્રમે μ અને ∑ છે. રજૂઆતની સરળતા ખાતર μ = 0 લઈશું.
ચલ x1 બાકીના p-1 ચલો x2, x3, ….., xp પર આધારિત છે. p ચલોનું x1 અને (x2, x3, ….., xp) – એમ બે સમૂહોમાં વિભાજન કરી શકાય. જેમાં x1 આધારિત અથવા સાપેક્ષ ચલ x2, x3, ….., xp પારસ્પરિક આયત્ત-ચલો છે. જે આયત્તતા સંબંધ-માળખાને અનુસરે છે. યાચ્છિક ચલ-સદિશ અને તેના સહવિચરણ શ્રેણિકનું
……(1)માં વિભાજન કરીશું.
અહીં
છે.
સ્વાયત્તતા સંબંધ-માળખા અનુસાર E (x1) = β2x2 + β3x3 + ….. + βpxp ……(2) લઈએ તો આ પરિણામને ચલ x1નો ચલો x2, x3, ….., xp પરનો નિયતસંબંધ કહેવામાં આવે છે અને પ્રાચલો β2, β3, …., βpને નિયત સહસંબંધાંકો કહેવામાં આવે છે. જો β‘2 = (β2, β3, …., βp) લઈએ 1 x (p–1) કક્ષાના હાર-સદિશ β′2 ના ઘટકોની કિંમત
સૂત્ર પરથી મેળવી શકાય છે.
જ્યાં ∑22 એ (p-1) x (p-1) કક્ષાનો પૂર્ણ કોટિનો શ્રેણિક હોવાથી તેનો વ્યસ્ત શ્રેણિક અનન્ય રીતે અસ્તિત્વ ધરાવે છે.
બહુચલીય સહસંબંધ (multivariate correlation) : ચલ x1 અને સદિશ x2ના ચલો વચ્ચેના સુરેખ સંબંધની પ્રબળતાને બહુચલીય સહસંબંધ (ρ1, 2, 3, ….., p) કહે છે.
બહુચલીય સહસંબંધાંક (multivariate correlation coefficient) ρ1.2.3 …..p એટલે 1 x (p-1) કક્ષાના બધા શૂન્યેતર સદિશો α´ માટે x1 અને α´ x2 વચ્ચેનો મહત્તમ સહસંબંધ છે. x1 અને સુરેખ સંયોજન α´ x2 વચ્ચેનો સહસંબંધ સદિશ α´ = λ σ‘12 થાય ત્યારે મહત્તમ થાય એ હકીકત કૉશી–સ્વાર્ઝ અસમતા અનુસાર સિદ્ધ કરી શકાય. અહીં λ શૂન્યેતર વાસ્તવિક અચલ છે. તેની કિંમત 1 લઈ શકાય. આ વ્યાખ્યા અનુસાર બહુચલીય સહસંબંધાંક
ρ1.2.3……p =
જો ચલ સદિશ x પરનાં n અવલોકનો x1, x2, …., xn પ્રાપ્ય હોય તો સહવિચરણ શ્રેણિક Σનો અનભિનત આગણક S મેળવી શકાય.
અહીં S = (sij) અને (n-1) Sij = , i = j = 1, 2, …, n છે. હવે શ્રેણિક Sનું વિભાજન કરીએ તો S = મળે છે. પ્રાચલ સદિશ β2નો આગણક થાય અને તેથી નિયત સંબંધ સમતલનો આગણક = થશે. તે જ પ્રમાણે બહુચલીય સહસંબંધાંક ρ1.2.3……pનો આગણક (estimator)
R1.2.3……p = થશે.
100 ને બહુચલીય નિર્ણાયકતાનો આંક કહેવામાં આવે છે. જો સદિશ x પરનાં નિરપેક્ષ અવલોકનો x1, x2, ….., xn, p-ચલીય પ્રમાણ્ય સમષ્ટિ Np (μ, ∑)માંથી આવતાં હોય તો પરિકલ્પના H0 : ρ1.2.3……p = 0નું પરીક્ષણ સૂત્રની મદદથી કરી શકાય છે. આમ આપેલી સાર્થકતાની કક્ષા α માટે પરિકલ્પના H0 : ρ1.2.3……p = 0નું પરીક્ષણ સ્નેડેકોરના F-વિતરણ-કોષ્ટક પરથી થઈ શકે છે.
આંશિક સહસંબંધ (partial correlation) : ધારો કે p x 1 કક્ષાના યાચ્છિક ચલ-સદિશ xનું વિતરણ p-ચલીય પ્રમાણ્ય-વિતરણ Np (μ, ∑) છે. આ ચલ-સદિશ xનું q x 1 અને (p-q) x 1 કક્ષાના બે યાચ્છિક ઉપસદિશો x1 અને x2માં વિભાજન કરીએ તો મળે.
આ વિભાજનને અનુરૂપ મધ્યક સદિશ μ અને સહવિચરણ શ્રેણિક ∑નું પણ ; વિભાજન કરી શકાય.
જો સદિશ x2 આપેલો કે જ્ઞાત હોય તો ચલ-સદિશ x1નું આપેલા x2 માટેનું શરતી વિતરણ
Nq [μ1 ……..થાય.
અહીં …..છે.
પરનું નિયતસંબંધ વિધેય કહે છે અને શ્રેણિક પરના નિયત સંબંધાંકોનો શ્રેણિક કહે છે.
ધારો કે ઘટક દર્શાવે છે. જો ને xi અને xj વચ્ચેનો p-q કક્ષાનો આંશિક સહસંબંધ કહે છે અને છે.
મેળવતી વખતે ચલો xi અને xj માંથી ચલો xq+1…., xpની અસર દૂર કરવામાં આવે છે. કેટલીક વાર આ ચલોની અસરને કારણે xi અને xj વચ્ચેનો સાદો સહસંબંધાંક rjj સંખ્યાત્મક રીતે મોટો માલૂમ પડે છે; પરંતુ આ ચલોની અસર દૂર કર્યા પછી મેળવેલ આંશિક સહસંબંધાંક પરથી ચલો xi અને xj વચ્ચે પ્રવર્તતા સાચા સહસંબંધાંકનું માપ મેળવી શકાય છે.
જો x1, x2, ….., xn p-ચલીય પ્રમાણ્ય-વિતરણ Np (μ, ∑)માંથી લીધેલાં નિરપેક્ષ અવલોકનો હોય તો નિદર્શ મધ્યક સદિશ અને નિદર્શ સહવિચરણ શ્રેણિક S પ્રમાણ્ય સમષ્ટિના પ્રાચલો μ અને ∑ના અનભિનત આગણકો થશે. અને Sનું વિભાજન કરતાં
આ પરિણામ પરથી શ્રેણિક આગણક
અહીં tn-2-(p-q) એ n-2-(p-q) સ્વાતંત્ર્ય માત્રા ધરાવતા સ્ટુડન્ટ t-વિતરણને અનુસરે છે. ઉપરના આ પરિણામનો ઉપયોગ કરી ત્ર્-કક્ષાએ નિરાકરણીય પરિકલ્પના નું પરીક્ષણ કરી શકાય છે. સર રોનાલ્ડ ફિશરે Z-પરિવર્તન સૂચવ્યું અને સાબિત કર્યું કે નિદર્શ-કદ nની મોટી કિંમતો માટે Zનું અનંતલક્ષી વિતરણ N (m, s2) છે.
ઉદાહરણ : એક શાળાના 20 વિદ્યાર્થીઓની બુદ્ધિ (x1), વજન (x2) અને ઉંમર(x3)ના માપ ઉપરથી નિદર્શ સહસંબંધ શ્રેણિક R દર્શાવ્યા પ્રમાણે મળે છે.
અહીં p = 3, q = 2 છે. શ્રેણિક Rના ઘટકો પરથી સ્પષ્ટ થાય છે કે બુદ્ધિ (x1), વજન (x2) વચ્ચેનો સાદો સહસંબંધ r12 = 0.6162 છે. આપણી સામાન્ય સમજ અનુસાર વ્યક્તિની બુદ્ધિને તેના વજન સાથે કોઈ સંબંધ હોતો નથી. r12ની કિંમત વધારે હોવાનું કારણ વિદ્યાર્થીની ઉંમરની અસર છે. ઉંમરની અસર દૂર કરીને આપણે સાદા r12ને બદલે આંશિક r12.3 મેળવીએ.
= 0.0287
આમ ચલો x1 (બુદ્ધિ) અને x2(વજન)માંથી ઉંમર(x3)ની અસર દૂર કરતાં x1 અને x2 વચ્ચેનો સાચો સહસંબંધ 0.0287 મળે છે; જે નહિવત્ છે. તેથી સામાન્ય માન્યતા અનુસાર બુદ્ધિને વજન સાથે કોઈ કાર્યકારણનો સંબંધ ન હોઈ શકે તે હકીકતને સમર્થન મળે છે.
વધુમાં બહુચલીય સહસંબંધાંક R1.23 = 0.8269 છે. તેની ગણતરી શ્રેણિક R પરથી કરી શકાય. પરંતુ x1 (બુદ્ધિ) અને x2 (ઉંમર) વચ્ચેનો સાદો સહસંબંધાંક r13 = 0.8267 હોવાથી સાપેક્ષ ચલ x1નું નિરપેક્ષ ચલો x2 (વજન) અને x3 (ઉંમર)ના આધારે પૂર્વાનુમાન કરવામાં ચલ x2નો ફાળો નહિવત્ છે. અર્થાત્ બુદ્ધિ સાથે વજનને કોઈ કાર્યકારણનો સંબંધ નથી તે સ્પષ્ટ થાય છે.
હવે આપણે નિરાકરણીય પરિકલ્પના H0 : ρ12.3 = 0ના પરીક્ષણ પરિણામ (4) ઉપરથી
= 0.1183
α = 0.05 અને સ્વાતંત્ર્યની માત્રા 17 માટે t17.05 = 2.11 છે. tની મેળવેલ કિંમત t, કોષ્ટકની કિંમત કરતાં ઓછી હોવાથી નિરાકરણીય પરિકલ્પના H0 : ρ12.3 = 0નો સ્વીકાર થાય છે.
વિહિત સહસંબંધ પૃથક્કરણ (canonical correlation analysis) : અન્વેષક અભ્યાસ(exploratory study)માં રસ ધરાવતા એક સંશોધનકાર પાસે વ્યક્તિઓનાં ઊંચાઈ, વજન, માથાની પહોળાઈ તથા લંબાઈ, હાથના કાંડાથી કોણી સુધીની લંબાઈ, કમરનો અને છાતીનો ઘેરાવો વગેરે જેવાં ભૌતિક ચલ-લક્ષણો અને વાંચવા, લખવા તથા ગણતરી કરવાની ઝડપ, પરિશીલન-શક્તિ, ભણવામાં એકાગ્રતા તથા ગ્રહણશીલતા જેવાં માનસિક ચલ-લક્ષણોનાં અવલોકનો વિવિધ એકમોમાં ઉપલબ્ધ છે. સંશોધનકારને આ ભૌતિક અને માનસિક ચલો વચ્ચે પ્રવર્તતા આંતરસંબંધો(જો હોય તો)નો અભ્યાસ કરવામાં રસ છે. આ અભ્યાસ માટે સંશોધનકાર ભૌતિક અને માનસિક ચલોનાં જુદાં જુદાં સુરેખ સંયોજનો એવી રીતે પસંદ કરે છે કે જેથી તેની વચ્ચેનો સહસંબંધ મહત્તમ થાય. જ્યારે ભૌતિક અને માનસિક ચલોની સંખ્યા ઘણી મોટી હોય ત્યારે ચલોના મહત્તમ સહસંબંધ ધરાવતી વિશાળ બહુચલીય માહિતીનું નાની સંખ્યા ધરાવતાં સુરેખ સંયોજનો દ્વારા સંક્ષેપન કરી સુરેખ સંયોજનોની મદદથી પૂર્વાનુમાનનું પરિરૂપ (model) રચવાનો સંશોધનકારનો ઉદ્દેશ છે. વાણિજ્ય, વેપાર અને અર્થશાસ્ત્ર જેવાં વ્યાવહારિક ક્ષેત્રોમાં પણ ભાવોના સૂચકાંકોની શ્રેણી અને ઉત્પાદનના સૂચકાંકોની શ્રેણી વચ્ચેના આંતરસંબંધોનો અભ્યાસ કરી વાણિજ્ય, વ્યાપારી અને આર્થિક ક્ષેત્રોમાં ભાવોના વિવિધ સૂચકાંકો અને ઉત્પાદનના વિવિધ સૂચકાંકોનાં સુરેખ સંયોજનોની મદદથી પૂર્વાનુમાન કરી શકાય છે. આમ ચલોના બે સમૂહો વચ્ચેના આંતરસંબંધનો સહસંબંધના સંદર્ભમાં અભ્યાસ કરવા માટે પ્રયોજેલી બહુચલીય આંકડાશાસ્ત્રીય પદ્ધતિને વિહિત સહસંબંધ પૃથક્કરણ (canonical correlation analysis) કહેવામાં આવે છે. આજના માહિતી-વિસ્ફોટના જમાનામાં વિહિત સહસંબંધ પૃથક્કરણની આંકડાશાસ્ત્રીય પદ્ધતિ, બહુચલીય માહિતીમાંથી યોગ્ય અર્થઘટન તારવવામાં ઘણી ઉપયોગી નીવડે છે. આ ખ્યાલ સૌપ્રથમ હેરોલ્ડ હોટેલિંગે રજૂ કર્યો હતો.
મુખ્ય ઘટક-પૃથક્કરણ : ભૌતિક અને સામાજિક માનવવિદ્યા, માનસશાસ્ત્ર અને કેળવણી જેવાં ક્ષેત્રોમાં પ્રાપ્ત થતી બહુચલીય માહિતીનું સ્વરૂપ ચલોની સંખ્યા અને વ્યાપની ષ્ટિએ ઘણું વિશાળ હોય છે; દા.ત., કોઈ એક રાજ્યની માધ્યમિક શાળાના નવમા ધોરણમાં ભણતા વિદ્યાર્થીઓએ ગુજરાતી, અંગ્રેજી, ગણિત, વિજ્ઞાન, ઇતિહાસ, ભૂગોળ, નાગરિકશાસ્ત્ર, સંગીત, ચિત્રઉદ્યોગ જેવા વિવિધ વિષયોમાં મેળવેલા, ગુણની બહુચલીય માહિતીના આધારે તેમની સમગ્ર શૈક્ષણિક કારકિર્દી વિશેનો અભ્યાસ કરવાનો રાજ્યના કેળવણી ખાતાના સંશોધન વિભાગને રસ હોય છે. માહિતીનાં ચલ-લક્ષણો (વિષયો) વચ્ચે પારસ્પરિક સ્વાયત્તતા-સંબંધ પ્રવર્તતો હોય છે, પરંતુ આ પૈકીના કયા ચલો ચલનની ષ્ટિએ મહત્ત્વના છે તે નક્કી કરવાનું કામ સરળ હોતું નથી. આ પ્રકારની બહુચલીય માહિતીનું પૃથક્કરણ કરવા માટે સંશોધક ચલોનાં એવાં સુરેખ સંયોજનો પસંદ કરે છે કે જે પરસ્પર અસહસંબંધિત હોય અને દરેકનું વિચરણ મહત્તમ હોય. મૂળ ચલોનાં સુરેખ સંયોજનો દ્વારા મળતા પરસ્પર અસહસંબંધિત ચલોને મુખ્ય ઘટકો (principal components) કહેવામાં આવે છે. આવા મુખ્ય ઘટકો મેળવવાની આંકડાશાસ્ત્રીય પદ્ધતિને મુખ્ય ઘટક-પૃથક્કરણ (principal component analysis) કહેવામાં આવે છે. મુખ્ય ઘટક-પૃથક્કરણમાં મૂળ ચલોની બહુચલીય માહિતી p x p કક્ષાના સહવિચરણ શ્રેણિકમાં ઉપલબ્ધ હોય છે. (અહીં p ચલોની સંખ્યા છે.) બહુચલીય માહિતીનું કુલ ચલન, p ચલોનાં વિચરણોના સરવાળા બરાબર હોય છે. મુખ્ય ઘટક પૃથક્કરણ દ્વારા k (< p) મુખ્ય ઘટકો એવી રીતે મેળવવામાં આવે છે કે જેનાં વિચરણો કુલ ચલનનો મોટો ભાગ આવરી લે. આમ મુખ્ય ઘટક-પૃથક્કરણનો ઉદ્દેશ, p પરિમાણી મૂળ માહિતીનું k (< p) મુખ્ય ઘટકો દ્વારા લંબચ્છેદી k પરિમાણી માહિતીમાં સંક્ષેપન કરવાનો છે. આ સંદર્ભમાં મુખ્ય ઘટક પદ્ધતિને પરિમાણ-સંક્ષેપન પદ્ધતિ પણ કહી શકાય.
મુખ્ય ઘટક-પૃથક્કરણના ઉપયોગો : (i) મુખ્ય ઘટક-પૃથક્કરણનો ઉદ્દેશ મૂળ માહિતીના અવકાશીય પરિમાણની કક્ષા pનું ચલોના લંબચ્છેદી પરિવર્તન દ્વારા કક્ષા k(< p)માં સંક્ષેપન કરવાનો છે. અવકાશીય પરિમાણની સંક્ષેપિત કક્ષા k સુનિશ્ર્ચિત થઈ ગયા પછી મુખ્ય ઘટકો y1, y2, …., ykના આધારે માહિતીનું અન્ય આંકડાશાસ્ત્રીય સંદર્ભમાં વિશ્લેષણ કરવું શક્ય બને છે. સામાન્ય રીતે મુખ્ય ઘટક-પૃથક્કરણમાં કોઈ પણ પ્રકારની વિતરણીય કે મૉડેલ સંબંધી ધારણાઓનો આધાર કે આશરો લેવામાં આવતો નથી.
(ii) ધારો કે પ્રબળ રીતે સહસંબંધિત 28 ચલો પર 10 અવલોકનો પ્રાપ્ત થાય છે (આવું અર્થશાસ્ત્રમાં ઘણી વાર બને છે.) અહીં સહસંબંધિત ચલોની સંખ્યા, અવલોકનોની સંખ્યા કરતાં ઘણી મોટી છે. અહીં નિદર્શ કદ n (= 10) ચલોની સંખ્યા p (= 28) કરતાં નાનું હોવાથી કોઈ પણ પ્રકારની આંકડાશાસ્ત્રીય અનુમાન-પદ્ધતિ લાગુ પાડી શકાય નહિ. આ સમસ્યારૂપ પરિસ્થિતિનું નિવારણ મુખ્ય ઘટક- પૃથક્કરણ દ્વારા મૂળ માહિતીના અવકાશીય પરિમાણની કક્ષા p = 28નું કક્ષા k(< 10)માં સંક્ષેપન કરવાથી થઈ શકે. આમ મૂળ ચલોનું મુખ્ય ઘટકો y1, y2, …., ykમાં આસાદન (approximation) કર્યા પછી આ મુખ્ય ઘટકોને આધારે આંકડાશાસ્ત્રીય અનુમાન-પદ્ધતિઓ લાગુ પાડી માહિતીનું વિશ્લેષણ કરી શકાય.
(iii) ચલો x1, x2, …., xpના સહવિચરણના સ્વરૂપમાં મળતી બહુચલીય માહિતીમાં સાપેક્ષમા ચલ xiના અન્ય ચલો સાથેના બહુચલીય સહસંબંધ દ્વારા પૃથક્કરણ કરવાનો અભિગમ, p ચલો વચ્ચેનો પારસ્પરિક સહસંબંધ સંખ્યાત્મક રીતે પ્રબળ હોય ત્યારે જોખમરૂપ સાબિત થાય છે. આ સમસ્યાનું નિવારણ કરવા શૃંગીય (ridge) નિયત સંબંધ જેવી કેટલીક આંકડાશાસ્ત્રીય પદ્ધતિઓ વિકસાવવામાં આવી છે. આના વૈકલ્પિક અભિગમ તરીકે મૂળ ચલો x1, x2, ……, xi-1, xi+1, ….., xpને પ્રથમ k(< p1) મુખ્ય ઘટકોમાં વ્યક્ત કરી xiનો આ મુખ્ય ઘટકો પરનો નિયતસંંબંધ લઈ બહુચલીય સહસંબંધ મેળવી શકાય.
આમ છતાં સમષ્ટિ સહવિચરણ શ્રેણિક Σ અથવા નિદર્શ સહવિચરણ શ્રેણિક S દ્વારા પ્રાપ્ત થતી બહુચલીય માહિતીમાં જો ચલો વચ્ચેના સહસંબંધો સંખ્યાત્મક રીતે નાના હોય તો મુખ્ય ઘટક-પદ્ધતિનો ઉપયોગ ઉપકારક નીવડતો નથી. ચલોના માપીય ફેરફાર કે પરિવર્તનથી મુખ્ય ઘટકો નિશ્ર્ચલ નથી એ નોંધપાત્ર છે.
ઉદાહરણ : સહવિચરણ શ્રેણિક છે.
Sના લાક્ષણિક બીજ 1 + r અને 1 – r છે. જો r > 0 હોય તો 1 + r મોટું લાક્ષણિક બીજ અને 1 – r નાનું લાક્ષણિક બીજ થશે. બીજ 1 + rને અનુરૂપ લાક્ષણિક સદિશ a’1 (a11, a21) હોય તો sa1 = (1 + r) a1 પરથી બે સમીકરણો a11 + ra12 = (1 + r)a11 અને ra11 + a21 = (1 + r) a21 મળશે. આ બંને સમીકરણો સરખાં હોવાથી બે સમીકરણો પરથી અનન્ય ઉકેલ મળતો નથી; પરંતુ પ્રતિબંધ a’1 a1 = 1નો ઉપયોગ કરવાથી ઉકેલ તરીકે a11 = a21 = લઈ શકાય. લાક્ષણિક બીજ 1 – rને અનુરૂપ લાક્ષણિક સદિશ a‘2 = (a12, a22) હોય તો a2 = 0 હોવાથી a′2 = (, –) લઈ શકાય. આમ Sના બે મુખ્ય ઘટકો y1 = અને y2 = થશે અને તેનાં વિચરણો અનુક્રમે લાક્ષણિક બીજ 1 + r અને 1 – r થશે.
જો r < 0 હોય તો Sના લાક્ષણિક બીજના ક્રમ બદલાઈ જશે અને 1 – r મોટું લાક્ષણિક બીજ થશે, તેથી મુખ્ય ઘટકો અનુક્રમે અને થશે. જો r = 0 હોય તો મુખ્ય ઘટક-પૃથક્કરણ કરવાનો કોઈ અર્થ નથી. હવે કુલ ચલન = 2 થશે. જો r = 0.6 હોય તો પ્રથમ મુખ્ય ઘટક = કુલ ચલનના ટકા ચલનને આવરી લે છે.
અવયવ-પૃથક્કરણ : અવયવ-પૃથક્કરણનો મુખ્ય ઉદ્દેશ x1, x2, ….., xp (મૂળ p ચલો)ના સહવિચરણ શ્રેણિક ∑ દ્વારા વ્યક્ત થતા સહસંબંધોને પ્રત્યક્ષ રીતે માપી ન શકાય એવા કેટલાક અનવલોકનીય ચલોમાં દર્શાવવામાં આવે છે. માપી ન શકાય તેવા આ ચલોને અવયવો કહેવામાં આવે છે.
અવયવ-પૃથક્કરણમાં મૂળ ચલોનું તેમના સહસંબંધોની પ્રબળતા અનુસાર અમુક સમૂહોમાં વર્ગીકરણ કરવામાં આવે છે, જેથી આપેલ સમૂહના ચલો વચ્ચે પ્રબળ સહસંબંધ પ્રવર્તતો હોય; પરંતુ આપેલ સમૂહના ચલો અને અન્ય સમૂહના ચલો વચ્ચેનો સહસંબંધ ઓછો અથવા નહિવત્ હોય. પ્રત્યેક સમૂહના ચલો માપી ન શકાય એવા એક અનન્ય અવયવનો નિર્દેશ કરે છે. દા.ત., અંગ્રેજી, હિંદી, ગણિત, વિજ્ઞાન અને સંગીત વગેરે વિષયોના સમૂહ માટે વિદ્યાર્થીઓને આપવામાં આવતી કસોટીઓના ગુણ વિદ્યાર્થીઓની ‘બુદ્ધિની કક્ષા’ નક્કી કરવામાં ઉપયોગી છે. ‘બુદ્ધિની કક્ષા’નો આ ચલ પ્રત્યક્ષ રીતે માપી ન શકાય તેવો ચલ છે. જ્યારે ઊંચાઈ, વજન, છાતીનો અને કમરનો ઘેરાવો, ખભાથી કોણી સુધીના હાથની ગોળાઈ જેવાં ભૌતિક લક્ષણો ધરાવતા ચલોના સમૂહ માટે મેળવેલ સંખ્યાત્મક અવલોકનો વિદ્યાર્થીઓનો શારીરિક બાંધો અથવા શરીરસૌષ્ઠવ જેવા પ્રત્યક્ષ રીતે માપી ન શકાય તેવા ચલનો નિર્દેશ કરે છે. આમ અવયવ-પૃથક્કરણનો હેતુ પ્રત્યક્ષ રીતે માપી શકાતા સહસંબંધિત ચલોના સમૂહો પરથી માપી ન શકાય તેવા ચલો વચ્ચે સંબંધ-માળખું નક્કી કરવાનો છે. અવયવ-પૃથક્કરણના માળખાને ………….(1)થી વ્યાખ્યાયિત કરવામાં આવે છે.
અવયવ-પૃથક્કરણ, મુખ્ય ઘટક-પૃથક્કરણને ઘણીબધી રીતે મળતું છે તેમજ અવયવ-પૃથક્કરણમાં અવયવો મેળવવાની પદ્ધતિ પણ મુખ્ય ઘટકો મેળવવાની પદ્ધતિને મળતી છે. બંનેનો ઉદ્દેશ મૂળ ચલોના સહવિચરણ શ્રેણિક ∑નું આસાદન કરવાનો છે. બંનેની ખૂબીઓ અને ખામીઓ લગભગ સમાન છે; તેમ છતાં અવયવ-પૃથક્કરણનો અભિગમ માળખાગત હોવાથી અવયવ-પૃથક્કરણ મુખ્ય ઘટક- પૃથક્કરણ કરતાં વધુ અર્થપૂર્ણ અને વિસ્તૃત હોય છે.
વર્ગીકરણ-પૃથક્કરણ : માનવવિદ્યાશાસ્ત્રી (human anthropologists) માનવીય ખોપરી કે જડબાના હાડકા સાથે સંકળાયેલ વિવિધ ચલો (જેવા કે ખોપરી કે જડબાની લંબાઈ, પહોળાઈ વગેરે) પરનાં અવલોકનો મેળવે છે. માનવવિદ્યાશાસ્ત્રીની સમસ્યા આપેલાં અવલોકનોના આધારે ખોપરી કે જડબાનું હાડકું પુરુષ કે સ્ત્રીનું છે તે સુનિશ્ર્ચિત કરવાની છે. તે જ પ્રમાણે ઉચ્ચ કક્ષાના વ્યાવસાયિક અભ્યાસક્રમમાં પ્રવેશ મેળવવા ઉત્સુક વિદ્યાર્થીઓની યોગ્યતાનું મૂલ્યાંકન કરવા માટે તેમને માનસિક કસોટીઓ આપવામાં આવે છે. અભ્યાસક્રમનું સંચાલન કરનાર અધિકારીની સમસ્યા માનસિક કસોટીઓમાં વિદ્યાર્થીઓએ મેળવેલા ગુણને આધારે પ્રવેશ આપવો કે કેમ તે નક્કી કરવાની છે. માનવવિદ્યા તથા શિક્ષણક્ષેત્ર ઉપરાંત અન્ય ક્ષેત્રોમાં ઉદ્ભવતા વર્ગીકરણના પ્રશ્ર્નોના ઉકેલ મેળવવા આંકડાશાસ્ત્રીએ આંકડાશાસ્ત્રીય અનુમાન સિદ્ધાંતના આધારે વિવિધ પદ્ધતિઓ વિકસાવી છે; જેથી ગેરવર્ગીકરણનું જોખમ ન્યૂનતમ હોય છે. આમ વસ્તુઓ કે વ્યક્તિઓનું તેમની સાથે સંકળાયેલા ચલોનાં અવલોકનોના આધારે એક કે તેથી વધુ વર્ગોમાં વર્ગીકરણ કરવા માટે ગેરવર્ગીકરણનું જોખમ ન્યૂનતમ હોય તે રીતે પ્રયોજેલ બહુચલીય આંકડાશાસ્ત્રીય પદ્ધતિને વર્ગીકરણ-પૃથક્કરણ પદ્ધતિ (method of discriminant analysis) કહેવામાં આવે છે. ઇજિપ્તમાં ખોદકામ કરતાં મળી આવેલ હાડપિંજરોના અવશેષો કાંસ્યયુગ કે લોહયુગના છે તે સુનિશ્ર્ચિત કરવાના પ્રશ્નના ઉકેલ માટે બર્નાર્ડે 1935માં ફિશરનો સંપર્ક સાધ્યો અને ફિશરે 1936માં સમાન સહવિચરણ શ્રેણિક ધરાવતી બે બહુચલીય પ્રમાણ્ય સમષ્ટિઓનાં વર્ગીકરણ કરવા માટે વિવેચક (discriminant) વિધેયની સંકલ્પના પ્રસ્તુત કરી.
બહુચલીય માહિતીના આલેખ અને અન્ય પદ્ધતિઓ : બહુચલીય માહિતીનું સ્વરૂપ બહુપરિમાણી હોય છે. p-ચલીય બહુચલીય માહિતીનાં સદિશ અવલોકનો x1, x2, ….., xnને p-પરિમાણી અવકાશનાં બિંદુઓ તરીકે લઈ શકાય. p = 1, 2 માટે બહુચલીય માહિતીનાં બિંદુઓ xi, i = 1, 2, ……, nનો આલેખ દોરવામાં આવે છે અને મળેલા આલેખ પરથી બિંદુઓના વિવિધ ગુચ્છનું નિરીક્ષણ કરવામાં આવે છે. જો p > 2 હોય તો માહિતીનાં બિંદુઓનું આલેખ દ્વારા નિરૂપણ કરવું મુશ્કેલ હોય છે. ત્રિ-પરિમાણી કે તેથી વધુ પરિમાણી બહુચલીય માહિતીનાં બિંદુઓ x1, x2, …….., xnનો આલેખ દોરવાની પદ્ધતિઓનો તાજેતરમાં વિકાસ થયો છે. આ પદ્ધતિઓ પૈકી 1972માં આર્નોલ્ડે વિકસાવેલ પદ્ધતિ ઉલ્લેખનીય છે. આર્નોલ્ડે p-ચલીય સદિશ ચલ x´ = (x1, x2, ……, xp)નાં ચલ-લક્ષણો xiનું ત્રિકોણમિતીય વિધેય
cos 2t +………… વ્યાખ્યાયિત કર્યું. અહીં p < t < p છે. સ્પષ્ટ છે કે fx(t)ની કિંમત વાસ્તવિક રેખા Rનો ઘટક છે. આમ x પરનાં સદિશ અવલોકનો x1, x2, …….., xn પરથી મળતી fxi(t)ની કિંમતોને રેખા Rનાં બિંદુઓ વડે આલેખી શકાય. બિંદુઓના આ આલેખને આર્નોલ્ડ-આલેખ કહે છે. આર્નોલ્ડ-આલેખનાં બિંદુઓના R-માં કેન્દ્રિત થયેલા સમૂહો કે ગુચ્છો પરથી બહુચલીય માહિતીનાં બિંદુઓ વચ્ચે રહેલ સામ્ય અને ભિન્નતાનો અભ્યાસ કરવા ગુચ્છ-પૃથક્કરણ (cluster analysis) તથા બહુ-પરિમાણી માપક્રમણ (multi- dimensional scaling) જેવી અન્ય આંકડાશાસ્ત્રીય પદ્ધતિઓ વિકસાવવામાં આવી છે.
માનસશાસ્ત્રીય ક્ષેત્રે વ્યક્તિઓને તેમના વ્યક્તિત્વનાં લક્ષણો અનુસાર વર્ગીકૃત કરવા અને શહેરી વિકાસના ક્ષેત્રે શહેરોને તેમના વસ્તી-વિષયક અને વ્યાવસાયિક લક્ષણો અનુસાર વર્ગીકૃત કરવા તેમજ બજાર-સંશોધનના ક્ષેત્રે ગ્રાહકોને તેમની વસ્તુઓ પ્રત્યેની અભિરુચિ અને માનસિક વલણો અનુસાર વર્ગીકૃત કરવા જેવા પ્રશ્ર્નોનો અભ્યાસ ગુચ્છ-પૃથક્કરણ પદ્ધતિ દ્વારા થઈ શકે છે. દેશના સુયોજિત આયોજન, વ્યાપાર અને વાણિજ્યના કેટલાક જટિલ પ્રશ્ર્નોના ઉકેલ મેળવવામાં આ પદ્ધતિઓ ઘણી ઉપયોગી માલૂમ પડી છે.
સમાપન : બહુચલીય વિશ્લેષણ માટે આંકડાશાસ્ત્રીય વિતરણ- સિદ્ધાંત અને આંકડાશાસ્ત્રીય અનુમાનની પદ્ધતિઓનો વિકાસ વીસમી સદીના પ્રથમ પાંચ દાયકાઓ દરમ્યાન થયો. બહુચલીય વિશ્લેષણના સૈદ્ધાંતિક વિકાસમાં કાર્લ પિયર્સન, રોનાલ્ડ ફિશર, વિશાર્ટ, વિલ્કસ અને ઍન્ડરસન જેવા વિદેશી અને મહાલેનોવીસ, એસ. એન. રૉય, આર. સી. બોઝ, સી. આર. રાવ અને સી. જી. ખત્રી જેવા ભારતીય આંકડાશાસ્ત્રીએ મૌલિક પ્રદાન કર્યું છે. ગુજરાતના આંતરરાષ્ટ્રીય ખ્યાતિપ્રાપ્ત આંકડાશાસ્ત્રીય સી. જી. ખત્રીએ બહુચલીય વિશ્લેષણ ક્ષેત્રે કરેલા મહત્ત્વના પ્રદાનની નોંધ અત્રે ઉલ્લેખનીય છે. ડૉ. ખત્રીએ વિશાર્ટ અને બહુચલીય-બીટા વિતરણો મેળવવાની વૈકલ્પિક રીત પ્રસ્તુત કરી. ni, Σi પ્રાચલો ધરાવતા વિશાર્ટ શ્રેણિક Si (i = 1, 2) પરથી શ્રેણિક S1S2-1ના લાક્ષણિક બીજના વિતરણ મેળવવાના પ્રશ્નની વિશદતાથી છણાવટ કરી મહત્ત્વનાં પરિણામો મેળવ્યાં. બહુચલીય વિચરણ-પૃથક્કરણના વ્યાપક સ્વરૂપ તરીકે એસ. એન. રૉય દ્વારા સૂચિત વૃદ્ધિ વક્ર મૉડેલના પ્રાચલોના આંકડાશાસ્ત્રીય અનુમાનના વણઊકલ્યા પ્રશ્ર્નોના ઉકેલ મેળવાયા. બહુચલીય અસતત વિતરણોના ક્ષેત્રે તેમણે બહુચલીય અસતત ઘાતાંકીય વિતરણ, બહુચલીય લાગ્રાંજ અને બહુચલીય સંસર્ગી વિતરણો મેળવ્યાં. દિશાયુક્ત માહિતી(directional data)ના પૃથક્કરણ માટે ઉપયોગી એવા ફિશર અને વૉન માઇઝીઝ વિતરણનાં રસપ્રદ પરિણામો મેળવ્યાં છે. તેમણે ગોલકીય અને ઉપવલીય વિતરણોના ગુણધર્મોની પણ વિશદ ચર્ચા કરી છે.
અમૃતભાઈ વલ્લભભાઈ ગજ્જર