રમતનો સિદ્ધાંત (Game Theory)

January, 2003

રમતનો સિદ્ધાંત (Game Theory)

ક્રિયાત્મક સંશોધન(operations research) માટે ઉપયોગમાં લેવાતી એક વિભાવના. રમતના સિદ્ધાંતનું બીજું નામ વ્યૂહાત્મક રમતો કે વ્યૂહરચનાનો સિદ્ધાંત પણ છે. મૂળભૂત રીતે રમત કે સ્પર્ધાઓ સાથે સંકળાયેલ આ વિષય તેની વિવિધ ઉપયોગિતાઓને કારણે વિશેષ રસપ્રદ છે. અહીં ‘રમત’ શબ્દને વ્યાપક અર્થમાં લેવાનો છે. બે ખેલાડી વચ્ચે રમાતી ચેસની રમત કે અન્ય કોઈ આંતર (indoor) કે બાહ્ય (outdoor) રમત એ તેનો સામાન્ય પર્યાય છે. તેને બે સમૂહો કે બે ટુકડી વચ્ચેની રમત (દા. ત., બે દેશ વચ્ચેની ક્રિકેટ-મૅચ) તરીકે પણ ઘટાવી શકાય. વધુ વ્યાપક અર્થમાં બે પડોશી રાજ્યો વચ્ચે ખેલાતા યુદ્ધની રમત, બે ઔદ્યોગિક પેઢીઓ વચ્ચે પોતપોતાના માલનું ઉત્પાદન અને નફો વધારવાની સ્પર્ધા વગેરે (દા. ત., તાતા કંપની અને રિલાયન્સ કંપની વચ્ચે મોબાઇલના વેચાણની સ્પર્ધા). આમ રમતના વ્યાપક સ્વરૂપને લક્ષ્યમાં રાખવાથી તેની ઉપયોગિતા અનેક રીતે વધી જાય છે.

રમતનો સિદ્ધાંત રમત સાથે સંકળાયેલો છે, પરંતુ ક્રિયાત્મક સંશોધનની જેમ તેની શોધ પણ ઘણી જૂની છે. યુદ્ધમાં બે દેશો પૈકી દરેક એવા પ્રકારની વ્યૂહરચના ગોઠવે છે કે જેથી પોતાને વધુ ફાયદો થાય. વિશ્વયુદ્ધ દરમિયાન આવા અભ્યાસો થયા હતા; જેમ કે, એક પ્રદેશ Aને જીતવા માટે બીજા પ્રદેશ B દ્વારા વિમાન મારફતે બૉંબમારો કરવાનો પ્રયાસ થાય ત્યારે વિવિધ પ્રકારનાં વિમાનો આ કાર્ય કરે છે. જેના પર હુમલો થવાનો છે તે પ્રદેશ A પોતાનું રક્ષણ કરવા ઉપરાંત સામેથી આવતા હુમલાનો પ્રતિકાર કરવા માટે પણ પ્રયત્ન કરશે. આ માટે વિમાનનાશક મિસાઇલો પોતાના પ્રદેશના અનુકૂળ ભાગોમાં ગોઠવવાનું આયોજન કરશે. પ્રદેશ Aનો આ પ્રશ્ન છે  હુમલો કરનારા પ્રદેશ Bનો પ્રશ્ન સામેના પક્ષના પ્રતિકારને લક્ષમાં રાખી વિમાનો દ્વારા બૉંબમારો કેવી રીતે કરવો કે જેથી પોતાના દુશ્મનને વધુમાં વધુ નુકસાન કરી શકાય ? આમાં આવતા અવરોધો ઘટાડી લક્ષ્ય સિદ્ધ થાય તેવી વ્યવસ્થા ગોઠવવામાં આવે તો આયોજન વિશેષ ઉપકારક બની રહે છે. બે ખેલાડી કે સમૂહોને બદલે વ્યાપક સ્વરૂપમાં અનેક ખેલાડીઓ કે સમૂહોની પણ ચર્ચા કરી શકાય. બે ખેલાડીમાં એક જીતે તો બીજો હારે – આવી પરિસ્થિતિમાં જેટલું એક જીતે તેટલું બીજો હારે એમ ગણવામાં આવે તો હારજીતનો સરવાળો શૂન્ય થાય. પરંતુ જીતના પ્રમાણમાં થતો ફાયદો ગણવામાં આવે તો અનેક હરીફો વચ્ચે રમાતી સ્પર્ધામાં હારજીતનો પરિણામી સરવાળો અશૂન્ય (non-zero) પણ બની શકે. આ રીતે જોતાં રમતના સિદ્ધાંતની વ્યાપક ઉપયોગિતા તેમજ તેનું વ્યાપક સૈદ્ધાંતિક નિરૂપણ પણ છે.

કેટલીક વ્યાખ્યાઓ : જ્યારે કોઈ બે વ્યક્તિઓ, સમૂહો, ટુકડીઓ, દેશ કે હરીફજૂથો વચ્ચે પોતાનું હિત સિદ્ધ કરવા માટે ઘર્ષણ ઊભું થતું હોય ત્યારે સ્પર્ધાની સ્થિતિ નિર્માણ થાય છે. આવી સ્પર્ધા કે રમતમાં જોડાયેલ વ્યક્તિઓને ‘ખેલાડી’ કહેવામાં આવે છે. પ્રત્યેક રમત માટેના અમુક નિયમો હોય છે અને તેને લક્ષ્યમાં રાખીને રમત રમનાર પ્રત્યેક વ્યક્તિ રમતમાં પોતાનું પ્રદાન કરે છે. ખેલાડી દ્વારા આ રીતે કરાતું પ્રદાન તે ખેલાડીની ચાલ તરીકે ઓળખાય છે. વિવિધ પ્રકારની ચાલ જે તે ખેલાડી દ્વારા ખેલાય છે. તે એવી હોય છે કે જેથી ખેલાડીને પોતાને ફાયદો થાય અથવા તેના હરીફને નુકસાન થાય. આને તે ખેલાડીની વ્યૂહરચના (strategy) કહેવાય છે. વ્યૂહરચનાને અનુલક્ષીને કરેલી ચાલને વ્યૂહાત્મક ચાલ (strategic action) કહેવાય છે. પ્રત્યેક ખેલાડીની વ્યૂહાત્મક ચાલના પરિણામ-સ્વરૂપે જે તે ખેલાડીને થતા ફાયદા કે નુકસાન તે ખેલાડીના વળતર તરીકે ઓળખાય છે. તમામ ખેલાડીઓની બધા જ પ્રકારની વ્યૂહાત્મક ચાલને અનુલક્ષીને મળતા વળતરને એક શ્રેણિક દ્વારા દર્શાવવામાં આવે તો આવા શ્રેણિકને વળતર-શ્રેણિક (pay off matrix) કહેવામાં આવે છે. પોતાના હિતને લક્ષમાં રાખીને પ્રત્યેક ખેલાડીએ કરેલી વ્યૂહરચનાના બે પ્રકાર છે : (i) સાદી (simple) વ્યૂહરચના અને (ii) મિશ્ર (mixed) વ્યૂહરચના. હંમેશાં એક જ વ્યૂહાત્મક ચાલ ખેલવી  એ એક સાદી વ્યૂહરચના છે; જેમ કે, વ્યક્તિ ચોમાસામાં હંમેશાં છત્રી કે રેઇનકોટ સાથે રાખે તેમાં કોઈ નુકસાન નથી, સિવાય કે વ્યક્તિને તે સાથે લેવાં પડે. પરંતુ સંભાવનાના કોઈ સિદ્ધાંતને આધારિત કરેલી વ્યૂહરચનાને મિશ્ર વ્યૂહરચના કહેવામાં આવે છે; જેમ કે, સિક્કો ઉછાળીને છાપ (head) આવે તો છત્રી લેવી અને કાંટો (tail) આવે તો છત્રી ન લેવી. અથવા છ બાજુવાળો પાસો (dice) ઉછાળી એકી સંખ્યા આવે તો છત્રી લેવી, પરંતુ બેકી સંખ્યા આવે તો છત્રી ન લેવી. આ પ્રકારનો નિર્ણય લેવો તે મિશ્ર વ્યૂહરચનાનું ઉદાહરણ છે. અહીં નિર્ણય કે વ્યૂહાત્મક ચાલ કોઈ સંભવિત વિધાનને અનુલક્ષીને કરવામાં આવે છે. રમતની પરિસ્થિતિ પ્રમાણે અંદાજ લગાવીને ખેલાડી સાદી કે મિશ્ર ચાલ ગોઠવી શકે છે.

રમતના સિદ્ધાંત માટેની કેટલીક શરતો : સ્પર્ધાત્મક પરિસ્થિતિ ઉદભવે ત્યારે રમાતી રમતમાં જે તે ખેલાડીએ કેવા પ્રકારની વ્યૂહાત્મક ચાલ (સાદી કે મિશ્ર) ખેલવી જોઈએ, જેના ફળસ્વરૂપે નીપજતી કુલ અસરકારકતા મહત્તમ થાય ? = આ પ્રકારનો નિર્ણય રમતના સિદ્ધાંત દ્વારા લેવામાં આવે છે. આ પ્રક્રિયા યોગ્ય રીતે થાય તે માટેની કેટલીક મૂળભૂત શરતો અહીં આપી છે :

(1) રમતમાં જોડાનારા ખેલાડીઓની સંખ્યા નિશ્ચિત અને મર્યાદિત હોય છે.

(2) રમતના નિયમો સુવ્યાખ્યાયિત અને પ્રત્યેક પ્રકારની પરિસ્થિતિ માટે નિશ્ચયાત્મક હોવા જોઈએ.

(3) પ્રત્યેક ખેલાડી સ્વતંત્ર રીતે રમી શકે છે.

(4) પ્રત્યેક ખેલાડી રમતના તમામ નિયમોથી જ્ઞાત હોવો જોઈએ.

(5) રમતમાં ખેલાતી વિવિધ પ્રકારની ચાલ બધા ખેલાડી માટે નિશ્ચિત અને સુવ્યાખ્યાયિત (welldefined) હોવી જોઈએ.

(6) પ્રત્યેક ખેલાડી પોતાની તેમજ પોતાના તમામ હરીફોની બધી જ ચાલથી માહિતગાર હોવો જોઈએ.

(7) પ્રત્યેક ખેલાડી પોતાની વ્યૂહરચના સાદી કે મિશ્ર રાખી શકે છે.

(8) પ્રત્યેક વ્યૂહાત્મક ચાલને પરિણામે જે તે ખેલાડીને કેટલું વળતર મળી શકે છે તે સુનિશ્ચિત હોવું જોઈએ અને પ્રત્યેકને તેની જાણ હોવી જોઈએ. આવું વળતર ભૌતિક સ્વરૂપમાં અથવા નાણાકીય સ્વરૂપમાં હોઈ શકે છે. (જેમ કે, પ્રથમ ક્રમ મેળવનારને ચંદ્રક કે રોકડ ઇનામ કે મોટર-બાઇક આપવામાં આવે.)

અહીં એક વિશિષ્ટ પ્રકારના રમતના સિદ્ધાંત વિશેની ચર્ચા પ્રસ્તુત છે. આ રમતમાં એક ખેલાડીને જેટલો ફાયદો થાય તેટલું જ નુકસાન તેના હરીફને થાય છે. આમ બે હરીફો વચ્ચે રમાતી આવી સ્પર્ધાને દ્વિહરીફ શૂન્ય યોગસ્પર્ધા (Two person zero sum game) કહે છે.

દ્વિ-હરીફ શૂન્ય યોગસ્પર્ધાની સમસ્યાનો ઉકેલ :

(i) સાદી વ્યૂહરચનાની પદ્ધતિ (m × n વળતર-શ્રેણિક માટે) : બે ખેલાડીઓ A અને B એક રમત રમે છે. ખેલાડી A માટે કુલ m વ્યૂહરચનાઓ છે, જેને (A1, A2, …., Am) કહીશું. ખેલાડી B માટે કુલ n વ્યૂહરચનાઓ છે, જેને (B1, B2, …, Bn) કહીશું. આ તમામ વ્યૂહરચનાઓ સાદી વ્યૂહરચનાઓ છે. ખેલાડી A તેની iમી વ્યૂહરચના Ai ખેલે તે સમયે ખેલાડી B તેની jમી વ્યૂહરચના Bj ખેલે તો તેથી Aને મળતું વળતર aij છે. (i = 1, 2, 3, … , m); j = (1, 2, 3, …, n). એક ખેલાડીને થતો ફાયદો તે બીજા ખેલાડીને થતું નુકસાન છે એ લક્ષ્યમાં રાખીને તમામ વળતરોથી બનતો વળતરશ્રેણિક P = (aij)m × n થશે.

જો aij > 0 હોય તો ખેલાડી Aને ફાયદો થશે.

aij < 0 હોય તો ખેલાડી Aને નુકસાન થશે.

aij = 0 હોય તો ખેલાડી Aને લાભ કે નુકસાન નહીં થાય.

આ પ્રમાણે વળતરશ્રેણિક P ખેલાડી Aના સંદર્ભમાં અહીં દર્શાવ્યા પ્રમાણે વ્યાખ્યાયિત છે :

હવે ખેલાડી A જ્યારે તેની iમી વ્યૂહરચના Ai ખેલે તે સમયે ખેલાડી B પોતાની B1, B2, …, Bnમાંથી ગમે તે વ્યૂહરચના ખેલી શકે છે. તે એવી ચાલ ખેલશે કે જેથી તેને થતું નુકસાન ઓછામાં ઓછું થાય. આમ તેની યોગ્ય ચાલ હશે. ખેલાડી A પોતાને મહત્તમ ફાયદો થાય તે જોશે તે માટે તે પોતાની વ્યૂહરચનાઓ A1, A2, …, Ai, …, Amમાંથી એવી ચાલ ખેલશે કે જે હોય. આ પ્રમાણે ખેલાતી બે ખેલાડીઓની વ્યૂહરચનાને પરિણામે મળતું સ્પર્ધાનું ઊર્ધ્વ મૂલ્ય = V1 = જેટલું થશે. તે જ પ્રમાણે ખેલાડી B જ્યારે તેની jમી વ્યૂહરચના Bj ખેલે તે સમયે ખેલાડી A તેની વ્યૂહાત્મક ચાલ A1, A2, …, Ai, …, Amમાંથી ગમે તે ચાલ ખેલી શકે છે. આ માટે યોગ્ય ચાલ પ્રમાણે હશે; પરંતુ B ખેલાડી પણ બુદ્ધિશાળી છે તેથી પોતાને શક્ય એટલું ઓછું નુકસાન થાય તેવી વ્યૂહાત્મક ચાલ ખેલશે કે જેના પરિણામે મળતું સ્પર્ધાનું નિમ્ન મૂલ્ય = V2 થાય. રમતના નિયમોને અનુસરીને બંને પોતપોતાના દાવ અજમાવે છે. અહીં બે શક્યતાઓ રહે છે :

(i) જો V1 = V2 થાય એટલે કે = V થાય. તે આ સ્પર્ધાનો સ્થાયી ઉકેલ છે અને તે માટેની નક્કી કરાતી વ્યૂહરચનાઓ બંને ખેલાડી માટે ઇષ્ટતમ (optimum) વ્યૂહરચનાઓ બને છે. આમ થાય ત્યારે સ્પર્ધા માટે જીનબિંદુ કે પલાણબિંદુ (saddle point) છે એમ કહેવાય છે. આખીય સ્પર્ધા માટે રમતનું મૂલ્ય V જેટલું થાય છે.

(2) જો V1 ≠ V2 હોય તો સ્પર્ધાનો સ્થાયી ઉકેલ મળતો નથી. એટલે કે સાદી વ્યૂહરચનાને બદલે મિશ્ર વ્યૂહરચનાનો ઉપયોગ કરવો પડે.

ઉદાહરણ (1) : બે ખેલાડીઓ માટેની વ્યૂહરચનાઓ અને તેનો વળતર-શ્રેણિક અહીં આપેલાં છે :

અહીં દર્શાવ્યા પ્રમાણે,

∴ V1 = V2 = V = 10 થશે. અહીં વળતર શ્રેણિકમાં 10 એવી સંખ્યા છે કે જે પોતાની પંક્તિમાં લઘુતમ અને પોતાના સ્તંભમાં મહત્તમ છે. જે દર્શાવે છે કે સ્પર્ધાને જીનબિંદુ છે, તેથી સ્થાયી ઉકેલ મળશે. ખેલાડી Aની ઇષ્ટતમ વ્યૂહરચના A2 છે, જ્યારે ખેલાડી Bની ઇષ્ટતમ વ્યૂહરચના B2 છે અને સ્પર્ધાનું મૂલ્ય 10 થશે.

મિશ્ર વ્યૂહરચના : (2 × 2 શ્રેણિક માટે)

એક વિશિષ્ટ પરિસ્થિતિમાં ખેલાડી A અને B માટે માત્ર બે જ વ્યૂહરચનાઓ (A1, A2) અને (B1, B2) છે. વળતરશ્રેણિક P = થશે. જો જીનબિંદુ અસ્તિત્વ ન ધરાવતું હોય તો વ્યૂહરચનાઓ મિશ્ર વ્યૂહરચનાઓ થશે. આ માટેની સંભાવનાઓ અહીં દર્શાવી છે :

ખેલાડી A તેની વ્યૂહરચના A1 ખેલે તે માટેની સંભાવનાને p કહીએ, ખેલાડી B તેની વ્યૂહરચના B1 ખેલે તે માટેની સંભાવનાને q કહીએ તો દર્શાવ્યા પ્રમાણેનો વળતર-શ્રેણિક અને અનુવર્તી સંભાવનાઓ મળશે.

ખેલાડી A તેની વ્યૂહરચના A1 કે A2 ખેલે ત્યારે ખેલાડી B તેની ચાલ B1 ખેલે ત્યારે ખેલાડી Aનું અપેક્ષિત વળતર = pa11 + (1p) a21 થશે, તેને બદલે જો ખેલાડી A તેની ચાલ A1 કે A2 ખેલે પરંતુ ખેલાડી B તેની ચાલ B2 ખેલે તો

ખેલાડી Aનું અપેક્ષિત વળતર = pa12 + (1 – p)a22 થશે. આ બન્ને વળતરો સમાન થવાં જોઈએ, તેથી

pa11 + (1 – p) a21 = pa12 + (1 – p) a22 થશે (0 < P),

જેમાંથી    થશે.

તે જ પ્રમાણે ખેલાડી B માટે ગણતાં

ખેલાડી Bનું અપેક્ષિત વળતર

= a11 q + q12 (1 – q) = a21 q + a22 (1 – q), (0 < q < 1)

તે પરથી q = થશે.

p અથવા qની આ કિંમતો જે તે ખેલાડી માટેના અપેક્ષિત વળતરમાં મૂકતાં રમતનું મૂલ્ય મળે છે. તેના માટેનું સૂત્ર

છે.

ઉદાહરણ (2) : બે ખેલાડી A અને B માટેનો વળતર-શ્રેણિક અહીં દર્શાવ્યા પ્રમાણે છે :

અહીં અગાઉના ઉદાહરણની માફક V1 ≠ V2 તેથી જીનબિંદુ મળતું નથી; માટે મિશ્ર રચના વપરાશે. અગાઉનાં સૂત્રો પ્રમાણે a11 = 7, a21 = -5, a12 = -2, a22 = 9ની કિંમતો p અને q માટેનાં સૂત્રોમાં મૂકતાં  મળે છે.

આમ (i) ખેલાડી A માટેની ઇષ્ટતમ વ્યૂહરચના

(ii) ખેલાડી B માટેની ઇષ્ટતમ વ્યૂહરચના મળે છે. અને

(iii) સ્પર્ધાનું મૂલ્ય   થાય છે.

મિશ્ર વ્યૂહરચના (m × n શ્રેણિક માટે)

અગાઉ દર્શાવેલી પરિસ્થિતિમાં (m × n) શ્રેણિક માટે ઉકેલ માટેનું વ્યાપક સૂત્ર મેળવવું મુશ્કેલ છે.

m ×n શ્રેણિક માટે આધિપત્યના નિયમો (Rules of dominance) વાપરીને શક્ય હોય ત્યાં શ્રેણિક્ધો નાનો બનાવવાથી જો તે સ્થાયી ઉકેલ આપે તો મેળવી શકાય અથવા જો તે 2 × 2 શ્રેણિકમાં પરિવર્તન પામે તો પણ ઉકેલ મળી શકે. આને બદલે આવી પરિસ્થિતિના ઉકેલ માટે રમતની સમસ્યાનું સુરેખ આયોજનની સમસ્યામાં નિરૂપણ કરીને તે રીતે ઉકેલ મેળવી શકાય. 2 ×n શ્રેણિક માટે આલેખની રીતનો ઉપયોગ કરીને પણ ઉકેલ મેળવી શકાય. હવે રમતના સિદ્ધાંતનું શુદ્ધ ગાણિતિક સ્વરૂપ અને વ્યાખ્યાઓ સમજી શકાય તે રીતે સિદ્ધાંત-સંક્ષેપમાં રજૂઆત આ પ્રમાણે છે : સ્પર્ધાની સમસ્યાનું ગાણિતિક સ્વરૂપ સમજવા માટે કેટલાક મૂળભૂત ખ્યાલો અને સંકેતો સમજવા જરૂરી છે :

સ્પર્ધા(રમત)નો શ્રેણિક : G : m ×n ક્રમવાળા શ્રેણિક્ધો સ્પર્ધાનો શ્રેણિક કહે છે. આવા શ્રેણિકની i-મી હાર અને j-માં સ્તંભમાં આવતો ઘટક ખેલાડી A જ્યારે i-મી વ્યૂહરચના અને ખેલાડી B તેની j-મી વ્યૂહરચના વાપરે (i = 1, 2, … , m; j = 1, 2, …, n) ત્યારે મળતું વળતર દર્શાવે છે. આમ રમતનો શ્રેણિક એ એક વળતર-શ્રેણિક છે.

મિશ્ર વ્યૂહરચનાનો સદિશ : p´ : 1 × m એક એવો સદિશ છે, જેમાં એક હાર અને m સ્તંભ આવેલા છે, આ બધા ઘટકોથી બનતો સદિશ સંભાવના-સદિશ છે. (એટલે કે આના તમામ ઘટકો અઋણ છે અને તેમનો સરવાળો 1 થાય છે.) આવો સદિશ ખેલાડી A માટેની મિશ્રવ્યૂહ રચના દર્શાવે છે. તે જ પ્રમાણે q = n × 1 એક એવો સદિશ છે, જેમાં n હાર અને 1 સ્તંભ આવેલાં છે. આ બધા ઘટકોથી બનતો સદિશ પણ સંભાવના-સદિશ છે. આવો સદિશ ખેલાડી B માટેની મિશ્ર વ્યૂહરચના દર્શાવે છે.

સ્પર્ધાનું મૂલ્ય અને ઇષ્ટતમ વ્યૂહરચનાઓ :

ધારો કે V´ = (V, V1, …., V) = 1 × m એક હાર (row) સદિશ છે અને એક સ્તંભ (columm) સદિશ છે, જેમાં V એક વાસ્તવિક સંખ્યા છે. અહીં V ને સ્પર્ધા(રમત)નું મૂલ્ય કહીશું અને બે મિશ્ર વ્યૂહરચનાઓ P´° = 1  × m અને q° = n  × 1ને ખેલાડી A અને B માટેની ઇષ્ટતમ વ્યૂહરચનાઓ કહીશું. જો અહીં દર્શાવેલી અસમતાઓ

P´° G  ≥ V´ અને Gq° ≤ V સંતોષાય તો પ્રથમ અસમતા મહત્તમીકરણ માટેના ખેલાડી A માટે છે, જ્યારે બીજી અસમતા ન્યૂનતમીકરણ માટેના ખેલાડી B માટે છે.

સુનિશ્ચિત સ્પર્ધા(રમત)નો શ્રેણિક :

G : m × n ક્રમવાળો સ્પર્ધાનો શ્રેણિક, સુનિશ્ચિત શ્રેણિક ત્યારે જ કહેવાય જ્યારે તેની i-મી હાર અને j-મા સ્તંભમાં આવતો ઘટક aij એ તેની i-મી હારનો ન્યૂનતમ ઘટક અને j-મી હારનો મહત્તમ ઘટક હોય. અગાઉ આપેલી વ્યાખ્યાઓને આધારે એ સ્પષ્ટ છે કે મિશ્ર વ્યૂહરચના સાદી વ્યૂહરચના ત્યારે જ બને કે જ્યારે આ માટેના સંભાવના-સદિશોમાં કોઈ એક ઘટક 1 હોય અને અન્ય ઘટકો શૂન્ય. રમતના સિદ્ધાંતને અનુલક્ષીને કેટલાંક પ્રમેયોનાં માત્ર વિધાનો અને પરિણામો નીચે આપેલાં છે :

કેટલાંક પ્રમેયો :

પ્રમેય (1) : જો G : m × n રમતનો શ્રેણિક હોય, જેના માટે સ્પર્ધાનું મૂલ્ય અને ઇષ્ટતમ વ્યૂહરચનાઓ અસ્તિત્વ ધરાવતી હોય તો સ્પર્ધાનું આવું મૂલ્ય અનન્ય થાય છે.

પ્રમેય (2) : રમતના શ્રેણિક G માટે ઇષ્ટતમ વ્યૂહરચનાઓ P´° અને q° હોય અને સ્પર્ધાનું મૂલ્ય V હોય તો P´° G q° = V છે.

નોંધ : આ પ્રમેય પરથી ફલિત થાય છે કે સ્પર્ધાનું મૂલ્ય, બે ખેલાડીઓની ઇષ્ટતમ વ્યૂહરચનાઓથી મળતું એકંદર અપેક્ષિત વળતર છે.

પ્રમેય (3) : દ્વિ-હરીફ શૂન્યયોગ સ્પર્ધા માટે ખેલાડીઓ માટેની બે ભિન્ન ઇષ્ટતમ વ્યૂહરચનાઓના બહિર્મુખ સંયોજનથી મળતી વ્યૂહરચનાઓ પણ ઇષ્ટતમ જ થાય છે, જેમાં સ્પર્ધાનું મૂલ્ય બદલાતું નથી.

પ્રમેય (4) : રમતના શ્રેણિકના તમામ ઘટકોમાં કોઈ એક સંખ્યા ઉમેરવાથી રમતની ઇષ્ટતમ વ્યૂહરચનાઓ બદલાતી નથી અને સ્પર્ધાનું મૂલ્ય અગાઉના મૂલ્ય કરતાં ઉમેરેલી સંખ્યા જેટલું વધારે થાય છે.

પ્રમેય (5) : રમતના સિદ્ધાન્તનું મૂળભૂત પ્રમેય : પ્રત્યેક રમતના શ્રેણિક માટે હંમેશાં ઉકેલ-અસ્તિત્વ ધરાવે છે.

અગાઉનાં પ્રમેયોની મદદથી આ પ્રમેયની સાબિતી આપી શકાય. આ પ્રમેયને રમતની સમસ્યાના સુરેખ આયોજનની સમસ્યામાં થતા રૂપાંતર તરીકે પણ ઓળખી શકાય છે. આવા રૂપાંતરને સમજવા માટે આપેલું ઉદાહરણ (3) ઉપયોગી નીવડશે.

ઉદાહરણ (3) : બે ખેલાડીઓ માટેની સ્પર્ધા માટેનો શ્રેણિક  છે. ખેલાડી Aની વ્યૂહરચનાઓની સંભાવનાને p1 p2 p3 વડે તેમજ ખેલાડી Bની વ્યૂહરચનાઓની સંભાવનાને q1,

અસમાનતાઓ મળે છે. અહીં V અજ્ઞાત છે. હવે p´1 = (i = 1, 2, 3) અને q´j =  (j = 1, 2, 3) મૂકીએ તો રમતની સમસ્યાનું સુરેખ આયોજન અને તેની દ્વન્દ્વ-સમસ્યામાં રૂપાંતર થાય છે.

 

મૂળ પ્રશ્ર્ન ખેલાડી A

દ્વન્દ્વ પ્રશ્ર્ન ખેલાડી B

1, p´2, p´3 એવો મેળવો કે 1, q´2, q´3 એવો મેળવો કે
જેથી f = p´1 + p´2 + p´3 જેથી g = q´1 + q´2 + q´3
ન્યૂનતમ થાય. નીચેની શરતોને મહત્તમ થાય. નીચેની સમતાઓને
આધીન રહીને આધીન રહીને
7p´1 + p´2 2p´3 ≥ 1 7q´1 + 3q´2 + 2q´3 ≤ 1
3p´1 + 5p´2 + 7p´3 ≥ 1 1 + 5q´2 4q´3  ≤ 1
2p´1 + 4p´2 + 9p´3 ≥ 1 2q´1 + 7q´2 + 9q´3 ≤ 1
1 ≥ 0, p´2 ≥ 0, p´3 ≥ 0 1 ≥ 0, q´2 ≥ 0, q´3 ≥ 0

સુરેખ આયોજનનો ઉકેલ શોધવાની સિમ્પ્લેક્સ-પદ્ધતિનો ઉપયોગ કરીને આ પ્રશ્ર્ન ઉકેલી શકાય છે :

ઉપયોગ વડે pi´ અને qj´ મળવાથી V પણ મળે છે અને આમ સ્પર્ધાનો ઉકેલ મળી શકે છે.

ઉદાહરણ (4) : એક શહેરમાં બે મોટા ડિપાર્ટમેન્ટલ સ્ટોર આવેલા છે. બંને સરખા વિખ્યાત છે તેમજ ગ્રાહકોની સંખ્યા પણ બેઉ વચ્ચે સમાન પ્રમાણમાં વહેંચાયેલી છે. દિવાળીના તહેવારો દરમિયાન ઘરાકી અને વકરો વધારવા માટે બંને સ્ટોર વાર્ષિક વેચાણમાં વળતર માટેની યોજનાઓ ઘડે છે. ગ્રાહકોને આકર્ષવા પોતાની જાહેરાતો વર્તમાનપત્ર દ્વારા, રેડિયો દ્વારા અને ટેલિવિઝન દ્વારા આપે છે. સ્ટોર A એ ગ્રાહકોની પસંદગીનું વલણ જાણીને પોતાના માટેનો વળતર-શ્રેણિક અહીં દર્શાવ્યા પ્રમાણે મેળવ્યો છે, જેમાં શ્રેણિકના ઘટકો ગ્રાહકોની સંખ્યામાં થતો વધારો કે ઘટાડો દર્શાવે છે :

ગ્રાહકોમાં ઘટાડો બીજા સ્ટોરમાં થાય છે એમ માનીને બંને સ્ટોર પોતપોતાની ઇષ્ટતમ વ્યૂહરચના કેવી રાખી શકે તે નક્કી કરો. (વ્યૂહરચનાઓ 1 → છાપું, 2 → રેડિયો, 3 → ટી.વી.)

ઉકેલ : સૌપ્રથમ વળતર-શ્રેણિકના તમામ ઘટકો ધન (+) બનાવીએ. આ માટે ગમે તે સંખ્યા (દા. ત., 70) શ્રેણિકના તમામ ઘટકોમાં ઉમેરીએ તો નવો શ્રેણિક નીચે દર્શાવ્યા પ્રમાણે મળશે :

અહીં સ્ટોર B માટે વ્યૂહરચના B3 દરેક સંજોગોમાં B1 કરતાં વધુ લાભદાયી છે, માટે B કદી B1 અખત્યાર નહિ કરે. B1ને દૂર કરતાં નવો શ્રેણિક મળે છે; પરંતુ સ્ટોર A માટે વ્યૂહરચના A3 તે A2 કરતાં વધુ લાભદાયી છે, માટે A2ને દૂર કરતાં નવો શ્રેણિક મળે છે. 2 × 2ની આ રમત માટે જીનબિંદુ નથી, તેથી અગાઉની રીતની જેમ ઉકેલ મળશે.

 V´ = 110.67

તેથી મૂળ સમસ્યા માટે સ્પર્ધાનું મૂલ્ય = V = V´ −  K

        = 110.67 − 70

        = 40.67

        = 41 છે.

કેટલાંક પરિણામો

રમતના સિદ્ધાંતને અનુલક્ષીને કેટલાંક રસપ્રદ પરિણામો અહીં આપ્યાં છે, જેને સરળતાથી સાબિત કરી શકાય છે :

(1) રમતનો શ્રેણિક જો વિષમ સંમિત શ્રેણિક હોય તો સ્પર્ધાનું મૂલ્ય શૂન્ય થાય છે.

(2) રમતનો શ્રેણિક જો G : m × n હોય તો તેના તમામ ઘટકો 1 હોય (એટલે કે G = E) તો સ્પર્ધાનું મૂલ્ય 1 થાય છે.

(3) રમતનો શ્રેણિક છે : (અ) જો a, b, c ત્રણેય સમાન ચિહ્નવાળો ન હોય તો સ્પર્ધાનું મૂલ્ય શૂન્ય થશે.

(બ) જો a, b, c ત્રણેય સમાન ચિહ્નવાળા હોય તો ખેલાડી A ઇષ્ટતમ વ્યૂહરચના થશે અહીં

D = ab + bc + ca છે. a, b, c ત્રણેય ધન હોય તો સ્પર્ધાનું મૂલ્ય ધન અને a, b, c ત્રણેય ઋણ હોય તો સ્પર્ધાનું મૂલ્ય ઋણ મળશે.

(4) રમતનો શ્રેણિક   છે.

(અ) જો a અને b બંને ધન કે બંને ઋણ હોય તો જીનબિંદુ અસ્તિત્વ ધરાવે છે.

(બ) જો b અને c બંને ધન હોય કે ઋણ હોય તો પણ જીનબિંદુ અસ્તિત્વ ધરાવે છે.

(ક) જો a > 0, b < 0 અને c > 0 હોય તો ખેલાડી Aની ઇષ્ટતમ વ્યૂહરચના થશે જ્યાં H = a  b + c છે.

(ડ) જો a < 0, b > 0 અને c > 0 હોય તો પણ ખેલાડી A માટેની (ક)ની વ્યૂહરચનાઓ ઇષ્ટતમ થશે.

(ઇ) ગમે તે પરિસ્થિતિમાં સ્પર્ધાનું મૂલ્ય શૂન્ય થાય છે.

ભરત જાની