စစ်တုရင်ကစားနည်းကို လေးနာရီအတွင်း မိမိဘာသာလေ့လာသင်ယူကာ ကမ္ဘာ့စစ်တုရင်ချန်ပီယံပရိုဂရမ်ကို အနိုင်ယူလိုက်တဲ့ AlphaZero

date_range 12 December 2017

စစ်တုရင်ကစားနည်းကို လေးနာရီအတွင်း မိမိဘာသာလေ့လာသင်ယူကာ ကမ္ဘာ့စစ်တုရင်ချန်ပီယံပရိုဂရမ်ကို အနိုင်ယူလိုက်တဲ့ AlphaZero

visibility 1800 Views

                Google ရဲ့ DeepMind ကုမ္ပဏီကနေ တီထွင်လိုက်တဲ့ AlphaZero လို့ အမည်ပေးထားတဲ့ Artificial Intelligence (AI) Program တစ်ခုဟာ ကမ္ဘာ့အကောင်းဆုံး Chess Engine လို့ ၂၀၁၄ ခုနှစ်ကတည်းက သတ်မှတ်ခံထားရတဲ့ Stockfish 8 ဆိုတဲ့ Program ကို အနိုင်ရရှိသွားပြီ ဖြစ်ပါတယ်။ AlphaZero ဟာ စစ်တုရင်ကစားနည်းကို  လေးနာရီအတွင်းမှာ မိမိဘာသာ လေ့လာပြီး အောင်ပွဲ ဆင်နိုင်ခဲ့တာ ဖြစ်ပါတယ်။

                ဒီ AI ဟာ နှယ်နှယ်ရရတော့ မဟုတ်ပါဘူး။ ၂၀၁၇ ခုနှစ် မေလကတည်းက တရုတ်ရိုးရာ ဂိုကစားနည်းမှာ ကမ္ဘာ့အတော်ဆုံး လူသားချန်ပီယံကို အနိုင်ရခဲ့ပါသေးတယ်။ အဲ့တုန်းက AlphaGo နာမည်နဲ့ ကစားခဲ့တာ ဖြစ်ပါတယ်။ အခုဒီ AlphaZero ကတော့ ဂိုကစားနည်းအပြင် တစ်ခြားကစားနည်းတွေကိုပါ သင်ယူနိုင်ဖို့ AlphaGo ကို ထပ်မံအဆင့်မြှင့်မွမ်းမံထားတဲ့ AI ပဲ ဖြစ်ပါတယ်။

                Cornell University ကနေ ပြုလုပ်တဲ့ သုတေသနစာတမ်းတစ်ခုက ဒီ AlphaZero ဟာ ကစားပွဲ ၁၀၀ လုံးကို နိုင်ရင်နိုင် မနိုင်ရင်လည်း သရေ ရလဒ်ကို ရရှိခဲ့တယ်လို့ ဆိုထားပါတယ်။

“AlphaZero ဟာ တစ်ခြား AI တွေလို ကြိုတင်စီမံထားတဲ့ ကစားကွက်တွေနဲ့ သင်ကြား (train) စရာမလိုပါဘူး။ ကစားနည်းရဲ့ အခြေခံစည်းမျဉ်းတွေကိုသာ သင်ကြားပေးလိုက်ရုံပါပဲ။ ဘယ်လိုကစားရမယ်ဆိုတာ သင်ယူတတ်မြောက်သွားပြီးတဲ့နောက်မှာတော့ AlphaZero ဟာ ကိုယ့်ဘာသာ ဂိမ်းတွေ ဆော့ပြီးလေ့ကျင့်ပါတော့တယ်။ ၂၄ နာရီအတွင်းမှာပဲ လူသားတွေထက် သာလွန်တဲ့ ဂိမ်းကစားတဲ့စွမ်းရည်ကို ရရှိသွားပါတယ်။ ဒါဟာ စစ်တုရင်ကစားနည်းတစ်မျိုးတည်း အတွက် မဟုတ်ပါဘူး။ ဂျပန်ရိုးရာ shogi ကစားနည်းနဲ့ ဂိုကစားနည်းတို့မှာလည်းပဲ ချန်ပီယံဖြစ်ဖို့ ၂၄ နာရီပဲ သင်ယူလိုက်ရပါတယ်။ ကစားနည်းတိုင်းမှာ ပြိုင်ဘက်တွေကို အနိုင်ရပြီး ချန်ပီယံဖြစ်ခဲ့ပါတယ်”

                လို့ အထက်ပါသုတေသနစာတမ်းကို ပြုစုသူလည်းဖြစ် DeepMind ကို တည်ထောင်သူလည်းဖြစ်တဲ့ Demis Hassabis က ဆိုထားပါတယ်။ ဒါ့အပြင် သူဟာ အသက် ၁၃ နှစ်ကတည်းက စစ်တုရင်ကစားနည်းမှာ Master အဆင့်ထိ ရောက်အောင် ထူးချွန်ခဲ့တဲ့သူ ဖြစ်ပါတယ်။

“တကယ်လို့ AlphaGo ရဲ့ မျိုးဆက်အနေနဲ့ ဒီ AlphaZero AI ဟာ အရမ်းကို တော်နေမယ်လို့ ကျွန်တော်တို့ မျှော်လင့်ထားရင်တောင်မှ ဒါဟာ တော်တော်လေးကို ထူးခြားတဲ့ အောင်မြင်မှုတစ်ခုပဲ ဖြစ်ပါတယ်” လို့ ကမ္ဘာ့စစ်တုရင်ချန်ပီယံဟောင်းတစ်ဦးဖြစ်သူ Garry Kasparov က chess.com ကို ဆိုပါတယ်။ “လူသားတွေရဲ့ နည်းပေးသင်ကြားမှု မပါဝင်ဘဲ စက်တွေ စစ်တုရင်ကစားနိုင်ဖို့ရာ အတွေ့အကြုံတွေ အများကြီးလိုအပ်မယ်လို့ ကျွန်တော်တို့ အမြဲယူဆထားပါတယ်”

                လို့လည်း သူကဆိုပါတယ်။

                ကွန်ပျူတာတွေဟာ လူသား စစ်တုရင်ချန်ပီယံကို အောင်မြင်ခဲ့တာ ဒါဟာ ပထမဆုံးအကြိမ် မဟုတ်ပါဘူး။ လွန်ခဲ့တဲ့ အနှစ် (၂၀) လောက်ကဖြစ်တဲ့ ၁၉၉၇ ခုနှစ် မေလ ကတည်းက IBM ရဲ့ Deep Blue စူပါကွန်ပျူတာဟာ ကမ္ဘာ့စစ်တုရင် ချန်ပီယံကို အနိုင်ယူနိုင်ခဲ့တာ ဖြစ်ပါတယ်။

                AlphaZero နဲ့ တစ်ခြား AI တွေရဲ့ ကွာခြားချက်ကတော့ AlphaZero ဟာ ကစားနည်းစည်းမျဉ်းတွေကလွဲလို့ တစ်ခြားတစ်စုံတစ်ရာကို လူသားတွေက စက်ထဲထည့်သွင်းပေးရတာမျိုး မရှိတာပဲလို့ DeepMind ဌာနက ဆိုထားပါတယ်။ အဲ့ဒီအစား AI က သူ့ဘာသာသူ ဆော့ရင်း ဆော့ရင်းနဲ့ ချန်ပီယံအဆင့်ထိ ကျွမ်းကျင်တတ်မြောက်သွားတာ ဖြစ်ပါတယ်။ ရလဒ်အနေနဲ့ AlphaZero AI ဟာ ဘယ်အကွက်ရွေ့မလဲ စဉ်းစားတွက်ချက်ရာမှာ လူသားနဲ့ ပိုနီးစပ်လာပါတယ်။ အကြောင်းကတော့ Stockfish ဟာ တစ်စက္ကန့်အတွင်း ရွေ့နိုင်တဲ့အကွက်ပေါင်း သန်း ၇၀ အထိ တွက်ချက်ပေမယ့် AlphaZero ကတော့ တစ်စက္ကန့်ကို အကွက် (၈) သောင်းအထိပဲ တွက်ချက်တာ ဖြစ်ပါတယ်။

                ပွဲစဉ် ၁၀၀ မှာ AlphaZero ဟာ အဖြူအကွက်ကနေ စရွေ့တဲ့ပွဲ ၂၅ ပွဲနဲ့ အမည်းကွက်ကနေ စရွေ့တဲ့ပွဲ ၃ ပွဲတို့မှာ အနိုင်ရခဲ့ပြီးတော့ ကျန် ၇၂ ပွဲမှာတော့ သရေကျခဲ့ပါတယ်။ ဒါ့အပြင် AlphaZero ဟာ ဂျပန်ရိုးရာ shogi ဂိမ်းမှာ ဦးဆောင်နေတဲ့ Elmo ဆိုတဲ့ ပရိုဂရမ်ကိုလည်း ပွဲစဉ် ၁၀၀ ပြိုင်ပွဲ အနိုင်ရခဲ့ပါသေးတယ်။ အဲ့လိုအနိုင်ရဖို့ AlphaZero အနေနဲ့ လေ့ကျင့်ချိန် (၂) နာရီသာ ယူခဲ့ပါတယ်။

                ဒါ့အပြင် AlphaZero ဟာ သူ့ရဲ့နောင်တော်ဖြစ်တဲ့ AlphaGo ကို ဂိုကစားပွဲမှာ အနိုင်ရခဲ့ပြန်ပါသေးတယ်။ ဒီတစ်ခါတော့ ၈ နာရီအကြာ မိမိဘာသာ လေ့ကျင့်မှု အပြီးမှာ အနိုင်ရခဲ့တာ ဖြစ်ပါတယ်။ ပွဲ ၁၀၀ မှာ ပွဲ ၆၀ အနိုင်ရပြီးတော့ ကျန် ပွဲ ၄၀ မှာတော့ ရှုံးနိမ့်ခဲ့ပါတယ်။ ဒါဟာ စုစုပေါင်းအနေနဲ့ နိုင်တယ်လို့ ဆိုလို့ရပါတယ်။ 

                ကျွမ်းကျင်သူတွေက AlphaZero ရဲ့ ရလဒ်တွေအပေါ် အံ့သြချီးမွမ်းနေကြပေမယ့် University of Bath က ကွန်ပျူတာသိပ္ပံပညာရှင်နဲ့ AI သုတေသနပညာရှင်ဖြစ်တဲ့ ပါမောက္ခ Joanna Bryson ကတော့ ဒီကစားနည်းတွေဟာ ဘယ်အကွက်ကို ရွေ့ရင် ဘာဖြစ်မယ်ဆိုတာ သိနေတဲ့၊ ပြီးတော့ ရွေ့စရာ အကွက်နည်းနည်းလေးသာ ရှိတဲ့ လုပ်ဆောင်ချက် (discrete task) တစ်ခုသာ ဖြစ်တယ်လို့ သတိပေးထားပါတယ်။ တကယ့်ဘဝမှာတော့ မရေရာမသေချာမှုတွေ၊ ရွေ့စရာအကွက်တွေ အရမ်းများတယ်လို့ သူက ဆိုပါတယ်။ ဘာပဲဖြစ်ဖြစ် AI တွေရဲ့ အနာဂတ်အခန်းကဏ္ဍ တဖြည်းဖြည်း ကြီးမားလာပြီ ဆိုတာကတော့ ဘယ်သူမှ ငြင်းလို့မရပါဘူး။

This Article is Contributed by IT Man
References
The Guardian
About Author
Assinged Tags
Google Artificial Intelligence Machine Learning AI AlphaGo AlphaZero Deep Learning DeepMind
Categorized Under
News

Join Us On

Facebook
YouTube
Twitter
GooglePlus
TechX RSS Feed