Deep Learning: Sky's the Limit?: Deel 10: Partij 5: AlphaGo onbekend met tesuji in ultieme moyo partij (De historische match van deep learning AlphaGo vs Lee Sedol)

Partij 5: AlphaGo onbekend met tesuji in ultieme moyo partij

Professional Kwon Gap-yong (8p), voormalig mentor van Lee Sedol, zei voorafgaand aan de partij: “Lee heeft al geleerd dat AlphaGo neigt naar het doen van vreemde zetten wanneer het ongunstige partij omstandigheden tegenkomt. Lee zal een grotere kans op het winnen van deze laatste partij hebben als hij sleutelzetten speelt die zeer moeilijk te berekenen vallen”.

In de vierde partij toonde Lee Sedol AlphaGo's zwaktes in het beoordelen van de aanwezige aji in het centrum moyo van het programma. Toen Lee Sedol in opperste euforie samen met zijn team na afloop de partij analyseerde, moet hij geconcludeerd hebben dat AlphaGo's moyo behandeling verre van optimaal was geweest en dat hij het programma hierop nog maar eens stevig aan de tand moest voelen.

AlphaGo begint met een yosu-miru (uitprobeer) zet in de opening om te kijken hoe Lee Sedol antwoordt (cirkel in Dia. 1). Aan de hand daarvan bepaalt wit dan of en hoe 't het joseki rechts onder wordt afmaakt.

Dia. 1: Partij 5, na wit 12 (cirkel, Lee Sedol is zwart)

Zwart antwoordt rustig en speelt tenuki in de hoek om te voorkomen dat wit een dubbele uitbreiding kan maken aan de rechterrand (cirkel in Dia. 2). Lee Sedol's zet stelt AlphaGo meteen voor een keuze: inklemmen en toelaten dat zwart de drie witte stenen rechtsonder kan aanvallen, of voorkomen dat zwart onderdoor verbindt en proberen te vechten?

Dia. 2: Partij 5, na zwart 17 (cirkel, Lee Sedol is zwart)

Wit kiest ervoor om in te klemmen en tegelijkertijd daarmee een basis voor zijn drie stenen rechtsboven te maken (zie Dia. 3). In het vervolg knippen beide kanten en eindigt AlphaGo in sente omdat Lee Sedol zijn inklemmingssteen onderlangs verbindt (cirkel in Dia. 3).

Dia. 3: Partij 5, na zwart 25 (cirkel, Lee Sedol is zwart)

Na zetten aan de linkerrand waarbij zwart een groep bouwt en wit een mooi gebalanceerde uitbreiding vanuit de hoek linksonder maakt (Dia. 4), speelt AlphaGo om invloed richting het centrum te maken en het kwart bord linksonder op te bouwen (cirkel in Dia. 4).

Het is nog volstrekt onduidelijk hoeveel punten deze zet kan opleveren maar werkt in ieder geval heel goed samen met de stenen die wit al op het bord heeft staan. En zet zwart onder druk om te voorkomen dat wit met een nobi (verlenging) of keima naar beneden het witte moyo nog verder opbouwt.

Zowel Lee Sedol als AlphaGo spelen een zeer solide en gebalanceerde opening en na zet 40 (zie Dia. 4) lijkt de uitkomst van de partij volkomen open op basis van de tegengestelde moyo en gebieds strategie van de spelers.

Dia. 4: Partij 5, na wit 40 (cirkel, Lee Sedol is zwart)

Lee Sedol voorkomt dat AlphaGo de rechteronderhoek afschermt en breidt tegelijkertijd zijn hoek rechtsonder uit (Dia. 5). AlphaGo denkt dat de drie witte stenen daar nog voldoende aji hebben om een gevecht daar zinvol te maken. Het programma is blijkbaar niet op de hoogte van een veel voorkomende tesuji (de 'tombstone squeeze', waarbij je twee stenen offert en vervolgens nog eens inwerpt om de tegenstander efficiënt van zijn binnenvrijheden te beroven).

Deze tesuji komt regelmatig voor in de partijen waarmee AlphaGo is getraind dus het is hoogst merkwaardig dat het programma blijkbaar niet goed bij de les is geweest. AlphaGo verliest hier punten (en ko dreigingen) door het onnodig weggeven van andere mogelijkheden om de aji van de drie witte stenen te benutten (Dia. 5).

Hassabis stuurt een tweet rond met: “AlphaGo heeft een behoorlijke fout vroeg in de partij gemaakt (het kende een bekende tesuji niet) maar is nu hard aan het proberen om terug te klauwen … zenuwslopend”. Hassabis voegt toe: "De tesuji komt regelmatig voor in prof partijen dus is het zeer waarschijnlijk –niet-- geleerd door het 'policy netwerk'. Persoonlijk vind ik dat AlphaGo zich bewust had moeten zijn van deze tesuji maar Lee Sedol's vervolgzet was waarschijnlijk beter dan AlphaGo had verwacht”. Hij bijt zijn nagels en hoopt dat AlphaGo de onnodig weggegeven punten snel weer kan rechtzetten (Dia. 5).

Dia. 5: Partij 5, na zwart 59 (cirkel, Lee Sedol is zwart)

Gelukkig voor AlphaGo, speelde het deze zetten in al min of meer door Lee Sedol gerealiseerd gebied en heeft het enkele sente zetten aan de buitenkant die van pas kunnen komen als wit daar punten wil maken.

Dia. 6: Partij 5, na wit 70 (cirkel, Lee Sedol is zwart)

AlphaGo heeft dus vooral ingezet op invloed en na enkele zetten in de rechterbovenhoek ontwikkelt zich een strijd om het inmiddels door AlphaGo stevig opgebouwde centrum moyo (Dia. 6). Lee Sedol invadeert om AlphaGo verder onder druk te zetten in de linkerbovenhoek en tegelijkertijd AlphaGo's potentiële moyo rond het centrum te reduceren (driehoek in Dia. 6). Maar AlphaGo komt met een mooi en effectief antwoord dat de flow van de partij meteen omkeert en Lee Sedol onmiddelijk zelf onder zeer hoge druk te zet (cirkel in Dia. 6).

Wit's zet voorkomt dat de zwarte invasie steen makkelijk kan verbinden met de zwarte groep aan de linkerrand, voorkomt dat de invasie steen naar het centrum kan vluchten om daar eventueel ogen te maken, dwingt de zwarte invasie steen naar wit's sterkte rechtsboven toe, en draagt ondertussen stevig bij aan de al opgebouwde invloedsfeer in het centrum. Daarbij is het idee dat als Lee Sedol probeert te leven dat AlphaGo hem dan stevig onder druk kan zetten en daarbij sterk aan de buitenkant worden (om zo het moyo nog verder te versterken, zie Dia. 6).

Dia. 7: Partij 5, na zwart 81 (cirkel, Lee Sedol is zwart)

Er is geen andere uitweg voor Lee Sedol dan een levende groep te maken. Maar in ruil daarvoor bouwt AlphaGo geleidelijk aan verder aan het opgebouwde moyo (Dia. 7). AlphaGo blijft Lee Sedol's groep onder druk zetten en eindigt in voorhand om vervolgens aan de onderkant van het centrum moyo verder te bouwen (driehoek in Dia. 8).

Dia. 8: Partij 5, na zwart 91 (cirkel, Lee Sedol is zwart)

In een ingewikkeld middenspel wordt Lee Sedol gedwongen om zeer efficiënte manieren te vinden die voorkomen dat AlphaGo het hele moyo in gebied kan omzetten. Het is de vraag of AlphaGo voldoende gebied in het centrum en in de linkerhoek kan maken om op te wegen tegen Lee Sedol's al zekere gebied in de hoeken (Dia. 8).

Zwart heeft aan zeker gebied ongeveer 70 punten. Wit heeft ongeveer 30 punten linksboven en het centrum moyo opgeteld. Rekening houdend met 7.5 komi betekent dat dat wit, om de partij te winnen, minimaal 35 punten linksonder aan de rand en in de hoek moet maken (zonder dat zwart dan nog extra punten binnenhaalt). Of wit moet nog extra punten in het centrum weten te verzamelen. Het lijkt er sterk op met deze schatting dat de partij in deze stand nog open en onbeslist is.

Dia. 9: Partij 5, na wit 122 (cirkel, Lee Sedol is zwart)

De partij ontwikkelt zich langzaam verder als Lee Sedol eerst probeert AlphaGo's moyo in het centrum wat in te deuken en vervolgens links onder een groep bouwt (Dia. 9). Met wit's rustige zetten wordt wat sterkte aan de buitenkant opgebouwd maar in eerste instantie is niet duidelijk wat wit daarmee wilt aanvangen. Na AlphaGo's verlenging (cirkel in Dia. 9) blijkt echter dat Lee Sedol met zijn groep een basis aan de onderrand moet maken (dan wel moet verbinden). En dat wit zwart probeert op te sluiten.

Dia. 10: Partij 5, na wit 136 (cirkel, Lee Sedol is zwart)

Zwart verbindt zijn groep linksonder met de rechterhoek en maakt nog wat extra punten terwijl wit wat sterkte opbouwt en ondertussen zwart's invloed rechtsonder aanzienlijk weet te reduceren. Dan speelt wit een prachtige splijtzet (cirkel in Dia. 10) die veel druk op zwart zet. Dit is een mooie counter aanval van AlphaGo die al wit's centrum stenen optimaal laat samenwerken en de enorme druk op Lee Sedol nog verder opvoert.

Het is lastig voor zwart om te bepalen wat hier nu de beste strategie is. Lee Sedol kan zijn centrum stenen niet zo maar opgeven en moet wit's centrum moyo tegelijkertijd zo klein mogelijk proberen te houden. AlphaGo's sterkte aan de onderrand wordt vooral gebruikt om Lee Sedol met allerlei mogelijke knipacties onder druk te houden.

Dia. 11: Partij 5, na zwart 183 (cirkel, Lee Sedol is zwart)

Een vergelijking van Dia. 10 met Dia. 11 laat zien dat zwart er op inventieve en indrukwekkende manier in slaagt zowel wit's potentieel aan de linkerrand als een belangrijk gedeelte van wit's centrum moyo te neutralizeren. In ruil daarvoor krijgt wit echter ongeveer 15 zekere compensatie punten. Of die voldoende zijn voor partijwinst is nog onduidelijk, temeer daar Lee Sedol nog mogelijkheden heeft om wit's potentieel verder te verkleinen (zowel aan de linkerrand als in het centrum). Het verschil is naar schatting niet meer dan enkele punten in het voordeel van AlphaGo (Dia. 11).

Het lastige bij deze stand is dat zwart's gebied nagenoeg vast ligt terwijl wit op verschillende plaatsten op het bord mogelijkheden heeft om nog extra gebied / punten te maken. Lee Sedol kan alleen nog AlphaGo's potentieel zo beperkt mogelijk proberen te houden met slimme en effectieve reductie zetten.

Voor de top go-profs die op deze vijfde partij commentaar geven, is het moeilijk aan te geven wáár in de partij Lee Sedol misschien een mindere zet heeft gespeeld. Toch is AlphaGo er op één of andere manier in geslaagd om de partij recht te trekken nadat het eerder Lee Sedol's tesuji verkeerd beoordeelde. Over het geheel genomen komen zowel de flow van de partij als het spel van beide spelers als zeer gebalanceerd, doordacht en evenwichtig over.

Dia. 12: Partij 5, eindstand na wit 280 (cirkel, Lee Sedol is zwart)

In de verdere 100 zetten van de partij lukt het Lee Sedol helaas niet zijn achterstand van enkele punten in te lopen. Een paar minuten voordat de partij is afgelopen verlaat Lee Sedol het go-bord. AlphaGo heeft een zet gespeeld die beduidend minder optimaal is: een teken dat het programma inschat dat het deze partij hoe dan ook gaat winnen. Ondanks dat Lee Sedol op het bord voorstaat zou hij met ongeveer 2.5 punt verliezen, rekeninghoudend met de komi voor AlphaGo (7.5 punt).

Na zet 280 (eindstand Dia. 12) geeft Lee Sedol op terwijl er nog maar een handjevol zeer kleine eindspelzetten te spelen zijn. Het is de eerste keer in deze match dat een partij zo ver in het eindspel wordt uitgespeeld. En zo close in punten is geëindigd.

Wederom dus een verbazingwekkend goede, inspirerende, ongelofelijk spannende en historische partij waarbij verschillen in speelsterkte tussen 's-werelds top go-prof Lee Sedol en deep learning programma AlphaGo maar moeilijk te ontdekken waren.

Met deze uitslag, is het eindresultaat van deze match: AlphaGo verslaat Lee Sedol met 4 - 1. Een resultaat dat slechts een kleine minderheid (< 10 - 15%) van de meer dan 280 miljoen mensen wereldwijd die deze match online gevolgd hebben, van tevoren zou hebben voorspeld. AlphaGo's spel heeft op alle Go-spelers wereldwijd een diepe indruk achtergelaten met supersolide, diepgaande, soms onverwachte en oprecht wonderschone, effectieve zetten in deze partijen.

Tijdens de post-match pers conferentie (niet eerder heb ik zoveel pers en media zien bijeen gezien) zei Lee Sedol: "Het spijt me dat deze match tot een einde is gekomen". En antwoordend op een vraag of de vijf partijen zijn begrip van het Go-spel wellicht hebben veranderd: "Eigenlijk denk ik niet noodzakelijkerwijs dat AlphaGo superieur aan mij is. Ik denk dat er meer is dat een mens kan doen om te vechten tegen het AI programma. Dat is ook waarom ik me een beetje triest voelde omdat een mens meer had kunnen laten zien gedurende deze match".

Hassabis verklaarde na afloop: “Ik ben sprakeloos over deze meest spannende partij ervaring die we tot nu toe hebben meegemaakt. AlphaGo maakte vroeg in de partij een fout door het missen van een tesuji. Maar het lukte het programma om zichzelf terug in de partij te brengen, dit is verreweg de meest opwindende en stressvolle partij geweest van alle partijen van de match”.

Het kostte Lee Sedol ongeveer vier partijen om AlphaGo's spel enigzins te doorgronden: de eerste twee partijen heeft Lee Sedol wellicht verloren door een verkeerde strategie keuze, de derde partij verloor hij door een fatale fout al vroeg in de opening, en met de kennis van de vierde partij zou Lee Sedol heel waarschijnlijk een andere taktiek hebben gevolgd en een aanzienlijk grotere kans gehad hebben om de match te winnen.

Een uitgebreid verslag van de pers conferentie met reacties van Lee Sedol en Demis Hassabis na afloop van de vijfde en laatste partij van deze match, volgt later.

In deze vijfde en spannende laatste partij van deze match, speelde deep learning AlphaGo een heel indrukwekkende en zeer gebalanceerde moyo partij. Hoewel Lee Sedol al vroeg redelijk veel zeker gebied had afgebakend en hij in staat was AlphaGo's moyo plannen grotendeels te dwarsbomen, slaagde het programma er toch in om onderweg (na het overzien van een welbekende tesuji) voldoende compensatie te krijgen en een marginale voorsprong van slechts een paar punten op te bouwen. En deze ook de tweede helft van de partij vast te houden.

[Historische Match AlphaGo vs. Lee Sedol -- Match Overview]

[Deel 1: Details van de Match van de 21e eeuw]

[Deel 2: AlphaGo onder de Loep]

[Deel 3: Lee Sedol over het Go-bord in zijn hoofd

[Deel 4: Kunstmatige Intelligentie versus Lee Sedol: Verwachtingen en voorspellingen van de Match]

[Deel 5: Google's grootste persconferentie ooit: opening van de match]

[Deel 6: Partij 1: Lee Sedol onderschat vechtkracht AlphaGo]

[Deel 7: Partij 2: AlphaGo's nieuwe zet en verpletterende agressie]

[Deel 8: Partij 3: Lee Sedol's openingsfouten door enorme mentale druk]

[Deel 9: Partij 4: Lee Sedol's briljante zet openbaart zwaktes AlphaGo]

[Deel 11: Reacties wereldwijd en Prijsuitreiking]

1 comment:

Bob van den HoekMay 1, 2016 at 11:07 AM
Partij 5: AlphaGo onbekend met tesuji in ultieme moyo partij

Dit is een verslag van de vijfde partij uit de historische match van deep learning AlphaGo vs Lee Sedol (9p) met hoogtepunten, analyse, commentaar, reacties Lee Sedol, diagrammen en foto's.

In de vijfde en spannende laatste partij van deze match, speelde deep learning AlphaGo een heel indrukwekkende en zeer gebalanceerde moyo partij. Hoewel Lee Sedol al vroeg redelijk veel zeker gebied had afgebakend en hij in staat was AlphaGo's moyo plannen grotendeels te dwarsbomen, slaagde het programma er in om onderweg (na het overzien van een welbekende tesuji) voldoende compensatie te krijgen en een marginale voorsprong van slechts een paar punten op te bouwen (en de tweede helft van de partij vast te houden).

Voor de top go-profs die op deze vijfde partij commentaar geven, is het moeilijk aan te geven wáár in de partij Lee Sedol misschien een mindere zet heeft gespeeld. Maar op één of andere manier is AlphaGo er toch in geslaagd om de partij recht te trekken nadat het eerder een tesuji verkeerd beoordeelde. Over het geheel genomen komen zowel de flow van de partij als het spel van zowel Lee Sedol en AlphaGo als zeer gebalanceerd, doordacht en evenwichtig over.

Wederom een verbazingwekkend goede, inspirerende, ongelofelijk spannende en historische partij waarbij verschillen in speelsterkte tussen 's-werelds top go-prof Lee Sedol en deep learning programma AlphaGo maar moeilijk te ontdekken waren.

Deel 10 van 'De historische match van deep learning AlphaGo vs Lee Sedol'.

Pages

Deel 10: Partij 5: AlphaGo onbekend met tesuji in ultieme moyo partij (De historische match van deep learning AlphaGo vs Lee Sedol)

1 comment: