Pages

Deel 7: Partij 2: AlphaGo's nieuwe zet en verpletterende agressie (De historische match van deep learning AlphaGo vs Lee Sedol)


Partij 2:  AlphaGo's nieuwe zet en verpletterende agressie

Bij de persconferentie na afloop van de eerste partij gaf Lee Sedol zichzelf een 50% kans om de tweede partij te winnen. Grote vraag bij aanvang van de tweede partij is dan ook of AlphaGo nu (met zwart) weer net zo aggressief en aanvallend zal spelen als in de eerste partij. 


Je kunt je voorstellen dat Lee Sedol zijn speelstijl in meerdere opzichten sterk heeft aangepast na het verliezen van de eerste partij. Maar AlphaGo kan zich in de basis op geen enkele manier aanpassen aangezien het 4 – 6 weken duurt een nieuwe versie van het programma te trainen. Het is dus niet mogelijk (en ook niet wenselijk) om belangrijke wijzingen in de algoritmes van AlphaGo door te voeren gedurende deze zevendaagse match (behalve in het geval er serieuze bugs zouden optreden).

Lee Sedol concentreert zich voor het begin van de tweede partij.
Referee Fan Hui (links) kijkt toe. 
Lee Sedol speelt de eerste zetten in ieder geval meer behoudend en rustiger. Volgens presentator Michael Redmond (9p): “Lee Sedol heeft wellicht een wat voorzichtiger en behoedzamer speelstijl in acht genomen beschouwende hoe goed AlphaGo heeft gepresteerd in de eerste partij. Maar in deze partij AlphaGo speelt niet alleen nóg aggressiever maar maakt het ook minder fouten, zo lijkt het”.


Dia. 1:  Partij 2, na zwart 37 (cirkel, AlphaGo is zwart) 
AlphaGo's 19e zet (cirkel in Dia. 1) is een even verbazingwekkende als krachtige zet. Lee Sedol lijkt net zo verbaasd te zijn als iedereen: hij verlaat onmiddelijk de wedstrijdtafel, neemt een (toegestane) pauze terwijl zijn klok blijft doorlopen. Michael Redmond: “Dit is een creatieve zet. Het is een zet waarvan ik denk dat ik die nooit eerder heb gezien in een partij van een topspeler”.  Vrijwel alle stenen van AlphaGo werken krachtig samen met de creatieve 'schouder tik'. 

Wanneer Lee Sedol terugkeert aan de wedstrijd tafel, neemt hij een ongebruikelijk lange tijd om te antwoorden en heeft hij, na amper veertig zetten in de partij, al ruim 20 minuten tijdsachterstand op AlphaGo. Redmond: “Hij heeft duidelijk moeite om te gaan met zo'n sterke zet die hij nooit eerder gezien heeft. Het is een nieuwe en unieke zet en Lee Sedol moet erover nadenken. Dit is de reden waarom mensen professionals worden”


Dia. 2:  Partij 2, na zwart 41 (cirkel, AlphaGo is zwart) 
Na deze uitgebalanceerde zet is AlphaGo zeer duidelijk de aanvaller. Younggil An (8p) noemde AlphaGo's move (zie Dia. 1) “een zeldzame en intrigerende schouder tik maar Lee Sedol's antwoord (zie Dia. 2) was prachtig en voortreffelijk”. 

Lee Sedol voorkomt dat AlphaGo aan de bovenkant een centrum moyo opbouwt en houdt tevens de optie open om later gebied aan de rechterrand te pakken. AlphaGo blijft echter het initiatief houden en met zwart 41 (cirkel in Dia. 2) creeërt het programma mogelijkheden om op één van de driehoeken te spelen (Dia. 2). Daarmee kan AlphaGo dan de witte stenen proberen aan te vallen en tegelijkertijd gebied aan de midden onderrand proberen te maken. Daarbovenop komt nog eens dat deze zet van AlphaGo mee aan het centrum moyo bouwt als ook een witte uitbreiding aan de onderrand voorkomt. 


Dia. 3:  Partij 2, na zwart 61 (cirkel, AlphaGo is zwart) 
Met AlphaGo's zet 61 (cirkel in Dia. 3) bouwt het invloed in het centrum linksboven, geeft het ruimte aan zijn groep links midden (voorkomt wit's aanval) en dreigt wit's groep aan de linkerrand binnen te vallen (en daarmee een witte steen af te knippen). Het is duidelijk dat AlphaGo druk blijft zetten en initiatief houdt. 


Dia. 4:  Partij 2, na zwart 81 (driehoek, AlphaGo is zwart) 
In antwoord op de wit's invasie (vierkant Dia. 4) maakt zwart een zeer stevige zet aan de buitenkant (driehoek, Dia. 4). Daarmee trekt AlphaGo zich niets aan van het versterken van Lee Sedol's groepen om een gevecht voor te bereiden aan de bovenrand. Alphago maalt daar totaal niet om en gaat gewoon rustig verder met het uitbouwen van zijn eigen framewerk en toont hierbij een ongelofelijke flexibititeit. 

AlphaGo blijft initiatief houden en laat het aan wit om te kiezen tussen: a) naar het centrum uitbreiden om daar proberen te leven en zo het sterke zwarte centrum te neutraliseren, en b) een klein leventje brouwen in de hoek links boven met als risico dat zwart ijzersterk wordt aan de buitenkant en daarmee het opgebouwde centrum moyo kan proberen te verzilveren (Dia. 4). 


Dia. 5:  Partij 2, na zwart 97 (cirkel, AlphaGo is zwart) 
Lee Sedol kiest ervoor het centrum proberen te neutraliseren maar blijft achter met een zwaar groepje zonder basis terwijl AlphaGo ter weerszijden punten pakt, gebied verstevigt en de witte groep in de tang houdt (Dia. 5). 


Dia. 6:  Partij 2, na zwart 101 (cirkel, AlphaGo is zwart)
Wit heeft geen andere mogelijkheid dan consequent door te zetten maar zwart blijft maar ijzersterk aanvallen. En in die aanval pakt AlphaGo steeds voordeel. Met een volgende prachtige aanvalszet (cirkel in Dia. 6) voorkomt zwart dat wit makkelijk ogen kan maken, dan wel kan verbinden met de witte groep rechts. En ondertussen verstevigt zwart het centrum (wat later in het gevecht nog van pas kan komen). 


Dia. 7:  Partij 2, na zwart 127 (driehoek, AlphaGo is zwart)
Lee Sedol probeert uit alle macht èn zijn centrum groep te verstevigen èn te voorkomen dat AlphaGo een berg punten in het midden maakt maar de witte groep blijft wankel en blijft een blok aan het been van Lee Sedol (Dia. 7). Terwijl wit punten aan de onderrand pakt (vierkant, Dia. 7) maakt zwart rustig gebied in het centrum (driehoek, Dia. 7).

Redmond: “de controle over het verloop van de partij is verschillende keren gewisseld tussen de spelers. Maar in het centrum gevecht speelde AlphaGo briljante zetten die Lee Sedol dwongen tot onmiddelijke actie en keuzes”. En terwijl Lee Sedol het gebied aan de bovenrand serieus bedreigt, maakt AlphaGo zich totaal geen zorgen en verzilvert in plaats daarvan gewoon punten in het centrum: “punten zijn punten en het is volstrekt onbelangrijk waar op het bord ze gemaakt worden” gaat Redmond verder.


Dia. 8:  Partij 2, na zwart 139 (driehoek, AlphaGo is zwart)
AlphaGo pakt in de aanval op Lee Sedol's groep in het centrum al een bak punten door een gedeelte af te knippen. Wit heeft gewoonweg geen keus: anders gaat zijn hele groep er aan. 

Maar ook na wit's grote zet rechtsboven (vierkant, Dia. 8) die zwart's gebied aan de bovenrand een behoorlijk stuk dreigt in te deuken, speelt zwart rustig in het centrum daarmee dreigend nog een smakelijk sliertje van wit af te knippen (driehoek, Dia. 8).


Dia. 9:  Partij 2, na zwart 151 (cirkel, AlphaGo is zwart)
Ook hier moet Lee Sedol helaas eieren voor z'n geld kiezen en na nog een behoorlijke aderlating is de, inmiddels sterk geslonken, witte centrum groep nog steeds niet verbonden. AlphaGo houdt de druk op de ketel en met zwart 151 doet het programma een mooie zet die veel zoden tegelijk aan de dijk zet (cirkel in Dia. 9).



Dia. 10:  Partij 2, na zwart 163 (cirkel, AlphaGo is zwart)
Opnieuw heeft Lee Sedol geen andere keus dan zijn stenen proberen te verbinden zonder dat AlphaGo ondertussen met speels gemak nog meer punten binnensleept. Toch verliest wit hier opnieuw wat punten. Met de zwarte dreigzet (cirkel in Dia. 10) om opnieuw te knippen (driehoek in Dia. 10), of de resterende groep in z'n geheel te vangen (met een knip op O11 in Dia. 10) is het dweilen met de kraan open voor wit. 

Op dit moment staat Lee Sedol een punt of vijf achter (komi meegerekend) dus als zwart nog meer stenen afknipt van zijn inmiddels gedesintegreerde centrum groep dan is het definitief einde verhaal. En dat is precies wat er uiteindelijk gebeurt: wit wordt andermaal geknipt 



Dia. 11:  Partij 2, eindstand na zwart 211 (cirkel, AlphaGo is zwart)
Daarmee is de partij definitief ten einde en ongeveer 50 zetten geeft Lee Sedol op (zie eindstand Dia. 11), hij staat dan ongeveer 10 punten achter. AlphaGo heeft deze partij het initiatief geen moment uit handen gegeven en Lee Sedol is vrij recht toe recht aan op een heel indrukwekkende en imponerende manier door het AI progamma geklopt. 

Waar Lee Sedol in de eerste partij nog een paar duidelijke overplays speelde (een zet die veel te gretig is om meer punten dan de tegenstander te maken dan op grond van de sterkte van je tegenstander als redelijk geacht mag worden) is het in deze partij een heel ander verhaal: Lee Sedol speelde geen overplays en zijn allerbeste go spel, daarbij AlphaGo zeer serieus nemend als één van zijn sterkste tegenstanders tot nu toe. 

Verschillende nieuwe en interessante zetten werden door een zeer aggressief spelend AlphaGo moeiteloos op het bord getoverd. Sommige daarvan werden door veel top go-spelers in eerste instantie als onredelijk, incorrect of simpelweg niet werkend bestempeld. 

In een uitzonderlijk zwaar gevecht tijdens de tweede helft van het middenspel kwam Lee Sedol onder ongelofelijke hoge druk te staan (Dia. 6 en 7). Met duidelijk véél te weinig tijd om alle kansrijke variaties en uitkomsten daarvan nauwkeurig door te rekenen in deze extreem ingewikkelde, nog nooit eerder voorgekomen go stelling. 





Jammergenoeg lukte het Lee Sedol niet om een beter alternatief te bedenken in deze ultra complexe, misleidende en verwarrende positie. Daardoor maakte hij de doorslaggevende fout die AlphGo een voorsprong gaf van ongeveer 5 punten. Op het beslissende moment van de partij (Dia. 6) suggereerde Redmond dat Lee Sedol wellicht ook al wat achter stond.



Uiteindelijk geeft Lee Sedol zich gewonnen, min of meer verslagen op eigen terrein:  het starten van zeer complexe, alles-of-niets gevechten en daar gedurende de veldslag dan doorslaggevend voordeel uit proberen te halen. Voor veel top professionals bleef het onduidelijk wat de uitkomst van deze tweede partij zou zijn tot aan het laatste gedeelte van het middenspel. 

Demis Hassabis zei dat vanaf de tweede  helft van de partij, AlphaGo steeds zekerder werd om te winnen (zoals continu bewaakt door de kansrekening op winst). Ook al konden professionele commentatoren op dat moment zelf met geen mogelijkheid zeggen wie er beter stond. 

Lee Sedol verklaarde na afloop: “AlphaGo heeft een bijna perfecte partij gespeeld: vanaf het eerste begin van de partij  heb ik niet het gevoel gehad dat er een moment in de partij was dat ik voor stond. Was ik nog overweldigd en verbaasd door AlphaGo's manier van spelen tijdens de eerste partij, vandaag was ik ontzet en sprakeloos door de uitzonderlijk sterke zetten die AlphaGo genereerde, waarvan er sommige onverwacht goed uitpakten. Daarbij speelde AlphaGo, in tegenstelling tot gisteren, geen onredelijke of onjuiste zetten vanaf het tweede gedeelte van het middenspel tot aan het einde van de partij toe”. 

En gevraagd naar mogelijke zwaktes in het spel van AlphaGo, verwees Lee Sedol de vraag door naar Demis Hassabis na eerst te hebben verklaard: “vandaag heb ik verloren omdat ik niet in staat was om een zwakte in het spel van AlphaGo te vinden en te detecteren”. Hassabis beantwoordde de vraag met de verklaring dat één van de doelen van deze match is om uit te vinden of AlphaGo dergelijke zwaktes heeft en om proberen daarvan te leren. 



Go-prof Hong Minpyo (9p) bevestigde dat Lee Sedol en hij na afloop meer dan 5 uur iedere zet van de tweede partij hebben geanalyseerd. Lee Sedol was zeer in verwarring aan het einde van de partij over waarom hij deze partij had verloren. Dit onderzoeksproces heeft Lee Sedol waarschijnlijk geholpen er weer enigzins bovenop te komen. 

Op deze dag heeft AlphaGo Lee Sedol genadeloos verslagen met nooit eerder vertoonde, nauwkeurige superkracht en wonderbaarlijk diepgaande doorrekeningen in de meest complexe fase van de partij. Daarbij het punt bereikend waarop veel menselijke top professionele go-spelers, inclusief Lee Sedol zelf, niet in staat waren om nog met enige zekerheid de go-stelling te beoordelen en een bruikbare inschatting te maken van de uitkomst van alle mogelijke, complexe variaties.

Lee Sedol zei dat hij in de komende derde partij van de match zich zal moeten focussen en concentreren op de opening en het eerste gedeelte van de partij om zwaktes van AlphaGo te zoeken en te benutten, en zodoende vroeg in de partij een voorsprong op te bouwen.



Na twee geweldig fascinerende, spannende en sensationele partijen --die ondanks hun totaal verschillend karakter beide werden binnengehaald door AlphaGo-- wordt de werkelijke sterkte van het programma steeds duidelijker. 

De kans dat één van de sterkste spelers ter wereld, Lee Sedol, deze match tegen een zó overweldigend en grandioos spelend deep learning AlphaGo nog zal kunnen winnen, slinkt tot onwaarschijnlijk klein na het overzien van het slagveld van deze wonderbaarlijke, boeiende, betoverende en adembenemende tweede partij van de match. Vandaag is opnieuw geschiedenis geschreven door zowel Lee Sedol als het team achter AlphaGo, op verschillende onuitwisbare, onomkeerbare en onvoorstelbare manieren.

1 comment:

  1. Partij 2: AlphaGo's nieuwe zet en verpletterende agressie

    Dit is een verslag van de tweede partij uit de historische match van deep learning AlphaGo vs Lee Sedol (9p) met hoogtepunten, analyse, commentaar, reacties Lee Sedol, diagrammen en foto's.

    Waar Lee Sedol in de eerste partij nog een paar duidelijke overplays speelde (een zet die veel te gretig is om meer punten dan de tegenstander te maken dan op grond van de sterkte van je tegenstander als redelijk geacht mag worden) is het in deze partij tegen AlphaGo een heel ander verhaal: Lee Sedol speelde geen overplays en zijn allerbeste go, daarbij AlphaGo zeer serieus nemend als één van zijn sterkste tegenstanders tot nu toe.

    Verschillende nieuwe en interessante zetten werden door een zeer aggressief spelend AlphaGo tijdens deze tweede partij moeiteloos op het bord getoverd. Sommige daarvan werden door veel top go-spelers in eerste instantie als onredelijk, incorrect of simpelweg niet werkend bestempeld.

    In een uitzonderlijk zwaar gevecht tijdens de tweede helft van het middenspel kwam Lee Sedol onder ongelofelijke hoge druk te staan. Met duidelijk véél te weinig tijd om alle kansrijke variaties en de uitkomsten daarvan nauwkeurig door te rekenen in deze extreem ingewikkelde, nooit eerder voorgekomen go stelling.

    Deel 7 van 'De historische match van deep learning AlphaGo vs Lee Sedol'.

    ReplyDelete