Deep Learning: Sky's the Limit?: Deel 6: Partij 1: Lee Sedol onderschat vechtkracht AlphaGo (De historische match van deep learning AlphaGo vs Lee Sedol) REVISED

Partij 1: Lee Sedol onderschat vechtkracht AlphaGo

De eerste partij van de Google DeepMind challinging match tussen deep learning AlphaGo en top Go-prof Lee Sedol (9p) is ook meteen de meest belangrijke partij van deze match: de allereerste keer dat kunstmatige intelligentie het zonder voorgift opneemt tegen één van de sterkste Go-spelers ter wereld van de laatste 15 jaar.

AlphaGo heeft niet getraind op basis van professionele partijen en heeft daarom, zoals herhaaldelijk bevestigd door Demis Hassabis, geen enkele partij van Lee Sedol in de database. Lee Sedol weet niet veel meer over het programma dan wat hij gezien heeft van AlphaGo's match tegen Fan Hui (2p) afgelopen Oktober: een sterk maar zo nu en dan niet goed spelend programma, dat soms duidelijke fouten maakt in complexe situaties zonder al te veel hele bord bewustzijn terwijl het speelde tegen een aanmerkelijk zwakkere Go-speler die veel overplays speelde die Lee Sedol waarschijnlijk nooit zou spelen.

Dus beide zijden zullen elkaar voor de allereerste keer aftasten, bepalen welke stratgieën de tegenstander toepast, manier van denken, patronen hanteert en iedere mogelijke zwakte in het spel van de tegenstander proberen uit te buiten. Terwijl AlphaGo heeft getraind op basis van 130000 amateur partijen (tot ~8-9 dan = ~1-2p) en sterker werd door het spelen van miljoenen partijen tegen zichzelf, speelde Lee Sedol een paar duizend top tournooi partijen in the bijna 25 jaar van zijn professionele Go leven.

De openings zetten van de eerste partij van deze historische match tussen de mensheid en kunstmatige intelligentie worden vroeg in de ochtend gespeeld om 05h, in extreem hoge spanning en opwinding gevolgd in het Europese Go Culturele Centrum (EGCC, Amstelveen) door meer dan 60 mensen die met of zonder slaapzak vanuit alle hoeken uit Nederland zijn gekomen om deze once-in-a-lifetime event bij te wonen, beleven, ervaren en zo bewust mogelijk mee te maken.

Er zijn twee grote schermen opgehangen waarop het online partij commentaar en de speelruimte van de match te zien zijn, grote posters, een demonstratiebord en talloze laptops waarop de match wereldwijd van alle kanten wordt belicht. Ondertussen wordt de partij in de zaal besproken door de sterkste Europese spelers die we in huis hebben: Merlijn Kuin (6d), Peter Brouwer (6d) en Guo Juan (7d, voormalig 5p).

Het staat vast dat Lee Sedol voor deze match advies van go-spelers en programmeurs heeft ingewonnen. Vandaar ook dat hij probeert te kijken hoe AlphaGo omgaat met en reageert op een zet die het programma nooit eerder kan hebben gezien of geleerd. Daarnaast heeft Lee Sedol zich ook door een team van psychologen en begeleiders laten bijstaan om om te gaan met de psychologische druk en alle media aandacht. En om zichzelf niet uit balans proberen te laten brengen door het niet kunnen inschatten van de emotionele toestand en mentale stabiliteit van zijn tegenstander (daarbij is het eigenlijk vooral de grootste uitdaging om van jezelf te winnen).

Na Lee Sedol's zet met zwart 7 (zie Dia. 1) trapt Merlijn meteen af: “deze zet is vrij uniek en erg agressief van zwart. Volgens mij is dit een stelling die nooit eerder op het bord is gekomen. Ik ben ervan overtuigd dat Lee Sedol een vooropgezette strategie gebruikt die past bij zijn stijl”. Lee Sedol maakt hier (achteraf gezien) een verkeerde keuze door voor een ongebruikelijke opening te kiezen, waarvan hij weet dat die niet in AlphaGo's database voorkomt. Maar met zo'n openingspatroon is Lee Sedol zelf ook totaal onbekend. Volgens Merlijn doet Lee Sedol in het algemeen wel vaker aparte zetten en hij suggereert dat Google wellicht daarom ook Lee Sedol als tegenstander voor AlphaGo heeft uitgekozen.

Dia. 1: Partij 1, na wit 14 (onderste driehoek, Lee Sedol is zwart).
Zwart's zet 7 is gemarkeerd met een groene stip.

Bij het zien van de eerste door AlphaGo gespeelde zetten schudt Guo Juan duidelijk afkeurend haar hoofd (Dia. 1): “dit programma heeft echt een goede leraar nodig die een stevige tik op het hoofd uitdeelt bij het spelen van zo'n slechte zet, iedereen weet gewoon dat dit niet goed is … deze eerste zetten van wit zijn duidelijk niet optimaal en komen over als beginnersfouten”. De volgorde waarin wit de met een driehoek gemarkeerde zetten speelt, geven zwart de mogelijkheid om zoals in de partij te antwoorden. Het resultaat is wat minder voor AlphaGo (Dia. 1).

Dia. 2: Partij 1, na zwart 23 (cirkel, Lee Sedol is zwart)

Met Lee Sedol's zet 23 (cirkel in Dia. 2) staat de partij meteen in vuur en vlam. Guo Juan zegt vrijwel onmiddelijk: “deze zet van Lee Sedol is veel te dwingend en forcerend” en geeft aan dat dit een enorme overplay tsuke (plakzet) van zwart is. Hiermee is ook meteen verder de toon gezet: het overgrote deel van de partij wordt verder bepaald door Lee Sedol's grote onderschatting van zijn onbewogen, deep learning tegenstander. AlphaGo knipt onmiddelijk en neemt het initiatief door Lee Sedol meteen onder hoge druk te zetten.

Na ieder amper 25 zetten op het bord te hebben gespeeld (Dia. 3), zijn er zeven groepen met elkaar in gevecht. Peter merkt op dat hij de vormen en patronen in deze partij nou niet bepaald mooi vindt overkomen. Michael Redmond (9p) zegt in het engelse live commentaar: “het lijkt er sterk op dat Lee Sedol in reactie op een iets minder goed zet van AlphaGo onmiddelijk met een overplay komt. Deze menselijke reactie is heel begrijpelijk en maakt AlphaGo op z'n minst één steen sterker” .

Dia. 3: Partij 1, na wit 50 (cirkel, Lee Sedol is zwart)

Met zet 48 (driehoek, Dia. 3) valt wit de zwarte groep rechts boven aan. Zwart antwoord (vierkant, Dia. 3) en verstevigt zijn groep door wat extra oogpotentieel te creëren. Daarbij kan zwart in geval van nood nog onderdoor verbinden met de drie stenen rechts boven (door bijv. zwart op R18). Omdat het voor zwart nu nog veel te vroeg is om zelf op 48 (driehoek, Dia. 3) te spelen, wordt wit 48 door top profs als een fout van AlphaGo gezien.

Ondertussen zijn Erik van der Werf (maker van verschillende op AI gebaseerde go-programma's Magog en Migos) en Jaap van den Herik (expert op AI gebied en voormalig AI begeleider van Erik) bezig de achtergronden van de AI ontwikkelingen van AlphaGo toe te lichten: “menselijke intuïtie is impliciete kennis”. Mathijs Romans waarschuwt dat we --van tevoren-- zorgvuldig moeten blijven nadenken over de “gevaren en gevolgen” van het op een onverantwoorde en ongecontroleerde manier te snel willen toepassen van kunstmatige intelligentie. Journalisten van radio en tv interviewen verschillende mensen en Guo Juan merkt op dat de balans in deze partij over en weer gaat.

Dia. 4: Partij 1, na wit 80 (witte steen met vierkant, Lee Sedol is zwart)

Wanneer AlphaGo op de zevende lijn (!) pushed-from-behind (Dia. 4), is het duidelijk dat het programma alle go regels volledig aan de laars lapt ("in het Verre Oosten krijgt een kind daar billenkoek voor of een slag op zijn handen met een waaier", zie go bulletin 22). Lee Sedol krijgt hiermee een berg aan centrum invloed maar dat gaat wel zwaar ten koste van zijn hoek rechtsonder. En als zwart de aji van de twee witte knipstenen in het centrum grotendeels neutraliseert (driehoek in Dia. 4), slaat wit toe en invadeert (cirkel in Dia. 4). AlphaGo vindt het blijkbaar de hoogste tijd om de inmiddels opgebouwde kracht van de witte muur in klinkende munt om te gaan zetten.

Lee Sedol speelt tenuki en valt zelf de witte steen in de linkeronderhoek aan terwijl hij tegelijkertijd verder bouwt aan zijn centrum moyo (zwarte steen met vierkant in Dia. 4). Nu speelt AlphaGo tenuki door twee zwarte stenen te veroveren en daarmee de meeste angels uit de centrum stelling te halen hoewel dat op dit moment niet urgent is (witte steen met vierkant in Dia. 4). Met deze zet maakt AlphaGo dus een belangrijke inschattingsfout. Na deze blunder van AlphaGo stelde de chinese top prof Gu Li (9p): "Lee heeft nu 90% kans om deze partij te winnen". Lee staat gewoonweg beter.

Michael Redmond stelt: "AlphaGo is erg goed in zetten door rekenen en is zeer gebalanceerd in invloed en gebied. Na een eerdere betere stand voor AlphaGo heeft Lee Sedol nu de partij weer in evenwicht gebracht".

Dia. 5: Partij 1, na wit 102 (cirkel, Lee Sedol is zwart)

En dan gebeurt er vanuit een rustig voortkabbelende partij plotseling een enorme omwenteling: “AlphaGo's zet 102 (Dia. 5) is werkelijk een bovenmenselijke zet”. Wit lijkt deze zet zorgvuldig te hebben voorbereid zowel met zetten rechts boven als met de invasie --25 zetten eerder-- rechts onder (wit 78, cirkel in Dia. 4).

Een top 9p prof die deze zet voor AlphaGo voorzichtig suggereerde werd door andere profs recht in zijn gezicht uitgelachen. Wereldwijd zijn Go-profs tegelijkertijd negatief als zwaar verontrust over deze opmerkelijke zet van het AI programma. Met deze invasie probeert wit de hele zwarte stelling aan de rechterkant van het bord op te blazen in een bloedstollend gevecht (Dia. 5).

Wit maakt daarbij gebruik van de enorme invloed en die het in 't middenspel heeft opgebouwd. Tegelijkertijd geeft het wit's eigen groep, die inmiddels over de hele lengte van het bord is uitgestrekt, mogelijkheden tot het maken van een basis door gebruik te maken van de zwaktes in zwart's stelling aan de rechterrand.

Dia. 6: Partij 1, na wit 116 (cirkel, Lee Sedol is zwart)

Met AlphaGo's indrukwekkend sterke zet heeft Lee Sedol weinig keus en moet drie stenen rechtsboven opgeven (zie Dia. 6). In ruil daarvoor krijgt hij in nahand ook drie stenen maar zwart's potentieel aan de rechterkant is verdwenen als sneeuw voor de Zon. Vervolgens speelt AlphaGo een slappe, laffe maar o-zo doeltreffende zet waarmee definitief de witte hoek linksboven wordt beveiligd (cirkel, Dia. 6).

Deze zet op dit moment in de partij spelen (terwijl er nog andere, grotere zetten zijn) is een overduidelijk teken dat het programma heeft uitgerekend dat het voldoende voor staat om hiermee de partij te gaan winnen. Wit 116 (cirkel in Dia. 6) is niet optimaal (en door veel profs en commentatoren ook als minderwaardig bestempeld) maar AlphaGo is totaal niet geïnteresseerd in het spelen van optimale of de grootst en efficiëntst mogelijke zetten: het speelt louter zetten die de hoogste kans op het winnen van de partij geven.

Dia. 7: Partij 1, na zwart 127 (cirkel, Lee Sedol is zwart)

Lee Sedol probeert nog met een gevecht in de rechteronderhoek AlphaGo onder druk te zetten (Dia. 7). Maar helaas lukt het wit, dankzij mindere zetten van zwart, om een vrij ruim levende groep te maken. Daarmee zijn Lee Sedol's laatste kansen om de partij te winnen dan ook wel meteen verkeken.

Als de dikke rookwolken zijn opgetrokken van de verschillende gevechten blijkt Lee Sedol te veel achter te staan om dit nog gelijk te kunnen trekken.

Dia. 8: Partij 1, na wit 136 (cirkel, Lee Sedol is zwart)

Niettemin test Lee Sedol nog even AlphaGo's begrip over het hele bord (driehoek, Dia. 8): heeft wit wel door dat zijn over het hele bord uitstrekkende groep nog niet leeft? Wit zou kunnen denken dat zwart slechts verdedigt ... Met de doeltreffende verdediging van de mega witte groep wordt duidelijk dat AlphaGo zich uitstekend bewust is van de hele bordsituatie. En 'ziet' dat de mega witte groep met de hoogste urgentie twee ogen nodig heeft (cirkel, Dia. 8).

Dia. 9: Partij 1, eindstand na wit 186 (cirkel, Lee Sedol is zwart)

Na ongeveer 50 eindspel zetten geeft Lee Sedol op. Na AlphaGo's zet 186 (cirkel in Dia. 9) staat hij meer dan 5 punten achter. Lee Sedol is zwaar aangeslagen na zijn duidelijke onderschatting van de verbazingwekkende speelsterkte en de vechtkracht van deze versie van AlphaGo (in vergelijking met die ten tijde van de Fan Hui match een klein half jaar geleden).

Dit is de eerste keer in de geschiedenis dat een AI programma een top go prof gelijk-op verslaat. En dat dit een geweldige en historische eerste partij was, daar zijn alle go-profs wereldwijd het sprakeloos over eens. Over de sterk aanvallende, opmerkelijke, agressieve en doordachte zetten, tactieken en strategiën van beide kanten, valt heel veel meer te zeggen (zie bijvoorbeeld gogameguru.com).

Het tijdperk dat een mens een AI-programma gelijk-op van het bord kon vegen is voorbij en voorgoed afgesloten. Zo overweldigend sterk en onderbouwd go-spel is nog nooit eerder op deze Aardbol vertoond door een AI programma en zal ongelofelijk diepe indrukken en sporen achterlaten bij de meer dan 100 miljoen mensen wereldwijd die deze partij online hebben gevolgd.

Lee Sedol verliest deze eerste partij tegen AlphaGo en is zeer zwaar geëmotioneerd: “Ik was zeer verbaasd omdat ik niet gedacht had dat ik deze partij zou verliezen. Ik ben geschokt door hoe sterk AlphaGo heeft gespeeld, dat kan ik niet ontkennen. Ik had niet gedacht dat AlphaGo zo'n perfecte partij zou spelen. Een fout die ik aan het begin van de partij maakte, bleef maar voortduren en aanhouden tot op het uiteindelijke verlies van de partij drie uur later. AlphaGo's openings strategie was voortreffelijk en ik ben sprakeloos en sta versteld van een onconventionele zet die AlphaGo maakte (zie Dia. 5) die een mens nooit zou hebben gespeeld. Ik ben in shocktoestand maar wat gebeurd is, is gebeurd”.

Ondanks zijn verlies in deze aanvangspartij van de match stelt Lee sedol geen spijt te hebben van het aannemen van deze uitdaging: “Ik heb met heel veel plezier deze eerste go-partij gespeeld en ik verheug me op de volgende partijen”.

Michael Redmond (9p): “In deze eerste partij van de match, heeft AlphaGo gezegevierd met een zeer kleine marge. Terwijl Lee Sedol het grootste gedeelte van de partij op voorsprong stond, is AlphaGo erin geslaagd om het voortouw te nemen in de laatste fase van de partij. Daarbij speelde AlphaGo sterke en solide zetten waarmee het de winst veilig stelde en Lee Sedol's nieuwe maar mindere openingszet (zet 7) en overplay (zet 23) uiteindelijk consequent en zwaar heeft afgestraft”.

De chinese verslaggeving van deze eerste partij door 9p spelers Gu Li en Ke Jie werd verzorgd door Tencent en LeTV respectievelijk, waarbij ongeveer 60 miljoen kijkers de partij live volgden. Het commentaar in het engels door commentatoren Michael Redmond en Chris Garlock (vice president van de Amerikaanse Go Assoiciatie) bereikte een gemiddelde van 80.000 kijkers met een piek van 100.000 nabij het einde van de partij.

Alphago heeft in deze eerste partij overduidelijk laten zien dat het de smaak goed te pakken heeft van aanvallend spel, iets dat het programma niet noodzakelijkerwijs vertoonde tijdens de Fan Hui match. AlphaGo heeft telkens een verbazingwekkend nauwkeurig, diepgaand en veelzijdig beoordelend vermogen van de stelling laten zien.

Bovendien heeft AlphaGo minstens één onbeschrijfbaar mooie en super samenwerkende zet gespeeld, daarbij zoveel doelen tegelijkertijd nastrevend dat je er heel stil en klein van wordt (Dia. 5). Uit het daaropvolgende gevecht haalde het AI programma --in sente-- net voldoende voordeel om vervolgens met een alleszeggende (en laffe) zet de linker boven hoek en daarmee ook de winst van de partij definitief veilig te stellen (Dia 6).

Lee Sedol leek in de partij grotendeels de teugels in handen te hebben maar AlphaGo herpakte zich verbluffend sterk en verkreeg zo een duidelijke voorsprong in de laatste 20 minuten van de partij waarna Lee Sedol opgaf (op dat moment stond hij meer dan 5 punten achter).

Met al zijn overmoed en zelfverzekerdheid voorafgaand aan deze match, zijn onderschatting van het ontstellend, verbijsterend, fabelachtig en verwonderend sterk spel van AlphaGo, zijn verwachtingen op basis van de partijen tijdens de Fan Hui match, zijn immense concentratie en betrokkenheid bij deze eerste partij, en de enorme media aandacht en psychologische druk van alle ogen van de wereld, moet dit zeer onverwachte verlies voor Lee Sedol als een enorme mokerslag zijn aangekomen.

[Partij 2: AlphaGo's nieuwe zet en verpletterende agressie]

[Historische Match AlphaGo vs. Lee Sedol -- Match Overview]

[Deel 1: Details van de Match van de 21e eeuw]

[Deel 2: AlphaGo onder de Loep]

[Deel 3: Lee Sedol over het Go-bord in zijn hoofd]

[Deel 4: Kunstmatige Intelligentie versus Lee Sedol: Verwachtingen en voorspellingen van de Match]

[Deel 5: Google's grootste persconferentie ooit: opening van de match]

1 comment:

Bob van den HoekApril 23, 2016 at 2:34 AM
Partij 1: Lee Sedol onderschat vechtkracht AlphaGo. Dit is een verslag met hoogtepunten, commentaar, reacties Lee Sedol, diagrammen en foto's van de eerste partij in de historische match van deep learning AlphaGo tegen Lee Sedol (9p).

Lee Sedol verliest deze eerste partij tegen AlphaGo en is zeer zwaar geëmotioneerd: “Ik was zeer verbaasd omdat ik niet gedacht had dat ik deze partij zou verliezen. Ik ben geschokt door hoe sterk AlphaGo heeft gespeeld, dat kan ik niet ontkennen. Ik had niet gedacht dat AlphaGo zo'n perfecte partij zou spelen". Met al zijn overmoed en zelfverzekerdheid voorafgaand aan deze match, zijn onderschatting van het ontstellend, verbijsterend, fabelachtig en verwonderend sterk spel van AlphaGo, zijn verwachtingen op basis van de partijen tijdens de Fan Hui match, zijn immense concentratie en betrokkenheid bij deze eerste partij, en de enorme media aandacht en psychologische druk van alle ogen van de wereld, moet dit zeer onverwachte verlies voor Lee Sedol als een enorme mokerslag zijn aangekomen.

Deel 6 van 'De historische match van deep learning AlphaGo vs Lee Sedol'.

Pages

Deel 6: Partij 1: Lee Sedol onderschat vechtkracht AlphaGo (De historische match van deep learning AlphaGo vs Lee Sedol) REVISED

1 comment: