|
Jouer au démineur ! - La solution du défieur.Date de publication : 10 Août 2006 , Date de mise à jour : 10 Août 2006
Par
Equipe DELPHI (Les Défis DELPHI)
Waskol nous propose de découvrir la solution qu'il a envisagé pour résoudre ce défi.
Téléchargement de l'article au format PDF I. Les sources et resources disponibles II. La structure globale du programme II-A. Les procédure et fonctions utilitaires qui exploitent les API Windows II-B. La structure des données II-C. La boucle principale du programme II-D. Démarrer le démineur II-E. La résolution d'une partie de démineur II-F. Pourquoi "ScreenshotToZoneJeu" (qui signifie Capture d'écran vers ZoneJeu) ? Il n'y a pourtant pas de capture d'écran... II-G. L'inventaire des cases "à Jouer" III. Les algorithmes de résolution en détail III-A. recheche de cases évidentes III-B. recherche de schémas III-C. Recheche CSP (Constraint Satisfaction Problem) IV. Conclusion V. Sources Téléchargement de l'article au format PDFI. Les sources et resources disponibles
Voici tout d'abord quelques fils de discussion qui m'ont inspirés :
Après, la FAQ regorgeait d'astuces utiles pour réaliser le programme :
Sinon, les fichiers d'aide de Delphi, y compris ceux de la SDK Microsoft et les moteurs de recherche sont une source d'informations extraordinaire pour réaliser ce genre de programme :
Au final, après diverses recherches, toutes les solutions au coté "technique" du problème étaient là :
Pour le reste, c'est à dire la résolution elle même, c'était une question d'algorithme....
II. La structure globale du programmeII-A. Les procédure et fonctions utilitaires qui exploitent les API Windows
Ces fonctions sont pour la plupart regroupées dans l'unité UnitSystem.pas. Elle permettent entre autre :
Pour mesurer le temps mis par mon programme pour résoudre une partie, je me suis appuyé sur la fonction API GetTickCount (méthodes StartChrono et StopChrono de la classe TStatistiques).
En passant, tous les calculs des statistiques sur les pourcentages de réussite ou d'échec du Bot-démineur sont dévolues à la classe TStatistiques, implémentée dans la variable globale Statistiques de l'unité UnitStats.pas.
II-B. La structure des données
II-C. La boucle principale du programme
La visite commence par l'évènement OnClic du bouton Jouer ! qui est en fait le programme principal : procedure TFormMain.ButtonJouerClick(Sender: TObject);
Voici l'algorithme en épurant toutes les fioritures :
II-D. Démarrer le démineur
C'est la méthode privée DemarrerWinMine qui s'occupe de cette tâche . Pour ce faire j'ai utilisé deux fonctions de l'API Windows :
II-E. La résolution d'une partie de démineur
Cette lourde tâche est dévolue à la méthode privée Jouer qui appelle bien d'autres méthodes.
Voici l'algorithme :
II-F. Pourquoi "ScreenshotToZoneJeu" (qui signifie Capture d'écran vers ZoneJeu) ? Il n'y a pourtant pas de capture d'écran...
Initialement, cette méthode effectuait une capture d'écran de la fiche du démineur (ce qui m'a permis de tester le bon fonctionnement de mes tests de pixels ainsi que la localisation correcte de mes clics de souris.
Une fois cette partie au point, j'ai éliminé la capture de la fiche du démineur et lu directement la couleur des pixels à l'écran (beaucoup plus rapide).
A ce propos, j'ai tout de même laissé les trois fonctions à titre indicatif qui m'ont permis de faire des captures d'écran, d'une fenêtre complète (barre de titre+bordure), ou de de la zone cliente d'une fenêtre (fenêtre complète - barre de titre - bordure) : ScreenShotDesktop, CopyWindowRectToBitmap et CopyClientRectToBitmap. Ces procédures se trouvent dans l'unité UnitSystem.pas.
II-G. L'inventaire des cases "à Jouer"
la méthode InventaireCasesAJouer s'articule autour de trois algorithmes qui s'enchaînent ou non successivement selon qu'a chacune des étapes des cases "jouables" ont été trouvées ou non :
Mieux qu'un algorithme, le code qui tient en quelque ligne illustre la modularité de cette recherche de cases :
Le premier algorithme que j'ai mis au point est celui de recherche de cases évidentes, assez simple à mettre en oeuvre, c'est l'algorithme le plus rapide, mais aussi le moins "intelligent".
Le deuxième algorithme est exécuté lorsque le premier échoue (Nbre de cases à jouer=0).
Celui-ci découpe la ZoneDeJeu en zones plus petites et effectue une recherche systématique de toutes les combinaisons concernant les cases encore inconnues de cette zone en fonction des cases déjà connues. C'est l'algorithme que j'ai eu le plus de mal à mettre au point
A partir de là, mon bot à commencé à être un joueur "futé". Les participants du défi avaient du souci à se faire à ce moment là... Jusqu'a ce que TicTacToe arrive :p
L'idée du dernier algorithme ne m'est arrivée que tardivement. Après de multiples recherches sur les méthodes de résolution statistique sur internet, je suis "tombé" sur un code (pas en Delphi) parlant de "Programmation par satisfaction de Contraintes" pour résoudre le démineur, de site disant que le démineur était un problème "P-Complete" et j'en passe. J'avoue ne pas avoir tout compris tout de suite, j'en rigole encore...
Toujours est-il que le dit code, utilisant un langage de programmation "ensembliste" n'était pas du tout, mais alors vraiment pas transposable en Delphi. Et puis je me suis documenté et compris que l'on avait tout bêtement affaire à la résolution d'un système à N inconnues (N cases inconnues) et M équations (M1 cases indiquant un nombre de mines, 1 équation contabilisant le nombre de mines restant à découvrir) avec N>M. Du coup on se retrouve avec plusieurs solutions, et il reste à dénombrer l'état des inconnues pour chacune de ces solution ("mine" ou "pas mine" ?). Lorsque l'on divise par le nombre total de solutions valides (toutes les inconnues valent 1 ou 0 et rien d'autre), on se retrouve avec la probabilité d'avoir une mine (J'aime quand les maths sont présentés simplement, on comprend mieux)
Après avoir résolu plusieurs détails techniques question "dénombrement de solutions" (Dites, on fait comment avec les factorielles quand les nombres sont trop grand pour Delphi ? Comment éviter les erreurs d'arrondi lors d'un pivot de Gauss ? etc...), j'ai commencé à coder... J'y ai cru jusqu'à ce que je fasse un malaise dû à un trop grand surmenage (trop d'activités à la fois, trop de boulot, trop de tout...).
Heureusement, j'ai pu le finaliser mais par contre, santé oblige, je ne me suis pas attardé sur son optimisation.... ça marche, c'est le principal.
III. Les algorithmes de résolution en détailIII-A. recheche de cases évidentes
La recherche de cases évidentes est triviale.
Il consiste pour chaque case du terrain qui affiche un chiffre qui représente le nombre de mines qui se trouvent autour de vérifier si ce chiffre (appelons le Nmines) est égal au nombre de cases déminées qui se trouvent autour (Ndeminees) et au nombre de cases inconnues qui se trouvent autour (Ninconnues).
Selon que la case evidente est une mine ou non, l'algorithme indique quelle méthode de clic sera envisagée (Clic-droit si c'est une case à déminer, Clic simultané Gauche+Droite pour faire de la place autour de la case).
Prenons cet exemple :
C'est, somme toute, la méthode de jeu que la plupart d'entre nous adopte en jouant au démineur sans trop réfléchir.
III-B. recherche de schémas
La recherche de schémas est beaucoup plus complexe !!!
L'algorithme commence par construire une grille de 3 x3 cases, cette grille est déplacée "au -dessus" du terrain de Jeu pour le scanner entièrement et effectue une recopie des cases qui se trouvent "en dessous". A chaque fois que la grille de recherche est déplacée, toutes les solutions "locales" sont envisagées. Dès que le scan trouve une case AJouer, il rend la main au programme, sinon il continue.
Si le scan de 3x3 à échoué, le programme effectue alors un scan avec une grille de 4x4, puis 5x5 et enfin 6x6.
Si à ce stade, la recherche est encore un échec, cet algorithme rend la main et c'est l'algorithme suivant (recherche CSP) qui prend la relève.
Pour ce qui est de la recherche de schéma dans la grille du scan, voici comment l'algorithme procède, du moins dans son principe :
Reprenons notre exemple et imaginons que notre programme est en train de passer un scan avec une grille de 3x3 :
Voici donc notre grille de recherche :
Maintenant, que nos cases à tester sont identifiées, nous devons ré-examiner le chiffre qui s'y trouve.
En fait, pour chacune de nos trois cases nous allons déterminer le nombre de mines potentiellement présentes, c'est-à-dire le nombre de cases encore inconnues sur la grille du terrain autour de notre grille de recherche :
NbreMinesPotentiellesAutour:=NbreInconnuesAutour-NbreInconnuesAutourDansSchema; ->NbreInconnuesAutour inclut les cases du terrain
if NbreMinesAutour < NbreMinesPotentiellesAutour then NbreMinesPotentiellesAutour:=NbreMinesAutour
Celà nous donne :
Ensuite, nous devons tester la validité de chacun des schemas (000, 001, ..., 111), voici l'algorithme pour tester si un schéma est valide :
A partir de la nous savons si un schéma de jeu est plausible ou non, cela nous donne, pour chaque schéma de test concernant notre exemple :
Nous avons donc ici, deux schémas valides qui sont 101 et 110.
C'est-à-dire que, à coup sur, seules deux dispositions éventuelles dans notre grille de démineur sont plausibles :
Pour identifier ces cases "invariantes" nous effectuons une succession d'opérations bit à bit sur un masque égal à 111111111111 avec nos valeurs de schémas trouvés:
Du coup, nous obtenons à l'issue de notre algorithme un certain nombre de "Cases à Jouer" , soit avec un clic gauche, soit avec un clic droit (selon qu'il s'y trouve une mine ou non)
Bref, cela fut un vrai casse-tête à trouver l'algorithme, puis à le coder !!!
III-C. Recheche CSP (Constraint Satisfaction Problem)
Sans vraiment rentrer dans les détails de l'algorithme qui est suffisamment commenté dans la procédure TFormMain.RechercheCSP;, en voici son principe de fonctionnement.
Ce dernier repose un principe qui consiste à représenter chaque "case inconnue" du plateau de jeu par une variable Xi.
Pour les cases chiffrées du "haut" la même mise en équations est également effectuée, ces équations impliqueront donc les variables de X10 à X14, et de X19 à X23.
Nous remarquons alors, que certaines inconnues ne sont pas encore mises en équation : de X1 à X7 et de X15 à X18.
Nous allons tout d'abord placer ces dernières inconnues, dans une seule variable qui les regroupe toutes : Y=X1+...+x7+X15+...+X18. Comme de toutes façons ces variables ne peuvent être évaluées directement (elles dépendent de toutes les autres), je les ai qualifié de "non-devinables".
Puis nous allons obtenir notre toute dernière équation qui correspond à la somme de TOUS nos X, qui en toute logique, est égal au nombre de mines restant à découvrir sur le plateau : Y+X10+..+X14+X19+..+X30=10
Cela nous donne un système de 23 équations à 30 inconnues, avec des équations dupliquées.
Ce genre de système, mis sous forme de matrice (ici un tableau d'entiers de 19 colonnes x 30 lignes) est résolu en utilisant un pivot de Gauss maison qui préserve les valeurs entières des coefficients : cela évite les erreurs d'arrondi que l'on rencontre dans l'algorithme habituel que l'on trouve sur internet
A l'issue de ce pivot, certaines inconnues ne le seront plus, comme les inconnues allant de X19 à X30
D'autres seront encore sous forme d'équations. Parmi ces dernières, on pourra identifier un bon nombre d'entre elles comme étant "dépendantes" de quelques unes que j'ai nommé dans mon code "dépendances". Les "dépendances" se retrouvent dans plusieurs équations du système, alors que les "dépendantes" ne se retrouvent que dans un seule équation à la fois.
En testant toutes les valeurs possibles des dépendances (0 ou 1), on obtiendra des solutions plausibles (comme dans la recherche de schémas) où les variables dépendantes prennent éfectivement les valeurs 0 ou 1. Celà se traduira par le fait que :
Sinon, on obtiendrait des solutions aberrantes où les variables dépendantes prennent des valeurs qu'elles ne devraient pas avoir (-10, -1, 2, 3, 8 par exemple).
Si toutes les équations sont valides, le système est cohérent, et on a alors un schéma (ou solution) plausible.
Lorsque l'on sera confronté à une solution plausible, il s'agira alors de dénombrer le nombre de cas de figure ou le schéma apparaît dans l'ensemble de toutes les combinaisons possibles. C'est là où rentre en jeu le nombre de cases "non devinables" que j'ai cité précédemment.
Le nombre de solutions que représente effectivement notre schéma sera égal à N=N0xN1xN2x...xNm
Comme avec ce genre de fonction qui normalement fait intervenir les factorielles, on se retrouve confronté à des nombres gigantesques, il a fallu "bidouiller" les mathématique officielles pour que l'algorithme de calcul sache simplifier les divisions "à la main" et utilise les propiétés du triangle de Pascal pour éviter les multiplications à n'en plus finir et les dépassements de capacité qui en résultent.
Revenons a nos cases : dans l'équation X27+X28+X29=2, chacune des cases aura 2 chances sur 3 de prendre la valeur 1, donc parmi N1=C(2,3) combinaisons différentes, la valeur prendra N1*2/3 fois la valeur 1.
Et voilà, nous obtenons ainsi des statistiques exactes pour toutes les cases de notre plateau.
Fin de l'algorithme.
Il faut préciser que cet algorithme abandonne sa recherche de lui-même s'il estime dépasser ses capacités de résolution (matrice trop grande, calcul statistique impossible, etc...) et dans le cas d'un échec passe la main à l'algorithme le plus simple du lot : celui qui joue, dépité, une case au hasard....
IV. Conclusion
On s'aperçoit vite ici du nombre considérable de solutions techniques qui permettaient d'aboutir à un automate démineur. A travers les trois algorithmes exposés ici, trois approches différentes au problème vous sont exposées parmi les très autres nombreux algorithmes existant ou pouvant sortir de votre imagination.
Les challengers nous l'ont prouvé en réalisant leur propres méthodes de résolution, toutes différentes, toutes reflétant, peut-être, leur différentes personalités.
Autant il est clair que la partie système demandait quelques connaissances des API Windows, toutes disponibles dans la FAQ de www.developpez.com, autant la partie "Intelligence Artificielle" faisait plus appel à l'imagination de chacun.
V. Sources |
Copyright © 2006 NoisetteProd Developpez LLC. Tous droits réservés Developpez LLC. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents et images sans l'autorisation expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.