Programming Computable Functions

En informatique théorique, Programming Computable Functions ou PCF est un langage de programmation théorique apparu pour la première fois en 1977 dans un article de Gordon Plotkin[1], mais qui est basé sur des notes de Dana S. Scott de 1969 qui n'ont été publiées qu'en 1993[2]. Ce langage consiste en une extension du lambda-calcul simplement typé avec des combinateurs de points fixes et des entiers naturels, ce qui permet de récupérer la complétude au sens de Turing, c'est-à-dire la possibilité d'exprimer n'importe quelle fonction calculable. En effet, l'ajout d'une discipline de types au lambda-calcul, donnant le lambda-calcul simplement typé, limite l'expressivité du langage et les fonctions qui y sont définissables ; l'ajout de combinateurs de point fixe et d'entiers résout ce problème.

Syntaxe et typage

PCF reprend les types du lambda-calcul simplement typé en y adjoignant un type représentant comme types de base les booléens, , et un type représentant les entiers, [1],[3]. Les types sont donc , , ou avec et des types déjà formés. Ce type représente le type des fonctions de vers . La notation doit être lue comme .

De plus, la syntaxe de PCF comprend la syntaxe du lambda-calcul simplement typé, et les constructions de base y sont les mêmes : il y a des variables, notées  ; si est un terme de type et un terme de type , est un terme de type qui représente l'évaluation de la fonction en  ; et si est un terme de type dans un contexte où la variable est de type , est de type et représente la fonction . Si est un terme de type , on notera . Pour plus de détails, consulter les sections Syntaxe et Règles de typage de l'article sur le lambda-calcul simplement typé.

À cela se rajoutent les constantes propres permettant de manipuler les types de base. Pour chaque entier naturel , on ajoute une constante . De plus, il y a une constante pour chaque booléen, et . Pour chaque type de base , c'est-à-dire et , on a une constante représentant une instruction conditionnelle : l'idée étant que si vaut , l'expression vaut , si vaut , elle s'évalue en . De plus, il y a deux fonctions pour manipuler les entiers, la fonction successeur et la fonction prédécesseur , qui correspondent à ajouter ou soustraire à leur argument. Enfin, il y a une fonction qui renvoie si son argument vaut l'entier , sinon.

Enfin, le principal ingrédient de PCF est sa construction de point fixe : pour chaque type , on dispose d'une constante dont l'interprétation est qu'il renvoie le plus petit point fixe de la fonction qu'on lui passe en argument. Certains auteurs[4] rajoutent à chaque type une constante qui répresente un programme qui ne termine pas. Cette construction n'est pas incluse dans la présentation originelle de Gordon Plotkin[1], mais peut y être définie comme .

Sémantique opérationnelle

PCF peut être muni d'une sémantique opérationnelle [5]. Si et sont des termes, on a si se transforme en après une étape élémentaire de calcul. On note pour dire que se transforme en en zéro ou plusieurs étapes. La relation est définie comme suit :

  •  : pour évaluer l'application de la fonction en , on remplace par dans  ;
  •  : cela exprime que est un point fixe de  ;
  • ;
  •  ;
  •  ;
  •  ;
  •  ;
  •  ;
  • Les règles contextuelles sont les suivantes : si alors , , , et . Elles donnent à PCF une sémantique d'appel par nom.

Cette sémantique est déterministe, c'est-à-dire que si et , alors . De plus, elle préserve le typage : si et que est de type , alors aussi.

On pourrait autoriser la réduction dans tous les contextes, plutôt qu'uniquement dans ceux précisés dans la dernière règle (qui interdit, par exemple, la réduction avec et qui n'est pas une lambda-abstraction ou ou ou ). Dans ce cas, la réduction obtenue préserve encore le typage et est confluente. De plus, si avec cette réduction, et si est en forme normale, alors avec la version restreinte. En clair, la sémantique opérationnelle définie ici est standardisante[6].

Exemple

PCF permet par exemple de définir des programmes effectuant l'addition de deux entiers. En voici un[6] :

.

Si on note la fonction à l'intérieur de , la somme de deux et trois est calculée par la suite de réductions suivante :

.

Ainsi, se réduit bien en la valeur .

Sémantique dénotationnelle

La sémantique opérationnelle présentée plus haut permet de déterminer comment exécuter un terme de PCF comme un programme. Mais pour étudier PCF, il peut être intéressant de traduire un terme comme en une fonction au sens mathématique du terme. C'est le rôle de la sémantique dénotationnelle[7].

Contrairement au lambda-calcul simplement typé, on ne peut pas interpréter PCF directement dans les ensembles et les fonctions, puisqu'il existe des fonctions qui n'ont pas de point fixe. On va donc interpréter les termes de PCF comme des fonctions continues entre cpo. Un cpo est un ensemble ordonné dans lequel toutes les parties dirigées ont une borne supérieure, et qui possède un plus petit élément[8]. L'intérêt des cpo réside dans ce cas chaque fonction continue possède un plus petit point fixe. La catégorie des cpo est cartésienne fermée[9].

La sémantique dénotationnelle va traduire chaque terme par un objet appartenant à un certain modèle, fixé à l'avance. La propriété de correction énoncera ensuite que si , alors .

Modèle continu

Le modèle continu est l'interprétation usuelle de PCF[10],[11]. On va définir pour chaque type, chaque contexte et chaque terme une traduction telle que l'interprétation d'un contexte ou d'un type soit un cpo, et si dans PCF, alors est une fonction continue de l'interprétation du contexte vers l'interprétation du type de .

Les types de base sont interprétés comme des domaines plats : on a et , où est l'ensemble des entiers naturels, l'ensemble des booléens et pour tout ensemble , est le cpo défini sur l'ensemble auquel on adjoint un élément , avec l'ordre défini par pour tout , et les éléments de sont incomparables entre eux. Le type est interprété comme l'ensemble des fonctions continues de vers . L'idée intuitive derrière cet ordre étant que pour deux fonctions et de même type, représentant des fonctions partiellement définies, signifie que est une approximation de , ou que est définie en plus de points que . Un contexte est interprété par . On remarque que chaque type est un cpo, donc a un plus petit élément .

Considérons maintenant un terme typé et son contexte , avec .

L'interprétation des constructions issues du lambda-calcul est la suivante :

  • .
  • .
  • .

L'opérateur de point fixe est définie comme suit :

  • est la fonction qui à chaque associe son plus petit point fixe. Il est défini comme , c'est-à-dire comme le supremum de la suite croissante .
  • Puisque intuitivement, , et que le plus petit point fixe de la fonction identité est , .

Les primitives sur les entiers et les booléens sont interprétées comme suit, l'idée étant que représente une valeur non déterminée, par exemple un programme qui ne termine pas :

  • si et .
  • si et , et .
  • , si et , et .
  • , et .

Modèles standards

Plus généralement, on peut interpréter PCF dans des catégories cartésiennes fermées enrichies dans les cpo[10],[11]. Un tel modèle est appelé modèle standard de PCF. Une catégorie cartésienne fermée enrichie dans les cpo est une catégorie cartésienne fermée telle que :

  • les hom-sets sont des cpo pour tous objets et  ;
  • la composition, le pairage et la currification sont continues ;
  • l'évaluation et la composition sont strictes : pour tous objets , et et tout morphisme , si l'on désigne par le plus petit élément d'un cpo , on a :
    ,
    et si l'on désigne par l'objet des fonctions de vers dans la catégorie cartésienne fermée, par l'opération de pairage et par le morphisme d'évaluation, on a :
.
  • la catégorie possède deux objets et tels que soit isomorphe à et soit isomorphe à en tant que cpo, où l'objet terminal de la catégorie . Dans la catégorie des cpo, est l'ensemble à un élément muni de l'égalité comme relation d'ordre.

Dans ce cas, en interprétant dans les constructions issues du lambda-calcul simplement typé de la façon uselle, en définissant et et en interprétant les constructions sur les types primitifs de la même façon que dans le modèle continu en posant et , ce qui est rendu possible par les isomorphismes et , on obtient la sémantique désirée.

Vocabulaire des modèles standards

On peut distinguer certains types de modèles de PCF :

  • Un modèle est extensionnel[12] si pour tous , si et seulement si , où l'objet terminal de . Cela signifie que peut être vu comme un ensemble de fonctions de vers . Cela correspond à la notion de catégorie bien pointée.
  • Un modèle est extensionnellement ordonné[13] s'il est extensionnel et que pour tous , si et seulement si . Cela signifie que si on regarde et comme des fonctions, l'ordre entre et est l'ordre point à point.

Adéquation

Le théorème d'adéquation (en anglais : adequacy) énonce que dans tout modèle standard, un programme calculant un entier est interprété par l'entier qu'il calcule[14].

Théorème (Adéquation) — Dans tout modèle standard de PCF, pour tout terme clos de type entier, c'est-à-dire si , et pour tout entier , on a : Notons qu'il y a au plus un entier tel que .

On en déduit le corollaire suivant :

Corollaire — Dans les mêmes conditions que précédemment, ne termine pas si et seulement si .

Ce théorème permet de relier la sémantique dénotationnelle et la sémantique opérationnelle de PCF, et de montrer en particulier que la sémantique de PCF ne distingue pas les termes égaux.

Le sens direct de ce résultat est immédiat, c'est la propriété de correction d'un modèle. Le sens réciproque est plus difficile à démontrer ; les démonstrations données par Plotkin[15] ou par Amadio et Curien[14] utilisent la méthode des relations logiques (en), qui consiste grossièrement à séparer cette preuve en deux propriétés, puis à montrer une première propriété par induction sur les types, et une deuxième sur les termes.

Équivalences entre termes

Étant donné deux termes et , on peut se demander à quelle condition ces deux termes sont « les mêmes ».

Équivalence observationnelle

Une première notion d'équivalence entre termes est l'équivalence observationnelle[16],[17] : intuitivement, deux termes sont observationnellement équivalents si on peut remplacer l'un par l'autre dans n'importe quel programme en obtenant le même résultat.

Une première question soulevée par cette définition vient de la notion même de « résultat ». En effet, on ne peut pas distinguer deux fonctions directement : d'une part, le code d'une fonction n'est pas accessible dans PCF, d'autre part, certaines fonctions sont clairement équivalentes, comme et , qui calculent toutes deux l'identité, mais sont en forme normale pour . Le seul moyen de distinguer deux fonctions est d'appliquer chacune à un même argument, et observer que leurs résultats diffèrent.

En revanche, étant donné les booléens et , il est évident qu'ils sont différents. On définit donc les termes observables comme ceux qu'on peut intuitivement séparer : il s'agit des entiers pour et des booléens et . Sans perte de généralité, les résultats qui suivront ne mentionneront que les entiers.

Si et sont des termes clos d'un type de base, ils sont observationnellement équivalents s'ils se réduisent tous deux vers le même observable, ou si tous les deux ne terminent pas. Dans le cas plus général, si n'est pas un type de base, il n'y a pas d'observable de type , et si et ne sont pas clos, alors ils pourraient se réduire vers des variables, qu'on ne sait pas distinguer intuitivement non plus. On définit donc la notion de contexte (différente de dans , qu'on appelle aussi contexte) : un contexte est un terme avec exactement un « trou », c'est-à-dire qu'exactement un sous-terme est remplacé par . Un contexte peut-être typé, et une opération naturelle consiste à remplacer le trou par un terme du même type : on note cela . Un contexte clos d'un type de base permet ainsi de représenter un programme, dont on sait qu'il va s'évaluer vers un observable, et dans lequel on peut mettre soit , soit .

Définition (équivalence observationnelle) — Si et alors on dit que et sont observationnellement équivalents et on note lorsque pour contexte clos et de type , et pour tout entier , on a :

Par exemple, on peut distinguer les deux fonctions et de type , dans le contexte , puisque dans ce contexte, la première fonction se réduit vers tandis que la deuxième se réduit vers .

Plus généralement, on peut définir un préordre entre termes d'un même type pour lequel est plus petit que si représente un programme qui étend , dans le sens où quand renvoie un résultat, renvoie le même, peut être défini sur plus d'arguments que .

Définition (préordre observationnel) — Si et alors on note lorsque pour tout contexte clos et de type , et pour tout entier , on a :

Par exemple, si et sont des fonctions de telle que renvoie toujours , sauf en , où renvoie , alors si et seulement si .

Équivalence dénotationnelle

Tout modèle standard induit également une notion d'équivalence entre deux termes[18], à savoir le fait qu'ils aient la même dénotation. De même, un modèle induit également une relation d'ordre entre termes, où est plus petit que lorsque . Cette relation capture l'idée que dans le modèle, est plus défini que . Ces relations dépendent du modèle choisi.

Complète adéquation

On peut se demander dans quelle mesure ces deux notions d'équivalence sont comparables[18]. De manière générale, le théorème d'adéquation peut se reformuler comme le fait que pour termes et , si et seulement si pour tout contexte clos et de type entier, [19].

Ce théorème a deux conséquences intéressantes : La première est que pour tous termes clos et de type entier, , donc qu'équivalence dénotationnelle et observationnelle coïncident au niveau des types de base[17]. La seconde est que pour tous termes et , (donc en particulier que )[20],[21].

Définition (Complète adéquation) — Un modèle standard de PCF est dit complètement adéquat[18],[20],[17] (en anglais : fully abstract) lorsque pour tous termes et , la propriété suivante, dite de complète adéquation (en anglais : full abstraction), est vérifiée :

Plotkin a montré que cette propriété n'est pas vérifiée par le modèle continu de PCF[22]. On peut en effet définir dans ce modèle la fonction « ou parallèle » (en anglais : parallel or) dans ce modèle, qui est définie par :

En revanche, cette fonction n'est pas définissable dans PCF : aucun terme n'est tel que . Intuitivement, un tel terme lancerait en parallèle les deux programmes qu'on lui passe en argument, renvoyant vrai dès que l'un d'eux retourne vrai, ou faux si les deux retournent faux. Au contraire, PCF est un langage séquentiel[23],[20], qui ne supporte pas l'exécution entrelacée.

On peut montrer que si on définit, pour chaque booléen , le terme suivant :

Alors , mais car pour tout booléen , , donc le modèle standard de PCF n'est pas complètement abstrait[20]. En revanche, ce modèle est complètement abstrait pour une version de PCF à laquelle on a rajouté une primitive représentant [24].

Problème de la complète adéquation

Milner a fourni en premier en 1977 un modèle complètement adéquat de PCF en quotiantant la syntaxe de PCF pour identifier les termes observationnellement équivalents. Il a de plus donné, sous certaines conditions, une caractérisation des modèles complètement adéquats de PCF[25] :

Théorème (Caractérisation des modèles extensionnellement ordonnés complètement adéquats[26]) — Un modèle de PCF extensionnellement ordonné est complètement adéquat si et seulement tous les hom-sets sont algébriques et tous les éléments compacts sont définissables.

De plus, il a montré que sous ces conditions, tous ces modèles sont isomorphes[25]:

Théorème (Unicité des modèles extensionnellement ordonnés complètement adéquats[26]) — Tous les modèles extensionnellement ordonnés et complètement adéquats de PCF sont isomorphes entre eux, et cet isomorphisme préserve l'ordre.

Néanmoins le modèle proposé par Milner n'a pas été jugé satisfaisant par la communauté scientifique, qui désirait trouver un modèle plus sémantique[26]. La communauté scientifique a donc essayé de trouver une description plus sémantique de cet unique modèle complètement adéquat[17]. Un compte rendu détaillé de cette recherche est décrit au début de l'article d'Hyland et Ong[27], ainsi que dans l'article de Curien[17]. Gérard Berry a proposé ensuite en 1978 le modèle stable de PCF[28],[29], qui est extensionnel mais pas extensionnellement ordonné, puis Berry et Curien ont proposé en 1982 le modèle des algorithmes séquentiels[30],[31], qui n'est pas extensionnel. Dans ces deux modèles, il y a des éléments compacts non définissables[17]. Cela à ouvert la voie à d'autres travaux qui tentaient de définir la séquentialité pour les fonctions d'ordre supérieur, notamment par Antonio Bucciarelli et Thomas Ehrhard[32],[33].

En 2000, Martin Hyland et Luke Ong et Samson Abramsky, Radha Jagadeesan et Pasquale Malacaria ont indépendamment proposé chacun un modèle basé sur la sémantique des jeux, le modèle des jeux OH[27] et le modèle des jeux AJM[34] (nommés d'après les initiales respectives de leurs auteurs). Ces modèles présentent la propriété que tous les éléments compacts sont définissables, mais ils ne sont pas extensionnels, et correspondent à des descriptions purement sémantiques de la catégorie des arbres de Böhm de PCF[17]. Il est possible, via une construction catégorique, de rendre ces modèles extensionnellement ordonnés, et donc d'obtenir à partir de ces modèles une description du modèle complètement adéquat de PCF[35],[17].

Ceci conclut la quête de la solution au problème de la complète adéquation, puisqu'en 2001 Ralph Loader a montré que la relation d'équivalence observationnelle dans PCF finitaire, c'est-à-dire PCF sans les entiers, avec uniquement les booléens comme type de base, était indécidable[36], et donc qu'un modèle de PCF vérifiant les critères de Achim Jung and Allen Stoughton[37], qui précisent que les objets interprétants les types finis doivent être effectivement décrits, est impossible.

Expressivité

Turing-complétude

Si est un programme dans PCF qui prend entiers en entrée et renvoie un entier, on peut montrer que détermine une fonction calculable par si et n'est pas définie sinon.

Réciproquement, étant donnée une fonction calculable , on peut se demander si elle est représentée par un terme de PCF tel que pour tous entiers et ,

.

Ce problème correspond à la notion de complétude au sens de Turing. La réponse est positive, donc PCF peut représenter toutes les fonctions calculables entre les entiers[38].

Bibliographie

Notes et références

  1. a b et c (en) Gordon Plotkin, « LCF considered as a programming language », Theoretical Computer Science, vol. 5, no 3,‎ , p. 223–255 (DOI 10.1016/0304-3975(77)90044-5 Accès libre, lire en ligne Accès libre [PDF])
  2. (en) Dana S. Scott, « A type-theoretical alternative to ISWIM, CUCH, OWHY », Theoretical Computer Science, vol. 121, no 1,‎ , p. 411–440 (ISSN 0304-3975, DOI 10.1016/0304-3975(93)90095-B Accès libre, lire en ligne Accès libre [PDF], consulté le ) — distribué à l'origine comme des notes non publiées d'un séminaire donné à Oxford en 1969 sous le nom A theory of computable functions of higher type.
  3. Amadio et Curien 1998, p. 149
  4. Amadio et Curien 1998, p. 145
  5. Amadio et Curien 1998, p. 151
  6. a et b Amadio et Curien 1998, p. 150
  7. Amadio et Curien 1998, p. 5
  8. Amadio et Curien 1998, p. 14-15
  9. Amadio et Curien 1998, p. 95
  10. a et b Amadio et Curien 1998, p. 146
  11. a et b Amadio et Curien 1998, p. 149-150
  12. Amadio et Curien 1998, p. 104
  13. Amadio et Curien 1998, p. 150
  14. a et b Amadio et Curien 1998, p. 152
  15. Plotkin 1977, p. 230
  16. Amadio et Curien 1998, p. 154-155
  17. a b c d e f g et h (en) Pierre-Louis Curien, « Definability and Full Abstraction », Electronic Notes in Theoretical Computer Science, computation, Meaning, and Logic: Articles dedicated to Gordon Plotkin, vol. 172,‎ , p. 301–310 (ISSN 1571-0661, DOI 10.1016/j.entcs.2007.02.011 Accès libre, lire en ligne Accès libre [PDF], consulté le )
  18. a b et c Plotkin 1977, p. 233-234
  19. Amadio et Curien 1998, p. 154
  20. a b c et d Amadio et Curien 1998, p. 155-156
  21. Plotkin 1977, p. 244
  22. 155-156
  23. Plotkin 1977, p. 235-236, Plotkin nomme ce résultat « activité ».
  24. Plotkin 1977, p. 237
  25. a et b Robin Milner, « Fully abstract models of typed λ-calculi », Theoretical Computer Science, vol. 4, no 1,‎ , p. 1–22 (ISSN 0304-3975, DOI 10.1016/0304-3975(77)90053-6, lire en ligne, consulté le )
  26. a b et c Curien et Amadio 1998, p. 156-157
  27. a et b (en) [[Martin Hyland|J. M. E. Hyland]] et C. -H. L. Ong, « On Full Abstraction for PCF: I, II, and III », Information and Computation, vol. 163, no 2,‎ , p. 285–408 (ISSN 0890-5401, DOI 10.1006/inco.2000.2917)
  28. (en) Gérard Berry, « Stable models of typed λ-calculi », Automata, Languages and Programming, Springer,‎ , p. 72–89 (ISBN 978-3-540-35807-7, DOI 10.1007/3-540-08860-1_7 Accès payant)
  29. Amadio et Curien 1998, p. 305-310
  30. (en) G. Berry et P. L. Curien, « Sequential algorithms on concrete data structures », Theoretical Computer Science, vol. 20, no 3,‎ , p. 265–321 (ISSN 0304-3975, DOI 10.1016/S0304-3975(82)80002-9 Accès libre)
  31. Amadio et Curien 1998, p. 386-396
  32. (en) A. Bucciarelli et T. Ehrhard, « Sequentiality and strong stability », [1991] Proceedings Sixth Annual IEEE Symposium on Logic in Computer Science,‎ , p. 138–145 (DOI 10.1109/LICS.1991.151638 Accès payant)
  33. (en) Antonio Bucciarelli et Thomas Ehrhard, « A theory of sequentiality », Theoretical Computer Science, vol. 113, no 2,‎ , p. 273–291 (ISSN 0304-3975, DOI 10.1016/0304-3975(93)90005-E Accès libre)
  34. (en) [[Samson Abramsky|Samson Abramsky]], Radha Jagadeesan et Pasquale Malacaria, « Full Abstraction for PCF », Information and Computation, vol. 163, no 2,‎ , p. 409–470 (ISSN 0890-5401, DOI 10.1006/inco.2000.2930 Accès libre)
  35. Curien et Amadio 1998, p. 162-163
  36. (en) Ralph Loader, « Finitary PCF is not decidable », Theoretical Computer Science, vol. 266, no 1,‎ , p. 341–364 (ISSN 0304-3975, DOI 10.1016/S0304-3975(00)00194-8 Accès libre)
  37. (en) Achim Jung et Allen Stoughton, « Studying the fully abstract model of PCF within its continuous function model », Typed Lambda Calculi and Applications, Springer,‎ , p. 230–244 (ISBN 978-3-540-47586-6, DOI 10.1007/BFb0037109, lire en ligne, consulté le )
  38. Scott 1993, p. 435
Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya