PCF reprend les types du lambda-calcul simplement typé en y adjoignant un type représentant comme types de base les booléens, , et un type représentant les entiers, [1],[3]. Les types sont donc , , ou avec et des types déjà formés. Ce type représente le type des fonctions de vers . La notation doit être lue comme .
De plus, la syntaxe de PCF comprend la syntaxe du lambda-calcul simplement typé, et les constructions de base y sont les mêmes : il y a des variables, notées ; si est un terme de type et un terme de type , est un terme de type qui représente l'évaluation de la fonction en ; et si est un terme de type dans un contexte où la variable est de type , est de type et représente la fonction . Si est un terme de type , on notera . Pour plus de détails, consulter les sections Syntaxe et Règles de typage de l'article sur le lambda-calcul simplement typé.
À cela se rajoutent les constantes propres permettant de manipuler les types de base. Pour chaque entier naturel , on ajoute une constante . De plus, il y a une constante pour chaque booléen, et . Pour chaque type de base , c'est-à-dire et , on a une constante représentant une instruction conditionnelle : l'idée étant que si vaut , l'expression vaut , si vaut , elle s'évalue en . De plus, il y a deux fonctions pour manipuler les entiers, la fonction successeur et la fonction prédécesseur , qui correspondent à ajouter ou soustraire à leur argument. Enfin, il y a une fonction qui renvoie si son argument vaut l'entier , sinon.
Enfin, le principal ingrédient de PCF est sa construction de point fixe : pour chaque type , on dispose d'une constante dont l'interprétation est qu'il renvoie le plus petit point fixe de la fonction qu'on lui passe en argument. Certains auteurs[4] rajoutent à chaque type une constante qui répresente un programme qui ne termine pas. Cette construction n'est pas incluse dans la présentation originelle de Gordon Plotkin[1], mais peut y être définie comme .
Sémantique opérationnelle
PCF peut être muni d'une sémantique opérationnelle[5]. Si et sont des termes, on a si se transforme en après une étape élémentaire de calcul. On note pour dire que se transforme en en zéro ou plusieurs étapes. La relation est définie comme suit :
: pour évaluer l'application de la fonction en , on remplace par dans ;
: cela exprime que est un point fixe de ;
;
;
;
;
;
;
Les règles contextuelles sont les suivantes : si alors , , , et . Elles donnent à PCF une sémantique d'appel par nom.
Cette sémantique est déterministe, c'est-à-dire que si et , alors . De plus, elle préserve le typage : si et que est de type , alors aussi.
On pourrait autoriser la réduction dans tous les contextes, plutôt qu'uniquement dans ceux précisés dans la dernière règle (qui interdit, par exemple, la réduction avec et qui n'est pas une lambda-abstraction ou ou ou ). Dans ce cas, la réduction obtenue préserve encore le typage et est confluente. De plus, si avec cette réduction, et si est en forme normale, alors avec la version restreinte. En clair, la sémantique opérationnelle définie ici est standardisante[6].
Exemple
PCF permet par exemple de définir des programmes effectuant l'addition de deux entiers. En voici un[6] :
.
Si on note la fonction à l'intérieur de , la somme de deux et trois est calculée par la suite de réductions suivante :
.
Ainsi, se réduit bien en la valeur .
Sémantique dénotationnelle
La sémantique opérationnelle présentée plus haut permet de déterminer comment exécuter un terme de PCF comme un programme. Mais pour étudier PCF, il peut être intéressant de traduire un terme comme en une fonction au sens mathématique du terme. C'est le rôle de la sémantique dénotationnelle[7].
Contrairement au lambda-calcul simplement typé, on ne peut pas interpréter PCF directement dans les ensembles et les fonctions, puisqu'il existe des fonctions qui n'ont pas de point fixe. On va donc interpréter les termes de PCF comme des fonctions continues entre cpo. Un cpo est un ensemble ordonné dans lequel toutes les parties dirigées ont une borne supérieure, et qui possède un plus petit élément[8]. L'intérêt des cpo réside dans ce cas chaque fonction continue possède un plus petit point fixe. La catégorie des cpo est cartésienne fermée[9].
La sémantique dénotationnelle va traduire chaque terme par un objet appartenant à un certain modèle, fixé à l'avance. La propriété de correction énoncera ensuite que si , alors .
Modèle continu
Le modèle continu est l'interprétation usuelle de PCF[10],[11]. On va définir pour chaque type, chaque contexte et chaque terme une traduction telle que l'interprétation d'un contexte ou d'un type soit un cpo, et si dans PCF, alors est une fonction continue de l'interprétation du contexte vers l'interprétation du type de .
Les types de base sont interprétés comme des domaines plats : on a et , où est l'ensemble des entiers naturels, l'ensemble des booléens et pour tout ensemble , est le cpo défini sur l'ensemble auquel on adjoint un élément , avec l'ordre défini par pour tout , et les éléments de sont incomparables entre eux. Le type est interprété comme l'ensemble des fonctions continues de vers . L'idée intuitive derrière cet ordre étant que pour deux fonctions et de même type, représentant des fonctions partiellement définies, signifie que est une approximation de , ou que est définie en plus de points que . Un contexte est interprété par . On remarque que chaque type est un cpo, donc a un plus petit élément .
Considérons maintenant un terme typé et son contexte , avec .
L'interprétation des constructions issues du lambda-calcul est la suivante :
.
.
.
L'opérateur de point fixe est définie comme suit :
est la fonction qui à chaque associe son plus petit point fixe. Il est défini comme , c'est-à-dire comme le supremum de la suite croissante .
Puisque intuitivement, , et que le plus petit point fixe de la fonction identité est , .
Les primitives sur les entiers et les booléens sont interprétées comme suit, l'idée étant que représente une valeur non déterminée, par exemple un programme qui ne termine pas :
si et .
si et , et .
, si et , et .
, et .
Modèles standards
Plus généralement, on peut interpréter PCF dans des catégories cartésiennes fermées enrichies dans les cpo[10],[11]. Un tel modèle est appelé modèle standard de PCF. Une catégorie cartésienne fermée enrichie dans les cpo est une catégorie cartésienne fermée telle que :
l'évaluation et la composition sont strictes : pour tous objets , et et tout morphisme , si l'on désigne par le plus petit élément d'un cpo , on a :
,
et si l'on désigne par l'objet des fonctions de vers dans la catégorie cartésienne fermée, par l'opération de pairage et par le morphisme d'évaluation, on a :
.
la catégorie possède deux objets et tels que soit isomorphe à et soit isomorphe à en tant que cpo, où l'objet terminal de la catégorie . Dans la catégorie des cpo, est l'ensemble à un élément muni de l'égalité comme relation d'ordre.
Dans ce cas, en interprétant dans les constructions issues du lambda-calcul simplement typé de la façon uselle, en définissant et et en interprétant les constructions sur les types primitifs de la même façon que dans le modèle continu en posant et , ce qui est rendu possible par les isomorphismes et , on obtient la sémantique désirée.
Vocabulaire des modèles standards
On peut distinguer certains types de modèles de PCF :
Un modèle est extensionnel[12] si pour tous , si et seulement si , où l'objet terminal de . Cela signifie que peut être vu comme un ensemble de fonctions de vers . Cela correspond à la notion de catégorie bien pointée.
Un modèle est extensionnellement ordonné[13] s'il est extensionnel et que pour tous , si et seulement si . Cela signifie que si on regarde et comme des fonctions, l'ordre entre et est l'ordre point à point.
Adéquation
Le théorème d'adéquation (en anglais : adequacy) énonce que dans tout modèle standard, un programme calculant un entier est interprété par l'entier qu'il calcule[14].
Théorème(Adéquation) — Dans tout modèle standard de PCF, pour tout terme clos de type entier, c'est-à-dire si , et pour tout entier , on a :
Notons qu'il y a au plus un entier tel que .
On en déduit le corollaire suivant :
Corollaire — Dans les mêmes conditions que précédemment, ne termine pas si et seulement si .
Ce théorème permet de relier la sémantique dénotationnelle et la sémantique opérationnelle de PCF, et de montrer en particulier que la sémantique de PCF ne distingue pas les termes égaux.
Le sens direct de ce résultat est immédiat, c'est la propriété de correction d'un modèle. Le sens réciproque est plus difficile à démontrer ; les démonstrations données par Plotkin[15] ou par Amadio et Curien[14] utilisent la méthode des relations logiques(en), qui consiste grossièrement à séparer cette preuve en deux propriétés, puis à montrer une première propriété par induction sur les types, et une deuxième sur les termes.
Équivalences entre termes
Étant donné deux termes et , on peut se demander à quelle condition ces deux termes sont « les mêmes ».
Équivalence observationnelle
Une première notion d'équivalence entre termes est l'équivalence observationnelle[16],[17] : intuitivement, deux termes sont observationnellement équivalents si on peut remplacer l'un par l'autre dans n'importe quel programme en obtenant le même résultat.
Une première question soulevée par cette définition vient de la notion même de « résultat ». En effet, on ne peut pas distinguer deux fonctions directement : d'une part, le code d'une fonction n'est pas accessible dans PCF, d'autre part, certaines fonctions sont clairement équivalentes, comme et , qui calculent toutes deux l'identité, mais sont en forme normale pour . Le seul moyen de distinguer deux fonctions est d'appliquer chacune à un même argument, et observer que leurs résultats diffèrent.
En revanche, étant donné les booléens et , il est évident qu'ils sont différents. On définit donc les termes observables comme ceux qu'on peut intuitivement séparer : il s'agit des entiers pour et des booléens et . Sans perte de généralité, les résultats qui suivront ne mentionneront que les entiers.
Si et sont des termes clos d'un type de base, ils sont observationnellement équivalents s'ils se réduisent tous deux vers le même observable, ou si tous les deux ne terminent pas. Dans le cas plus général, si n'est pas un type de base, il n'y a pas d'observable de type , et si et ne sont pas clos, alors ils pourraient se réduire vers des variables, qu'on ne sait pas distinguer intuitivement non plus. On définit donc la notion de contexte (différente de dans , qu'on appelle aussi contexte) : un contexte est un terme avec exactement un « trou », c'est-à-dire qu'exactement un sous-terme est remplacé par . Un contexte peut-être typé, et une opération naturelle consiste à remplacer le trou par un terme du même type : on note cela . Un contexte clos d'un type de base permet ainsi de représenter un programme, dont on sait qu'il va s'évaluer vers un observable, et dans lequel on peut mettre soit , soit .
Définition(équivalence observationnelle) — Si et alors on dit que et sont observationnellement équivalents et on note lorsque pour contexte clos et de type , et pour tout entier , on a :
Par exemple, on peut distinguer les deux fonctions et de type , dans le contexte , puisque dans ce contexte, la première fonction se réduit vers tandis que la deuxième se réduit vers .
Plus généralement, on peut définir un préordre entre termes d'un même type pour lequel est plus petit que si représente un programme qui étend , dans le sens où quand renvoie un résultat, renvoie le même, peut être défini sur plus d'arguments que .
Définition(préordre observationnel) — Si et alors on note lorsque pour tout contexte clos et de type , et pour tout entier , on a :
Par exemple, si et sont des fonctions de telle que renvoie toujours , sauf en , où renvoie , alors si et seulement si .
Équivalence dénotationnelle
Tout modèle standard induit également une notion d'équivalence entre deux termes[18], à savoir le fait qu'ils aient la même dénotation. De même, un modèle induit également une relation d'ordre entre termes, où est plus petit que lorsque . Cette relation capture l'idée que dans le modèle, est plus défini que . Ces relations dépendent du modèle choisi.
Complète adéquation
On peut se demander dans quelle mesure ces deux notions d'équivalence sont comparables[18]. De manière générale, le théorème d'adéquation peut se reformuler comme le fait que pour termes et , si et seulement si pour tout contexte clos et de type entier, [19].
Ce théorème a deux conséquences intéressantes : La première est que pour tous termes clos et de type entier, , donc qu'équivalence dénotationnelle et observationnelle coïncident au niveau des types de base[17]. La seconde est que pour tous termes et , (donc en particulier que )[20],[21].
Définition(Complète adéquation) — Un modèle standard de PCF est dit complètement adéquat[18],[20],[17] (en anglais : fully abstract) lorsque pour tous termes et , la propriété suivante, dite de complète adéquation (en anglais : full abstraction), est vérifiée :
Plotkin a montré que cette propriété n'est pas vérifiée par le modèle continu de PCF[22]. On peut en effet définir dans ce modèle la fonction « ou parallèle » (en anglais : parallel or) dans ce modèle, qui est définie par :
En revanche, cette fonction n'est pas définissable dans PCF : aucun terme n'est tel que . Intuitivement, un tel terme lancerait en parallèle les deux programmes qu'on lui passe en argument, renvoyant vrai dès que l'un d'eux retourne vrai, ou faux si les deux retournent faux. Au contraire, PCF est un langage séquentiel[23],[20], qui ne supporte pas l'exécution entrelacée.
On peut montrer que si on définit, pour chaque booléen , le terme suivant :
Alors , mais car pour tout booléen , , donc le modèle standard de PCF n'est pas complètement abstrait[20]. En revanche, ce modèle est complètement abstrait pour une version de PCF à laquelle on a rajouté une primitive représentant [24].
Problème de la complète adéquation
Milner a fourni en premier en 1977 un modèle complètement adéquat de PCF en quotiantant la syntaxe de PCF pour identifier les termes observationnellement équivalents. Il a de plus donné, sous certaines conditions, une caractérisation des modèles complètement adéquats de PCF[25] :
Théorème(Caractérisation des modèles extensionnellement ordonnés complètement adéquats[26]) — Un modèle de PCF extensionnellement ordonné est complètement adéquat si et seulement tous les hom-sets sont algébriques et tous les éléments compacts sont définissables.
De plus, il a montré que sous ces conditions, tous ces modèles sont isomorphes[25]:
Théorème(Unicité des modèles extensionnellement ordonnés complètement adéquats[26]) — Tous les modèles extensionnellement ordonnés et complètement adéquats de PCF sont isomorphes entre eux, et cet isomorphisme préserve l'ordre.
Néanmoins le modèle proposé par Milner n'a pas été jugé satisfaisant par la communauté scientifique, qui désirait trouver un modèle plus sémantique[26]. La communauté scientifique a donc essayé de trouver une description plus sémantique de cet unique modèle complètement adéquat[17]. Un compte rendu détaillé de cette recherche est décrit au début de l'article d'Hyland et Ong[27], ainsi que dans l'article de Curien[17]. Gérard Berry a proposé ensuite en 1978 le modèle stable de PCF[28],[29], qui est extensionnel mais pas extensionnellement ordonné, puis Berry et Curien ont proposé en 1982 le modèle des algorithmes séquentiels[30],[31], qui n'est pas extensionnel. Dans ces deux modèles, il y a des éléments compacts non définissables[17]. Cela à ouvert la voie à d'autres travaux qui tentaient de définir la séquentialité pour les fonctions d'ordre supérieur, notamment par Antonio Bucciarelli et Thomas Ehrhard[32],[33].
En 2000, Martin Hyland et Luke Ong et Samson Abramsky, Radha Jagadeesan et Pasquale Malacaria ont indépendamment proposé chacun un modèle basé sur la sémantique des jeux, le modèle des jeux OH[27] et le modèle des jeux AJM[34] (nommés d'après les initiales respectives de leurs auteurs). Ces modèles présentent la propriété que tous les éléments compacts sont définissables, mais ils ne sont pas extensionnels, et correspondent à des descriptions purement sémantiques de la catégorie des arbres de Böhm de PCF[17]. Il est possible, via une construction catégorique, de rendre ces modèles extensionnellement ordonnés, et donc d'obtenir à partir de ces modèles une description du modèle complètement adéquat de PCF[35],[17].
Ceci conclut la quête de la solution au problème de la complète adéquation, puisqu'en 2001 Ralph Loader a montré que la relation d'équivalence observationnelle dans PCF finitaire, c'est-à-dire PCF sans les entiers, avec uniquement les booléens comme type de base, était indécidable[36], et donc qu'un modèle de PCF vérifiant les critères de Achim Jung and Allen Stoughton[37], qui précisent que les objets interprétants les types finis doivent être effectivement décrits, est impossible.
Expressivité
Turing-complétude
Si est un programme dans PCF qui prend entiers en entrée et renvoie un entier, on peut montrer que détermine une fonction calculable par si et n'est pas définie sinon.
Réciproquement, étant donnée une fonction calculable , on peut se demander si elle est représentée par un terme de PCF tel que pour tous entiers et ,
.
Ce problème correspond à la notion de complétude au sens de Turing. La réponse est positive, donc PCF peut représenter toutes les fonctions calculables entre les entiers[38].
Démonstration —
On sait que les fonctions calculables sont obtenues en ajoutant le schéma de minimisation non bornée aux fonctions primitives récursives, et on peut assez facilement montrer que toutes les fonctions primitives récursives sont encodables dans PCF.
Il reste donc à montrer que PCF supporte l'opération de minimisation non bornée : étant donné un terme , est le plus entier tel que et pour tout si un tel entier existe, et ne se normalise pas sinon.
Pour cela, on définit
par . On vérifie facilement que vérifie bien la propriété désirée.
↑(en) Dana S. Scott, « A type-theoretical alternative to ISWIM, CUCH, OWHY », Theoretical Computer Science, vol. 121, no 1, , p. 411–440 (ISSN0304-3975, DOI10.1016/0304-3975(93)90095-B, lire en ligne [PDF], consulté le ) — distribué à l'origine comme des notes non publiées d'un séminaire donné à Oxford en 1969 sous le nom A theory of computable functions of higher type.
↑ abcdefg et h(en) Pierre-Louis Curien, « Definability and Full Abstraction », Electronic Notes in Theoretical Computer Science, computation, Meaning, and Logic: Articles dedicated to Gordon Plotkin, vol. 172, , p. 301–310 (ISSN1571-0661, DOI10.1016/j.entcs.2007.02.011, lire en ligne [PDF], consulté le )
↑ a et b(en) [[Martin Hyland|J. M. E. Hyland]] et C. -H. L. Ong, « On Full Abstraction for PCF: I, II, and III », Information and Computation, vol. 163, no 2, , p. 285–408 (ISSN0890-5401, DOI10.1006/inco.2000.2917)
↑(en) G. Berry et P. L. Curien, « Sequential algorithms on concrete data structures », Theoretical Computer Science, vol. 20, no 3, , p. 265–321 (ISSN0304-3975, DOI10.1016/S0304-3975(82)80002-9)
↑(en) A. Bucciarelli et T. Ehrhard, « Sequentiality and strong stability », [1991] Proceedings Sixth Annual IEEE Symposium on Logic in Computer Science, , p. 138–145 (DOI10.1109/LICS.1991.151638)
↑(en) Antonio Bucciarelli et Thomas Ehrhard, « A theory of sequentiality », Theoretical Computer Science, vol. 113, no 2, , p. 273–291 (ISSN0304-3975, DOI10.1016/0304-3975(93)90005-E)
↑(en) Achim Jung et Allen Stoughton, « Studying the fully abstract model of PCF within its continuous function model », Typed Lambda Calculi and Applications, Springer, , p. 230–244 (ISBN978-3-540-47586-6, DOI10.1007/BFb0037109, lire en ligne, consulté le )