Programming Computable Functions

En informatique théorique, Programming Computable Functions ou PCF est un langage de programmation théorique apparu pour la première fois dans une publication en 1977 dans un article de Gordon Plotkin^[1], mais qui est basé sur des notes de Dana S. Scott de 1969 qui n'ont été publiées qu'en 1993^[2]. Ce langage consiste en une extension du lambda-calcul simplement typé avec des combinateurs de points fixes et des entiers naturels, ce qui permet de récupérer la complétude au sens de Turing, c'est-à-dire la possibilité d'exprimer n'importe quelle fonction calculable. En effet, l'ajout d'une discipline de types au lambda-calcul, donnant le lambda-calcul simplement typé, limite l'expressivité du langage et les fonctions qui y sont définissables ; l'ajout de combinateurs de point fixe et d'entiers résout ce problème.

Syntaxe et typage

PCF reprend les types du lambda-calcul simplement typé en y adjoignant un type représentant comme types de base les booléens, $o$ , et un type représentant les entiers, $\iota$ ^[1]^,^[3]. Les types sont donc $o$ , $\iota$ , ou $\alpha \to \beta$ avec $\alpha$ et $\beta$ des types déjà formés. Ce type représente le type des fonctions de $\alpha$ vers $\beta$ . La notation $\alpha \to \beta \to \gamma$ doit être lue comme $\alpha \to (\beta \to \gamma )$ .

De plus, la syntaxe de PCF comprend la syntaxe du lambda-calcul simplement typé, et les constructions de base y sont les mêmes : il y a des variables, notées $x,y,z,\dots$ ; si $M$ est un terme de type $\alpha \to \beta$ et $N$ un terme de type $\alpha$ , $MN$ est un terme de type $\beta$ qui représente l'évaluation de la fonction $M$ en $N$ ; et si $M$ est un terme de type $\beta$ dans un contexte où la variable $x$ est de type $\alpha$ , $\lambda x^{\alpha }.M$ est de type $\alpha \to \beta$ et représente la fonction $x\mapsto M$ . Si $M$ est un terme de type $\alpha$ , on notera $M:\alpha$ . Pour plus de détails, consulter les sections Syntaxe et Règles de typage de l'article sur le lambda-calcul simplement typé.

À cela se rajoutent les constantes propres permettant de manipuler les types de base. Pour chaque entier naturel $n\in \mathbb {N}$ , on ajoute une constante ${\underline {n}}:\iota$ . De plus, il y a une constante pour chaque booléen, $\operatorname {true} :o$ et $\operatorname {false} :o$ . Pour chaque type de base $\sigma$ , c'est-à-dire $\iota$ et $o$ , on a une constante $\operatorname {if} \ \operatorname {then} \ \operatorname {else} :o\to \sigma \to \sigma \to \sigma$ représentant une instruction conditionnelle : l'idée étant que si $b$ vaut $\operatorname {true}$ , l'expression $\operatorname {if} b\operatorname {then} M\operatorname {else} N$ vaut $M$ , si $b$ vaut $\operatorname {false}$ , elle s'évalue en $N$ . De plus, il y a deux fonctions pour manipuler les entiers, la fonction successeur $\operatorname {succ} :\iota \to \iota$ et la fonction prédécesseur $\operatorname {pred} :\iota \to \iota$ , qui correspondent à ajouter ou soustraire $1$ à leur argument. Enfin, il y a une fonction $\operatorname {zero} ?:\iota \to o$ qui renvoie $\operatorname {true}$ si son argument vaut l'entier ${\underline {0}}$ , $\operatorname {false}$ sinon.

Enfin, le principal ingrédient de PCF est sa construction de point fixe : pour chaque type $\alpha$ , on dispose d'une constante $Y:(\alpha \to \alpha )\to \alpha$ dont l'interprétation est qu'il renvoie le plus petit point fixe de la fonction qu'on lui passe en argument. Certains auteurs^[4] rajoutent à chaque type une constante $\Omega :\alpha$ qui répresente un programme qui ne termine pas. Cette construction n'est pas incluse dans la présentation originelle de Gordon Plotkin^[1], mais peut y être définie comme $Y(\lambda x^{\alpha }.x)$ .

Sémantique opérationnelle

PCF peut être muni d'une sémantique opérationnelle $\to$ ^[5]. Si $M$ et $N$ sont des termes, on a $M\to N$ si $M$ se transforme en $N$ après une étape élémentaire de calcul. On note $M\to ^{*}N$ pour dire que $M$ se transforme en $N$ en zéro ou plusieurs étapes. La relation $\to$ est définie comme suit :

$(\lambda x^{\alpha }.M)N\to M[x:=N]$ : pour évaluer l'application de la fonction $x\mapsto M$ en $N$ , on remplace $x$ par $N$ dans $M$ ;
$YM\to M(YM)$ : cela exprime que $YM$ est un point fixe de $M$ ;
$\operatorname {succ} ({\underline {n}})\to {\underline {n+1}}$ ;
$\operatorname {pred} ({\underline {n+1}})\to {\underline {n}}$ ;
$\operatorname {zero} ?({\underline {0}})\to \operatorname {true}$ ;
$\operatorname {zero} ?({\underline {n+1}})\to \operatorname {false}$ ;
$\operatorname {if} \operatorname {true} \operatorname {then} M\operatorname {else} N\to M$ ;
$\operatorname {if} \operatorname {false} \operatorname {then} M\operatorname {else} N\to N$ ;
Les règles contextuelles sont les suivantes : si $M\to M'$ alors $MN\to M'N$ , $\operatorname {succ} M\to \operatorname {succ} M'$ , $\operatorname {pred} M\to \operatorname {pred} M'$ , $\operatorname {zero} ?(M)\to \operatorname {zero} ?(M')$ et $\operatorname {if} M\operatorname {then} N\operatorname {else} P\to \operatorname {if} M'\operatorname {then} N\operatorname {else} P$ . Elles donnent à PCF une sémantique d'appel par nom.

Cette sémantique est déterministe, c'est-à-dire que si $M\to N$ et $M\to N'$ , alors $N=N'$ . De plus, elle préserve le typage : si $M\to N$ et $M$ est de type $\alpha$ , alors $N$ aussi.

On pourrait autoriser la réduction dans tous les contextes, plutôt qu'uniquement dans ceux précisés dans la dernière règle (qui interdit, par exemple, la réduction $NM\to NM'$ avec $M\to M'$ et $N$ qui n'est pas une lambda-abstraction ou $\operatorname {succ}$ ou $\operatorname {pred}$ ou $\operatorname {zero} ?$ ). Dans ce cas, la réduction obtenue préserve encore le typage et est confluente. De plus, si $M\to ^{*}N$ avec cette réduction, et si $N$ est en forme normale, alors $M\to ^{*}N$ avec la version restreinte. En clair, la sémantique opérationnelle définie ici est standardisante^[6].

Exemple

PCF permet par exemple de définir des programmes effectuant l'addition de deux entiers. En voici un^[6] :

add:=Y(\lambda f^{\iota \to \iota \to \iota }.\lambda x^{\iota }.\lambda y^{\iota }.\operatorname {if} \operatorname {zero} ?(x)\operatorname {then} y\operatorname {else} \operatorname {succ} (f(\operatorname {pred} x)y))

.

Si on note $add'$ la fonction à l'intérieur de $Y$ , la somme de deux et trois est calculée par la suite de réductions suivante :

add~{\underline {2}}~{\underline {3}}\to add'~add~{\underline {2}}~{\underline {3}}\to ^{*}\operatorname {if} \operatorname {zero} ?({\underline {0}})\operatorname {then} {\underline {3}}\operatorname {else} \operatorname {succ} (add(\operatorname {pred} {\underline {2}}){\underline {3}})\to ^{*}\operatorname {succ} (add~{\underline {1}}~{\underline {3}})\to ^{*}

$\operatorname {succ} (\operatorname {if} \operatorname {zero} ?({\underline {1}})\operatorname {then} {\underline {3}}\operatorname {else} \operatorname {succ} (add(\operatorname {pred} {\underline {1}}){\underline {3}}))\to ^{*}\operatorname {succ} (\operatorname {succ} (add~{\underline {0}}~{\underline {3}}))\to ^{*}$

\operatorname {succ} (\operatorname {succ} (\operatorname {if} \operatorname {zero} ?({\underline {0}})\operatorname {then} {\underline {3}}\operatorname {else} \operatorname {succ} (add(\operatorname {pred} {\underline {0}}){\underline {3}})))\to ^{*}\operatorname {succ} (\operatorname {succ} ({\underline {3}})))\to ^{*}{\underline {5}}

.

Ainsi, $\operatorname {add} ~{\underline {2}}~{\underline {3}}$ se réduit bien en la valeur ${\underline {5}}$ .

Sémantique dénotationnelle

La sémantique opérationnelle présentée plus haut permet de déterminer comment exécuter un terme de PCF comme un programme. Mais pour étudier PCF, il peut être intéressant de traduire un terme comme $\lambda x^{\alpha }.M$ en une fonction au sens mathématique du terme. C'est le rôle de la sémantique dénotationnelle^[7].

Contrairement au lambda-calcul simplement typé, on ne peut pas interpréter PCF directement dans les ensembles et les fonctions, puisqu'il existe des fonctions qui n'ont pas de point fixe. On va donc interpréter les termes de PCF comme des fonctions continues entre cpo. Un cpo est un ensemble ordonné dans lequel toutes les parties filtrantes ont une borne supérieure, et qui possède un plus petit élément^[8]. L'intérêt des cpo réside dans ce que chaque fonction continue, possède un plus petit point fixe. Une fonction est continue au sens des cpo si elle préserve les bornes supérieures de partie filtrantes. La catégorie des cpo est cartésienne fermée^[9].

La sémantique dénotationnelle va traduire chaque terme $M$ par un objet $[\![M]\!]$ appartenant à un certain modèle, fixé à l'avance. La propriété de correction énoncera ensuite que si $M\to N$ , alors $[\![M]\!]=[\![N]\!]$ .

Modèle continu

Le modèle continu est l'interprétation usuelle de PCF^[10]^,^[11]. On va définir pour chaque type, chaque contexte et chaque terme une traduction $[\![\cdot ]\!]$ telle que l'interprétation d'un contexte ou d'un type soit un cpo, et si $\Gamma \vdash M:\alpha$ dans PCF, alors $[\![M]\!]:[\![\Gamma ]\!]\to [\![\alpha ]\!]$ est une fonction continue de l'interprétation du contexte vers l'interprétation du type de $M$ .

Les types de base sont interprétés comme des domaines plats : on a $[\![\iota ]\!]=\mathbb {N} _{\bot }$ et $[\![o]\!]=\mathbb {B} _{\bot }$ , où $\mathbb {N}$ est l'ensemble des entiers naturels, $\mathbb {B}$ l'ensemble des booléens et pour tout ensemble $X$ , $X_{\bot }$ est le cpo défini sur l'ensemble $X$ auquel on adjoint un élément $\bot$ , avec l'ordre défini par $\bot \leq x$ pour tout $x$ , et les éléments de $X$ sont incomparables entre eux. Intuitivement, $\bot$ désigne un programme qui ne termine pas. Le type $\alpha \to \beta$ est interprété comme l'ensemble des fonctions continues de $[\![\alpha ]\!]$ vers $[\![\beta ]\!]$ . L'idée intuitive derrière cet ordre étant que pour deux fonctions $f$ et $g$ de même type, représentant des fonctions partiellement définies, $f\leq g$ signifie que $f$ est une approximation de $g$ , ou que $g$ est définie en plus de points que $f$ . Un contexte $x_{1}:\alpha _{1},\dots ,x_{n}:\alpha _{n}$ est interprété par $[\![\alpha _{1}]\!]\times \dots \times [\![\alpha _{n}]\!]$ . On remarque que chaque type est un cpo, donc a un plus petit élément $\bot$ .

Considérons maintenant un terme typé et son contexte $\Gamma \vdash M:\alpha$ , avec $\Gamma =x_{1}:\alpha _{1},\dots ,x_{n}:\alpha _{n}$ .

L'interprétation des constructions issues du lambda-calcul est la suivante :

$[\![x_{i}]\!]=(x_{1},\dots ,x_{n})\mapsto x_{i}$ .
$[\![\lambda x^{\alpha }.M]\!]=(x_{1},\dots ,x_{n})\mapsto (x\mapsto [\![M]\!](x_{1},\dots ,x_{n},x))$ .
$[\![MN]\!]=(x_{1},\dots ,x_{n})\mapsto [\![M]\!](x_{1},\dots ,x_{n})([\![N]\!](x_{1},\dots ,x_{n}))$ .

L'opérateur de point fixe est définie comme suit :

$[\![Y]\!]$ est la fonction $([\![\alpha ]\!]\to [\![\alpha ]\!])\to [\![\alpha ]\!]$ qui à chaque $f:[\![\alpha ]\!]\to [\![\alpha ]\!]$ associe son plus petit point fixe. Il est défini comme $\bigvee _{n\in \mathbb {N} }f^{n}(\bot )$ , c'est-à-dire comme le supremum de la suite croissante $\bot ,f(\bot ),f(f(\bot )),\dots$ .
Puisque intuitivement, $\Omega =Y(\lambda x^{\alpha }.x)$ , et que le plus petit point fixe de la fonction identité est $\bot$ , s'il est présent, $[\![\Omega ]\!]=\bot$ .

Les primitives sur les entiers et les booléens sont interprétées comme suit, l'idée étant que $\bot$ représente une valeur non déterminée, par exemple un programme qui ne termine pas :

$[\![\operatorname {succ} ]\!]({\underline {n}})={\underline {n+1}}$ si $n\in \mathbb {N}$ et $[\![\operatorname {succ} ]\!](\bot )=\bot$ .
$[\![\operatorname {pred} ]\!]({\underline {n}})={\underline {n-1}}$ si $n\in \mathbb {N}$ et $n\neq 0$ , $[\![\operatorname {pred} ]\!]({\underline {0}})=\bot$ et $[\![\operatorname {pred} ]\!](\bot )=\bot$ .

$[\![\operatorname {zero} ?]\!]({\underline {0}})=\operatorname {true}$ , $[\![\operatorname {zero} ?]\!]({\underline {n}})=\operatorname {false}$ si $n\in \mathbb {N}$ et $n\neq 0$ , et $[\![\operatorname {zero} ?]\!](\bot )=\bot$ .
$[\![\operatorname {if} \ \operatorname {then} \ \operatorname {else} ]\!](\operatorname {true} )(x)(y)=x$ , $[\![\operatorname {if} \ \operatorname {then} \ \operatorname {else} ]\!](\operatorname {false} )(x)(y)=y$ et $[\![\operatorname {if} \ \operatorname {then} \ \operatorname {else} ]\!](\bot )(x)(y)=y$ .

Modèles standards

Plus généralement, on peut interpréter PCF dans des catégories cartésiennes fermées enrichies dans les cpo^[10]^,^[11]. Un tel modèle est appelé modèle standard de PCF. Une catégorie cartésienne fermée enrichie dans les cpo est une catégorie cartésienne fermée ${\mathcal {C}}$ telle que :

les hom-sets ${\mathcal {C}}(A,B)$ sont des cpo pour tous objets $A$ et $B$ ;
la composition, le pairage et la currification sont continues ;
l'évaluation et la composition sont strictes : pour tous objets $A$ , $B$ et $C$ et tout morphisme $f:A\to B$ , si l'on désigne par $\bot _{D}$ le plus petit élément d'un cpo $D$ , on a :
$\bot _{{\mathcal {C}}(B,C)}\circ f=\bot _{{\mathcal {C}}(A,C)}$ ,
et si l'on désigne par $B\to C$ l'objet des fonctions de $B$ vers $C$ dans la catégorie cartésienne fermée, par $\langle \cdot ,\cdot \rangle$ l'opération de pairage et par $ev_{B,C}:(B\to C)\times B\to C$ le morphisme d'évaluation, on a :

ev_{A,B}\circ \langle \bot _{{\mathcal {C}}(A,B\to C)},f\rangle =\bot _{{\mathcal {C}}(A,C)}

.

la catégorie possède deux objets $D^{\iota }$ et $D^{o}$ tels que ${\mathcal {C}}(1,D^{\iota })$ soit isomorphe à $\mathbb {N} _{\bot }$ et ${\mathcal {C}}(1,D^{o})$ soit isomorphe à $\mathbb {B} _{\bot }$ en tant que cpo, où $1$ l'objet terminal de la catégorie ${\mathcal {C}}$ . Dans la catégorie des cpo, $1$ est l'ensemble à un élément muni de l'égalité comme relation d'ordre.

Dans ce cas, en interprétant dans ${\mathcal {C}}$ les constructions issues du lambda-calcul simplement typé de la façon uselle, en définissant $[\![\Omega ]\!]=\bot$ et $[\![Y]\!]=\bigvee _{n\in \mathbb {N} }[\![\lambda f.f^{n}\Omega ]\!]$ et en interprétant les constructions sur les types primitifs de la même façon que dans le modèle continu en posant $[\![\iota ]\!]=D^{\iota }$ et $[\![o]\!]=D^{o}$ , ce qui est rendu possible par les isomorphismes ${\mathcal {C}}(1,D^{\iota })\simeq \mathbb {N} _{\bot }$ et ${\mathcal {C}}(1,D^{o})\simeq \mathbb {B} _{\bot }$ , on obtient la sémantique désirée.

Vocabulaire des modèles standards

On peut distinguer certains types de modèles de PCF. Les définitions présentées ici sont celles de Amadio et Curien^[12], et ne sont pas standard ; Milner^[13] désigne par le vocable « extensionnel » ce qu'Amadio et Curien désignent par « extensionnellement ordonné » :

Un modèle standard ${\mathcal {C}}$ est extensionnel^[14] si pour tous $f,g\in {\mathcal {C}}(A,B)$ , $f=g$ si et seulement si $\forall h\in {\mathcal {C}}(1,A),f\circ h=g\circ h$ , où $1$ l'objet terminal de ${\mathcal {C}}$ . Cela signifie que ${\mathcal {C}}(A,B)$ peut être vu comme un ensemble de fonctions de ${\mathcal {C}}(1,A)$ vers ${\mathcal {C}}(1,B)$ . Cela correspond à la notion de catégorie bien pointée.
Un modèle standard ${\mathcal {C}}$ est extensionnellement ordonné^[15] s'il est extensionnel et que pour tous $f,g\in {\mathcal {C}}(A,B)$ , $f\leq g$ si et seulement si $\forall h\in {\mathcal {C}}(1,A),f\circ h\leq g\circ h$ . Cela signifie que si on regarde $f$ et $g$ comme des fonctions, l'ordre entre $f$ et $g$ est l'ordre point à point.

Adéquation

Le théorème d'adéquation (en anglais : adequacy) énonce que dans tout modèle standard, un programme calculant un entier est interprété par l'entier qu'il calcule^[16].

Théorème (Adéquation) — Dans tout modèle standard de PCF, pour tout terme clos $M$ de type entier, c'est-à-dire tel que $\vdash M:\iota$ , et pour tout entier $n\in \mathbb {N}$ , on a : $M\to ^{*}{\underline {n}}\iff [\![M]\!]=n$ Notons qu'il y a au plus un entier $n$ tel que $M\to ^{*}{\underline {n}}$ .

On en déduit le corollaire suivant :

Corollaire — Dans les mêmes conditions que précédemment, $M$ ne termine pas si et seulement si $[\![M]\!]=\bot$ .

Ce théorème permet de relier la sémantique dénotationnelle et la sémantique opérationnelle de PCF, et de montrer en particulier que la sémantique de PCF ne distingue pas les termes égaux.

Le sens direct de ce résultat est immédiat, c'est la propriété de correction d'un modèle. Le sens réciproque est plus difficile à démontrer ; les démonstrations données par Plotkin^[17] ou par Amadio et Curien^[16] utilisent la méthode des relations logiques (en), qui consiste grossièrement à séparer cette preuve en deux propriétés, puis à montrer une première propriété par induction sur les types, et une deuxième sur les termes.

Équivalences entre termes

Étant donné deux termes $\Gamma \vdash M:\alpha$ et $\Gamma \vdash N:\alpha$ , on peut se demander à quelle condition ces deux termes sont « les mêmes ».

Équivalence observationnelle

Une première notion d'équivalence entre termes est l'équivalence observationnelle^[18]^,^[19] : intuitivement, deux termes sont observationnellement équivalents si on peut remplacer l'un par l'autre dans n'importe quel programme en obtenant le même résultat.

Une première question soulevée par cette définition vient de la notion même de « résultat ». En effet, on ne peut pas distinguer deux fonctions directement : d'une part, le code d'une fonction n'est pas accessible dans PCF, d'autre part, certaines fonctions sont clairement équivalentes, comme $\lambda x^{\alpha }.x^{\alpha }$ et $\lambda x^{\alpha }.(\lambda y^{\alpha }.y^{\alpha })~x^{\alpha }$ , qui calculent toutes deux l'identité, mais sont en forme normale pour $\to$ . Le seul moyen de distinguer deux fonctions est d'appliquer chacune à un même argument, et observer que leurs résultats diffèrent.

En revanche, étant donné les booléens $\operatorname {true}$ et $\operatorname {false}$ , il est évident qu'ils sont différents. On définit donc les termes observables comme ceux qu'on peut intuitivement séparer : il s'agit des entiers ${\underline {n}}$ pour $n\in \mathbb {N}$ et des booléens $\operatorname {true}$ et $\operatorname {false}$ . Sans perte de généralité, les résultats qui suivront ne mentionneront que les entiers.

Si $t$ et $u$ sont des termes clos d'un type de base, ils sont observationnellement équivalents s'ils se réduisent tous deux vers le même observable, ou si tous les deux ne terminent pas. Dans le cas plus général, si $A$ n'est pas un type de base, il n'y a pas d'observable de type $A$ , et si $M$ et $N$ ne sont pas clos, alors ils pourraient se réduire vers des variables, qu'on ne sait pas distinguer intuitivement non plus. On définit donc la notion de contexte (différente de $\Gamma$ dans $\Gamma \vdash M:\alpha$ , qu'on appelle aussi contexte) : un contexte $C[\_]$ est un terme avec exactement un « trou », c'est-à-dire qu'exactement un sous-terme est remplacé par $\square$ . Un contexte peut-être typé, et une opération naturelle consiste à remplacer le trou par un terme du même type : on note cela $C[t]$ . Un contexte clos d'un type de base permet ainsi de représenter un programme, dont on sait qu'il va s'évaluer vers un observable, et dans lequel on peut mettre soit $M$ , soit $N$ .

Définition (équivalence observationnelle) — Si $\Gamma \vdash M:\alpha$ et $\Gamma \vdash N:\alpha$ alors on dit que $M$ et $N$ sont observationnellement équivalents et on note $M=_{obs}N$ lorsque pour tout contexte $C[\_]$ clos et de type $\iota$ , et pour tout entier $n$ , on a :

$C[M]\to ^{*}{\underline {n}}\iff C[N]\to ^{*}{\underline {n}}$

Par exemple, on peut distinguer les deux fonctions $\lambda x^{\iota }.{\underline {0}}$ et $\lambda x^{\iota }.{\underline {1}}$ de type $\iota \to \iota$ , dans le contexte $C[\_]=\square ~{\underline {0}}$ , puisque dans ce contexte, la première fonction se réduit vers ${\underline {0}}$ tandis que la deuxième se réduit vers ${\underline {1}}$ .

Plus généralement, on peut définir un préordre entre termes d'un même type pour lequel $t$ est plus petit que $u$ si $u$ représente un programme qui étend $t$ , dans le sens où quand $t$ renvoie un résultat, $u$ renvoie le même, $u$ peut être défini sur plus d'arguments que $t$ .

Définition (préordre observationnel) — Si $\Gamma \vdash M:\alpha$ et $\Gamma \vdash N:\alpha$ alors on note $M\leq _{op}N$ lorsque pour tout contexte $C[\_]$ clos et de type $\iota$ , et pour tout entier $n$ , on a :

$C[M]\to ^{*}{\underline {n}}\implies C[N]\to ^{*}{\underline {n}}$

Par exemple, si $M$ et $N$ sont des fonctions de $\iota \to \iota$ telles que $M$ renvoie toujours $\bot$ — sauf en ${\underline {0}}$ où $M$ renvoie ${\underline {0}}$ — alors $M\leq _{op}N$ si et seulement si $N~{\underline {0}}\to ^{*}{\underline {0}}$ .

Équivalence dénotationnelle

Tout modèle standard induit également une notion d'équivalence entre deux termes^[20], à savoir le fait qu'ils aient la même dénotation. De même, un modèle induit également une relation d'ordre entre termes, où $M$ est plus petit que $N$ lorsque $[\![M]\!]\leq [\![N]\!]$ . Cette relation capture l'idée que dans le modèle, $M$ est plus défini que $N$ . Ces relations dépendent du modèle choisi.

Complète adéquation

On peut se demander dans quelle mesure ces deux notions d'équivalence sont comparables^[20]. De manière générale, le théorème d'adéquation peut se reformuler comme le fait que pour tous termes $M$ et $N$ , $M\leq _{obs}N$ si et seulement si pour tout contexte $C[\_]$ clos et de type entier, $[\![C[M]]\!]\leq [\![C[N]]\!]$ ^[21].

Ce théorème a deux conséquences intéressantes : La première est que pour tous termes clos $M$ et $N$ de type entier, $M=_{obs}N\iff [\![M]\!]=[\![N]\!]$ , donc qu'équivalence dénotationnelle et observationnelle coïncident au niveau des types de base^[19]. La seconde est que pour tous termes $\Gamma \vdash M:\alpha$ et $\Gamma \vdash N:\alpha$ , $[\![M]\!]\leq [\![N]\!]\implies M\leq _{obs}N$ (donc en particulier que $[\![M]\!]=[\![N]\!]\implies M=_{obs}N$ )^[22]^,^[23].

Définition (Complète adéquation) — Un modèle standard de PCF est dit complètement adéquat^[20]^,^[22]^,^[19] (en anglais : fully abstract) lorsque pour tous termes $M$ et $N$ tels que $\Gamma \vdash M:\alpha$ et $\Gamma \vdash N:\alpha$ , la propriété suivante, dite de complète adéquation (en anglais : full abstraction), est vérifiée :

$[\![M]\!]\leq [\![N]\!]\iff M\leq _{obs}N$

Plotkin a montré que cette propriété n'est pas vérifiée par le modèle continu de PCF^[24]. On peut en effet définir dans ce modèle la fonction « ou parallèle » $por:\mathbb {B} _{\bot }\to \mathbb {B} _{\bot }\to \mathbb {B} _{\bot }$ (en anglais : parallel or) dans ce modèle, qui est définie par :

$por(x)(y)={\begin{cases}\operatorname {true} &{\text{si }}x=\operatorname {true} {\text{ ou }}y=\operatorname {true} \\\operatorname {false} &{\text{si }}x=\operatorname {false} {\text{ et }}y=\operatorname {false} \\\bot &{\text{sinon}}\end{cases}}$

En revanche, cette fonction n'est pas définissable dans PCF : il n'y a pas de terme $M$ bien typé tel que $[\![M]\!]=por$ . Intuitivement, un tel terme lancerait en parallèle les deux programmes qu'on lui passe en argument, renvoyant vrai dès que l'un d'eux retourne vrai, ou faux si les deux retournent faux. Au contraire, PCF est un langage séquentiel^[25]^,^[22], qui ne supporte pas l'exécution entrelacée.

On peut montrer que si on définit, pour chaque booléen $b$ , le terme $M_{b}$ suivant :

$\lambda g^{o\to o\to o}.\operatorname {if} ~g~(\operatorname {true} )(\bot )~\operatorname {then} ~(\operatorname {if} ~g(\bot )(\operatorname {true} )~\operatorname {then} ~(\operatorname {if} ~g~(\operatorname {false} )(\operatorname {false} )~\operatorname {then} ~\bot ~\operatorname {else} ~b)~\operatorname {else} ~\bot )~\operatorname {else} ~\bot$

Alors $M_{\operatorname {true} }=_{obs}M_{\operatorname {false} }$ , mais $[\![M_{\operatorname {true} }]\!](por)\neq [\![M_{\operatorname {true} }]\!](por)$ car pour tout booléen $b$ , $[\![M_{b}]\!](por)=b$ , donc le modèle standard de PCF n'est pas complètement abstrait^[22]. On peut étendre le langage PCF pour un obtenir nouveau langage, PCF+por, dans lequelle une nouvelle primitive $\|$ est ajoutée. Elle est de type $o\to o\to o$ , elle vérifie $\operatorname {true} \|M\to \operatorname {true}$ , $M\|\operatorname {true} \to \operatorname {true}$ et $\operatorname {false} \|\operatorname {false} \to \operatorname {false}$ , si $M$ et $N$ sont des booléens, $M\|N$ aussi et on étend la sémantique continue en définissant $[\![\|]\!]=por$ . La catégorie des CPO est un modèle complètement abstrait pour ce nouveau langage^[26], et on peut montrer que les éléments définissables sont exactement les éléments compacts^[27].

Problème de la complète adéquation

Milner a fourni en premier en 1977 un modèle standard complètement adéquat de PCF en quotiantant la syntaxe de PCF pour identifier les termes observationnellement équivalents. Il a de plus donné, sous certaines conditions, une caractérisation des modèles standard complètement adéquats de PCF^[13] :

Théorème (Caractérisation des modèles extensionnellement ordonnés complètement adéquats^[28]) — Un modèle de PCF extensionnellement ordonné est complètement adéquat si et seulement tous les hom-sets sont algébriques et tous les éléments compacts sont définissables.

De plus, il a montré que sous ces conditions, tous ces modèles sont isomorphes^[13] :

Théorème (Unicité des modèles extensionnellement ordonnés complètement adéquats^[28]^,^[29]) — Tous les modèles extensionnellement ordonnés et complètement adéquats de PCF sont isomorphes entre eux, et cet isomorphisme préserve l'ordre.

Néanmoins le modèle proposé par Milner n'a pas été jugé satisfaisant par la communauté scientifique, qui désirait trouver un modèle plus sémantique^[28]. La communauté scientifique a donc essayé de trouver une description plus sémantique de cet unique modèle complètement adéquat^[19]. Hyland et Ong en proposent un compte rendu détaillé^[30], de même que Curien^[19]. Gérard Berry a proposé ensuite en 1978 le modèle stable de PCF^[31]^,^[32], qui est extensionnel mais pas extensionnellement ordonné, puis Berry et Curien ont proposé en 1982 le modèle des algorithmes séquentiels^[33]^,^[34], qui n'est pas extensionnel. Dans ces deux modèles, il y a des éléments compacts non définissables^[19]. Cela a ouvert la voie à d'autres travaux qui tentaient de définir la séquentialité pour les fonctions d'ordre supérieur, notamment par Antonio Bucciarelli et Thomas Ehrhard^[35]^,^[36].

En 2000, Martin Hyland et Luke Ong d'une part et Samson Abramsky, Radha Jagadeesan et Pasquale Malacaria d'autre part ont indépendamment proposé chacun un modèle basé sur la sémantique des jeux, le modèle des jeux OH^[30] et le modèle des jeux AJM^[37] (nommés d'après les initiales respectives de leurs auteurs). Ces modèles présentent la propriété que tous les éléments compacts sont définissables, mais ils ne sont pas extensionnels, et correspondent à des descriptions purement sémantiques de la catégorie des arbres de Böhm de PCF^[19]. Il est possible, via une construction catégorique, de rendre ces modèles extensionnellement ordonnés, et donc d'obtenir à partir de ces modèles une description du modèle complètement adéquat de PCF^[38]^,^[19].

En 2001 Ralph Loader conclut par la négative la quête de la solution au problème de la complète adéquation : il montre que la relation d'équivalence observationnelle dans PCF finitaire, c'est-à-dire PCF sans les entiers, avec uniquement les booléens comme type de base, était indécidable^[39], et donc qu'un modèle de PCF vérifiant les critères de Achim Jung and Allen Stoughton^[40], qui précisent que les objets interprétants les types finis doivent pouvoir être effectivement décrits, est impossible.

Turing-complétude

Si $M:\overbrace {\iota \to \iota \to \dots } ^{k}\to \iota$ est un programme dans PCF qui prend $k$ entiers en entrée et renvoie un entier, on peut montrer que $M$ détermine une fonction calculable partielle $f:\mathbb {N} ^{k}\to \mathbb {N}$ par $f(n_{1},\dots ,n_{k})=m$ si $f~{\underline {n}}_{1}\dots {\underline {n}}_{k}\to ^{*}{\underline {m}}$ et $f(n_{1},\dots ,n_{k})$ n'est pas définie sinon.

Réciproquement, étant donnée une fonction calculable partielle $f:\mathbb {N} ^{k}\to \mathbb {N}$ , on peut se demander si elle est représentée par un terme $M:\overbrace {\iota \to \iota \to \dots } ^{k}\to \iota$ de PCF tel que pour tous entiers $n_{1},\dots ,n_{k}$ et $m$ ,

M~{\underline {n}}_{1}\dots {\underline {n}}_{k}\to ^{*}{\underline {m}}\iff f(n_{1},\dots ,n_{k})=m

.

Ce problème correspond à la notion de complétude au sens de Turing. La réponse est positive, donc PCF peut représenter toutes les fonctions calculables entre entiers^[41].

Démonstration — On sait que les fonctions calculables sont obtenues en ajoutant le schéma $\mu$ de minimisation non bornée aux fonctions primitives récursives, et on peut assez facilement montrer que toutes les fonctions primitives récursives sont encodables dans PCF.

Il reste donc à montrer que PCF supporte l'opération de minimisation non bornée : étant donné un terme $f:\iota \to o$ , $\mu f:\iota$ est le plus entier $n$ tel que $f~{\underline {n}}\to ^{*}\operatorname {true}$ et $f~{\underline {k}}\to ^{*}\operatorname {false}$ pour tout $k<n$ si un tel entier $n$ existe, et $\mu f$ ne se normalise pas sinon.

Pour cela, on définit $\mu :(\iota \to o)\to \iota$ par $\lambda f^{\iota \to o}.Y(\lambda h^{\iota \to \iota }.\lambda n^{\iota }.\operatorname {if} f~n\operatorname {then} n\operatorname {else} h~(\operatorname {succ} ~n))~{\underline {0}}$ . On vérifie facilement que $\mu f$ vérifie bien la propriété désirée.

Bibliographie

(en) Roberto M. Amadio et Pierre-Louis Curien, Domains and Lambda-Calculi, Cambridge University Press, coll. « Cambridge Tracts in Theoretical Computer Science », 1998, 534 p. (ISBN 978-0-521-62277-6, lire en ligne).

Notes et références

↑ ^{a b et c} (en) Gordon Plotkin, « LCF considered as a programming language », Theoretical Computer Science, vol. 5, n^o 3,‎ 1977, p. 223–255 (DOI 10.1016/0304-3975(77)90044-5 , lire en ligne [PDF])
↑ (en) Dana S. Scott, « A type-theoretical alternative to ISWIM, CUCH, OWHY », Theoretical Computer Science, vol. 121, n^o 1,‎ 6 décembre 1993, p. 411–440 (ISSN 0304-3975, DOI 10.1016/0304-3975(93)90095-B , lire en ligne [PDF], consulté le 17 novembre 2024) — distribué à l'origine comme des notes non publiées d'un séminaire donné à Oxford en 1969 sous le nom A theory of computable functions of higher type.
↑ Amadio et Curien 1998, p. 149
↑ Amadio et Curien 1998, p. 145
↑ Amadio et Curien 1998, p. 151
↑ ^{a et b} Amadio et Curien 1998, p. 150
↑ Amadio et Curien 1998, p. 5
↑ Amadio et Curien 1998, p. 14-15
↑ Amadio et Curien 1998, p. 95
↑ ^{a et b} Amadio et Curien 1998, p. 146
↑ ^{a et b} Amadio et Curien 1998, p. 149-150
↑ Amadio et Curien 1998, p. 150
↑ ^{a b et c} Robin Milner, « Fully abstract models of typed λ-calculi », Theoretical Computer Science, vol. 4, n^o 1,‎ 1^er février 1977, p. 1–22 (ISSN 0304-3975, DOI 10.1016/0304-3975(77)90053-6, lire en ligne, consulté le 1^er mai 2025)
↑ Amadio et Curien 1998, p. 104
↑ Amadio et Curien 1998, p. 150
↑ ^{a et b} Amadio et Curien 1998, p. 152
↑ Plotkin 1977, p. 230
↑ Amadio et Curien 1998, p. 154-155
↑ ^{a b c d e f g et h} (en) Pierre-Louis Curien, « Definability and Full Abstraction », Electronic Notes in Theoretical Computer Science, computation, Meaning, and Logic: Articles dedicated to Gordon Plotkin, vol. 172,‎ 1^er avril 2007, p. 301–310 (ISSN 1571-0661, DOI 10.1016/j.entcs.2007.02.011 , lire en ligne [PDF], consulté le 25 avril 2025)
↑ ^{a b et c} Plotkin 1977, p. 233-234
↑ Amadio et Curien 1998, p. 154
↑ ^{a b c et d} Amadio et Curien 1998, p. 155-156
↑ Plotkin 1977, p. 244
↑ 155-156
↑ Plotkin 1977, p. 235-236, Plotkin nomme ce résultat « activité ».
↑ Plotkin 1977, p. 237
↑ Plotkin 1977, p. 238
↑ ^{a b et c} Curien et Amadio 1998, p. 156-157
↑ Plotkin 1977, p. 244
↑ ^{a et b} (en) Martin Hyland et Luke Ong, « On Full Abstraction for PCF: I, II, and III », Information and Computation, vol. 163, n^o 2,‎ 15 décembre 2000, p. 285–408 (ISSN 0890-5401, DOI 10.1006/inco.2000.2917)
↑ (en) Gérard Berry, « Stable models of typed λ-calculi », Automata, Languages and Programming, Springer,‎ 1978, p. 72–89 (ISBN 978-3-540-35807-7, DOI 10.1007/3-540-08860-1_7 )
↑ Amadio et Curien 1998, p. 305-310
↑ (en) Gérard Berry et P. L. Curien, « Sequential algorithms on concrete data structures », Theoretical Computer Science, vol. 20, n^o 3,‎ 1^er juillet 1982, p. 265–321 (ISSN 0304-3975, DOI 10.1016/S0304-3975(82)80002-9 )
↑ Amadio et Curien 1998, p. 386-396
↑ (en) A. Bucciarelli et T. Ehrhard, « Sequentiality and strong stability », [1991] Proceedings Sixth Annual IEEE Symposium on Logic in Computer Science,‎ juillet 1991, p. 138–145 (DOI 10.1109/LICS.1991.151638 )
↑ (en) Antonio Bucciarelli et Thomas Ehrhard, « A theory of sequentiality », Theoretical Computer Science, vol. 113, n^o 2,‎ 7 juin 1993, p. 273–291 (ISSN 0304-3975, DOI 10.1016/0304-3975(93)90005-E )
↑ (en) Samson Abramsky, Radha Jagadeesan et Pasquale Malacaria, « Full Abstraction for PCF », Information and Computation, vol. 163, n^o 2,‎ 15 décembre 2000, p. 409–470 (ISSN 0890-5401, DOI 10.1006/inco.2000.2930 )
↑ Curien et Amadio 1998, p. 162-163
↑ (en) Ralph Loader, « Finitary PCF is not decidable », Theoretical Computer Science, vol. 266, n^o 1,‎ 6 septembre 2001, p. 341–364 (ISSN 0304-3975, DOI 10.1016/S0304-3975(00)00194-8 )
↑ (en) Achim Jung et Allen Stoughton, « Studying the fully abstract model of PCF within its continuous function model », Typed Lambda Calculi and Applications, Springer,‎ 1993, p. 230–244 (ISBN 978-3-540-47586-6, DOI 10.1007/BFb0037109, lire en ligne, consulté le 9 mai 2025)
↑ Scott 1993, p. 435

Portail de l'informatique théorique

[:0-1] {a b et c} (en) Gordon Plotkin, « LCF considered as a programming language », Theoretical Computer Science, vol. 5, n^o 3,‎ 1977, p. 223–255 (DOI 10.1016/0304-3975(77)90044-5 , lire en ligne [PDF])

[2] (en) Dana S. Scott, « A type-theoretical alternative to ISWIM, CUCH, OWHY », Theoretical Computer Science, vol. 121, n^o 1,‎ 6 décembre 1993, p. 411–440 (ISSN 0304-3975, DOI 10.1016/0304-3975(93)90095-B , lire en ligne [PDF], consulté le 17 novembre 2024) — distribué à l'origine comme des notes non publiées d'un séminaire donné à Oxford en 1969 sous le nom A theory of computable functions of higher type.

[3] Amadio et Curien 1998, p. 149

[4] Amadio et Curien 1998, p. 145

[5] Amadio et Curien 1998, p. 151

[:1-6] {a et b} Amadio et Curien 1998, p. 150

[7] Amadio et Curien 1998, p. 5

[8] Amadio et Curien 1998, p. 14-15

[9] Amadio et Curien 1998, p. 95

[:2-10] {a et b} Amadio et Curien 1998, p. 146

[:3-11] {a et b} Amadio et Curien 1998, p. 149-150

[12] Amadio et Curien 1998, p. 150

[:8-13] {a b et c} Robin Milner, « Fully abstract models of typed λ-calculi », Theoretical Computer Science, vol. 4, n^o 1,‎ 1^er février 1977, p. 1–22 (ISSN 0304-3975, DOI 10.1016/0304-3975(77)90053-6, lire en ligne, consulté le 1^er mai 2025)

[14] Amadio et Curien 1998, p. 104

[15] Amadio et Curien 1998, p. 150

[:4-16] {a et b} Amadio et Curien 1998, p. 152

[17] Plotkin 1977, p. 230

[18] Amadio et Curien 1998, p. 154-155

[:5-19] {a b c d e f g et h} (en) Pierre-Louis Curien, « Definability and Full Abstraction », Electronic Notes in Theoretical Computer Science, computation, Meaning, and Logic: Articles dedicated to Gordon Plotkin, vol. 172,‎ 1^er avril 2007, p. 301–310 (ISSN 1571-0661, DOI 10.1016/j.entcs.2007.02.011 , lire en ligne [PDF], consulté le 25 avril 2025)

[:6-20] {a b et c} Plotkin 1977, p. 233-234

[21] Amadio et Curien 1998, p. 154

[:7-22] {a b c et d} Amadio et Curien 1998, p. 155-156

[23] Plotkin 1977, p. 244

[24] 155-156

[25] Plotkin 1977, p. 235-236, Plotkin nomme ce résultat « activité ».

[26] Plotkin 1977, p. 237

[27] Plotkin 1977, p. 238

[:9-28] {a b et c} Curien et Amadio 1998, p. 156-157

[29] Plotkin 1977, p. 244

[:10-30] {a et b} (en) Martin Hyland et Luke Ong, « On Full Abstraction for PCF: I, II, and III », Information and Computation, vol. 163, n^o 2,‎ 15 décembre 2000, p. 285–408 (ISSN 0890-5401, DOI 10.1006/inco.2000.2917)

[31] (en) Gérard Berry, « Stable models of typed λ-calculi », Automata, Languages and Programming, Springer,‎ 1978, p. 72–89 (ISBN 978-3-540-35807-7, DOI 10.1007/3-540-08860-1_7 )

[32] Amadio et Curien 1998, p. 305-310

[33] (en) Gérard Berry et P. L. Curien, « Sequential algorithms on concrete data structures », Theoretical Computer Science, vol. 20, n^o 3,‎ 1^er juillet 1982, p. 265–321 (ISSN 0304-3975, DOI 10.1016/S0304-3975(82)80002-9 )

[34] Amadio et Curien 1998, p. 386-396

[35] (en) A. Bucciarelli et T. Ehrhard, « Sequentiality and strong stability », [1991] Proceedings Sixth Annual IEEE Symposium on Logic in Computer Science,‎ juillet 1991, p. 138–145 (DOI 10.1109/LICS.1991.151638 )

[36] (en) Antonio Bucciarelli et Thomas Ehrhard, « A theory of sequentiality », Theoretical Computer Science, vol. 113, n^o 2,‎ 7 juin 1993, p. 273–291 (ISSN 0304-3975, DOI 10.1016/0304-3975(93)90005-E )

[37] (en) Samson Abramsky, Radha Jagadeesan et Pasquale Malacaria, « Full Abstraction for PCF », Information and Computation, vol. 163, n^o 2,‎ 15 décembre 2000, p. 409–470 (ISSN 0890-5401, DOI 10.1006/inco.2000.2930 )

[38] Curien et Amadio 1998, p. 162-163

[39] (en) Ralph Loader, « Finitary PCF is not decidable », Theoretical Computer Science, vol. 266, n^o 1,‎ 6 septembre 2001, p. 341–364 (ISSN 0304-3975, DOI 10.1016/S0304-3975(00)00194-8 )

[40] (en) Achim Jung et Allen Stoughton, « Studying the fully abstract model of PCF within its continuous function model », Typed Lambda Calculi and Applications, Springer,‎ 1993, p. 230–244 (ISBN 978-3-540-47586-6, DOI 10.1007/BFb0037109, lire en ligne, consulté le 9 mai 2025)

[41] Scott 1993, p. 435

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]