Funktionen höherer Ordnung

Im Kapitel Funktionale Abstraktionen haben wir bereits gesehen, dass man sich wiederholende Muster in Funktionen höherer Ordnung auslagern kann. In diesem Kapitel wollen wir jetzt noch ein paar fortgeschrittene Themen aus dem Bereich der Funktionen höherer Ordnung diskutieren.

Gecurryte Funktionen

Um Funktionen höherer Ordnung in vollem Umfang nutzen zu können, müssen wir uns eine grundlegende Eigenschaft von Funktionen in Elm anschauen, die wir bisher unter den Tisch gekehrt haben. Dazu schauen wir uns noch einmal die Definition von mehrstelligen Funktionen an, die wir im Abschnitt Mehrstellige Funktionen eingeführt haben.

pluralize : String -> String -> Int -> String
pluralize singular plural quantity =
    if quantity == 1 then
        "1 " ++ singular

    else
        String.fromInt quantity ++ " " ++ plural

Wir haben dabei gelernt, dass man zwischen drei Argumente immer einen Pfeil schreiben muss, wir haben aber bisher nicht diskutiert warum. In einer Programmiersprache wie Java würden wir die Funktion eher wie folgt definieren.

pluralizeTuple : ( String, String, Int ) -> String
pluralizeTuple ( singular, plural, quantity ) =
    if quantity == 1 then
        "1 " ++ singular

    else
        String.fromInt quantity ++ " " ++ plural

Die Funktion pluralize nennt man die gecurryte Variante und die Funktion pluralizeTuple die ungecurryte Variante. Die Funktion pluralize nimmt zwar auf den ersten Blick drei Argumente, wir können den Typ der Funktion pluralize aber auch anders angeben. Die Schreibweise

String -> String -> Int -> String

steht eigentlich für den folgenden Typ.

String -> (String -> (Int -> String))

Das heißt, der Typkonstruktor -> ist rechtsassoziativ. Die Definition pluralize ist damit eine Funktion, die einen Wert vom Typ String nimmt und eine Funktion vom Typ String -> (Int -> String) liefert. Während der Funktionspfeil rechtsassoziativ ist, ist die Anwendung einer Funktion linksassoziativ. Das heißt, die Funktionsanwendung

pluralize "Gegenstand" "Gegenstände" 3

steht eigentlich für die folgende Anwendung.

((pluralize "Gegenstand") "Gegenstände") 3

Wir wenden also zuerst die Funktion pluralize auf das Argument "Gegenstand" an. Wir erhalten dann eine Funktion, die noch einen String und einen Int als Argumente erwartet. Diese Funktion wenden wir dann auf "Gegenstände" an und erhalten eine Funktion, die noch einen Int als Argument erwartet. Schließlich wenden wir diese Funktion auf 3 an und erhalten als Ergebnis einen String.

Die Idee, Funktionen mit mehreren Argumenten als Funktion zu repräsentieren, die ein Argument nimmt und eine Funktion liefert, wird als Currying bezeichnet. Currying ist nach dem amerikanischen Logiker Haskell Brooks Curry¹ benannt (1900–1982), nach dem auch die Programmiersprache Haskell benannt ist.

Die Definition von pluralize ist im Grunde nur eine vereinfachte Schreibweise der folgenden Definition.

pluralizeLambda : String -> String -> Int -> String
pluralizeLambda =
    \singular ->
        \plural ->
            \quantity ->
                if quantity == 1 then
                    "1 " ++ singular

                else
                    String.fromInt quantity ++ " " ++ plural

In dieser Form der Definition ist ganz explizit dargestellt, dass pluralizeLambda eine Funktion ist, die ein Argument singular nimmt und als Ergebnis wiederum eine Funktion liefert. Um Schreibarbeit zu reduzieren, entsprechen alle Definitionen, die wir in Elm angeben, im Endeffekt diesem Muster. Das heißt, statt diese aufwendige Definition mit Lambda-Funktionen zu schreiben, können wir die Funktion einfach wie in pluralize schreiben, erhalten aber das gleiche Ergebnis. Das heißt, die Funktionsschreibweise in Elm ist syntaktischer Zucker für die Verwendung von Lambda-Funktionen.

Wichtig

In Programmiersprachen, in denen man Funktionen als Daten nutzen kann, kann man Currying durch die Modellierung mittels anonymer Funktionen nachbauen.

Dieser Ansatz kann zum Beispiel in JavaScript, Java, Kotlin, C++, C, C#, Go und Python verwenden werden, um Currying zu modellieren² und wird auch in Bibliotheken verwendet, um gecurryte Funktionen zur Verfügung zu stellen, etwa in Ramda.

Mithilfe der Definition pluralizeLambda können wir noch einmal illustrieren, dass die Funktionsanwendung linksassoziativ ist. Dazu werten wir Stück für Stück aus, was der Aufruf pluralizeLambda "Gegenstand" "Gegenstände" 3 als Ergebnis liefert.

pluralizeLambda "Gegenstand" "Gegenstände" 3
=
((pluralizeLambda "Gegenstand") "Gegenstände") 3
=
(((\singular ->
       \plural ->
           \quantity ->
               if quantity == 1 then
                     "1 " ++ singular

               else
                   String.fromInt quantity ++ " " ++ plural)
    "Gegenstand") "Gegenstände") 3
=
((\plural ->
      \quantity ->
          if quantity == 1 then
              "1 " ++ "Gegenstand"

          else
              String.fromInt quantity ++ " " ++ plural)
    "Gegenstände") 3
=
(\quantity ->
     if quantity == 1 then
         "1 " ++ "Gegenstand"

     else
         String.fromInt quantity ++ " " ++ "Gegenstände")
    3
=
if 3 == 1 then
    "1 " ++ "Gegenstand"

else
    String.fromInt 3 ++ " " ++ "Gegenstände"
=
String.fromInt 3 ++ " " ++ "Gegenstände"
=
"3 Gegenstände"

Partielle Applikationen

Mit der gecurryten Definition von Funktionen gehen zwei wichtige Konzepte einher. Das erste Konzept wird partielle Applikation oder partielle Anwendung genannt. Funktionen in der gecurryten Form lassen sich sehr leicht partiell applizieren. Applikation ist der Fachbegriff für das Anwenden einer Funktion auf konkrete Argumente. Eine partielle Applikation ist die Anwendung einer Funktion auf eine Anzahl von konkreten Argumenten, so dass der Funktion noch weitere Argumente fehlen. Um zu illustrieren, was eine partielle Anwendung bedeutet, betrachten wir die Anwendung von pluralize auf die Argumente "Gegenstand" und "Gegenstände". Da die Funktion pluralize drei Argumente erhält, wir aber nur zwei Argumente übergeben, handelt es sich um eine partielle Applikation. Wir werten wieder einen Aufruf aus, übergeben diesmal aber nur zwei Argumente an pluralize.

pluralize "Gegenstand" "Gegenstände"
=
(pluralize "Gegenstand") "Gegenstände"
=
((\singular ->
      \plural ->
          \quantity ->
              if quantity == 1 then
                    "1 " ++ singular

              else
                  String.fromInt quantity ++ " " ++ plural)
    "Gegenstand") "Gegenstände"
=
(\plural ->
    \quantity ->
        if quantity == 1 then
            "1 " ++ "Gegenstand"

        else
            String.fromInt quantity ++ " " ++ plural)
    "Gegenstände"
=
\quantity ->
    if quantity == 1 then
        "1 " ++ "Gegenstand"

    else
        String.fromInt quantity ++ " " ++ "Gegenstände")

Das heißt, wenn wir die Funktion pluralize partiell auf die Argumente "Gegenstand" und "Gegenstände" anwenden, erhalten wir eine Funktion, die noch die Anzahl erwartet und einen Text liefert. Wir können die Funktion pluralize genau auf diese Weise partiell anwenden. Wir betrachten das folgende Beispiel.

items : List String
items =
    List.map (pluralize "Gegenstand" "Gegenstände") [ 4, 2, 10 ]

Die partielle Applikation pluralize "Gegenstand" "Gegenstände" nimmt noch ein weiteres Argument, nämlich die Anzahl. Daher können wir sie mithilfe von map auf alle Elemente einer Liste anwenden. Wir erhalten dann die Beschreibungen von mehreren Gegenständen.

Wichtig

Um in Elm einen Operator partiell zu applizieren, muss der Operator präfix geschrieben werden, indem man den Namen mit Klammern umschließt.

Das heißt, der Ausdruck (+) 1 liefert eine Funktion, die ihr Argument um eins erhöht. Der Ausdruck (-) 1 dagegen liefert eine Funktion, die ihr Argument von 1 abzieht.

Info

Partielle Applikationen mit Left und Right Sections, also Ausdrücke der Form (1 +) und (+ 1) werden in Elm im Gegensatz zu Haskell nicht unterstützt.

Piping

Funktionen höherer Ordnung haben viele Verwendungen. Wir wollen uns hier noch eine Anwendung anschauen, die sich recht stark von Funktionen wie map und filter unterscheidet. Wir betrachten dazu folgendes Beispiel. Wir wollen wiederum das Durchschnittsalter aller volljährigen Nutzer*innen berechnen. Dazu berechnen wir die Summe der Alter aller Nutzer*innen über 18. Wir nutzen erst List.map, um eine Liste von Altersangaben zu erhalten, wir filtern die Altersangaben, die größer gleich 18 sind und summieren schließlich das Ergebnis.

sumOfAdultAges : List User -> Int
sumOfAdultAges users =
    List.sum (List.filter (\age -> age >= 18) (List.map .age users))

Die Verarbeitungsschritte müssen dabei in umgekehrter Reihenfolge angegeben werden. Das heißt, wir geben zuerst den letzten Verarbeitungsschritt an, nämlich das Summieren. Elm stellt einen Operator

(|>) : a -> (a -> b) -> b

zur Verfügung mit dessen Hilfe wir die Reihenfolge der Verarbeitungsschritte umkehren können. Wir können die Funktion mithilfe dieses Operators wie folgt definieren.

sumOfAdultAges : List User -> Int
sumOfAdultAges users =
    users
        |> List.map .age
        |> List.filter (\age -> age >= 18)
        |> List.sum

Aus Gründen der Lesbarkeit wird eine solche Sequenz von Verarbeitungsschritten häufig wie oben aufgeführt eingerückt. Man spricht in diesem Zusammenhang auch von Piping in Anlehung an das entsprechende Konzept in einer Shell.

Hinter dem Operator (|>) steckt die folgende einfache Definition.

(|>) : a -> (a -> b) -> b
(|>) x f =
  f x

Das heißt, (|>) nimmt einfach das Argument und eine Funktion und wendet die Funktion auf das Argument an. Neben dieser Definition enthält die Elm-Implementierung noch die folgende Angabe.

infixl 0 |>

Das heißt, der Operator hat die Präzedenz 0 und ist linksassoziativ.

Der Operator |> wird in Elm nicht nur für eine Sequenz von Abarbeitungsschritten verwendet, sondern auch um Funktionen “infix” zu verwenden.

Info

In Haskell kann man eine zweistellige Funktion infix verwenden, indem man den Namen mit Backticks umschließt.

So wendet der Ausdruck 5 `mod` 2 zum Beispiel die Funktion mod auf die Argumente 5 und 2 an. Dem minimalistischem Ansatz von Elm folgend gibt es dieses Feature in Elm nicht. Wenn man den Funktionsnamen gern zwischen zwei Argumente schreiben möchte, kann man hierfür aber den Operator |> nutzen. Wir haben im Kapitel Polymorphe Funktionen zum Beispiel die Funktion Maybe.withDefault : a -> Maybe a -> a kennengelernt. Der Name dieser Funktion deutet an, dass man den Namen zwischen den Wert vom Typ Maybe und den Default-Wert schreibt. Mithilfe von |> kann man withDefault tatsächlich auf diese Weise nutzen. Zu diesem Zweck applizieren wir withDefault partiell auf sein erstes Argument, nämlich den Default-Wert. Als Beispiel betrachten wir die partielle Applikation Maybe.withDefault 0.0. Dieser Ausdruck hat den Typ Maybe Float -> Float. Das heißt, der Ausdruck String.toFloat input |> Maybe.withDefault 0.0 hat den Typ Float. Der Operator |> erlaubt uns in Kombination mit einer partiellen Applikation also eine zweistellige Funktion zwischen ihre Argumente zu schreiben. Das heißt, in Elm ist |> Maybe.withDefault sozusagen die Infix-Schreibweise der Funktion Maybe.withDefault. Man muss in diesem Beispiel den Ausdruck String.toFloat input nicht klammern, da eine Funktionsanwendung, also die Wendung von String.toFloat auf sein Argument, eine höhere Präzedenz hat als ein Operator, in diesem Fall also |>.

Wichtig

Im Folgenden werden wir Funktionen, deren Namen eine Infixverwendung andeuten, immer infix verwenden. Beispiele sind withDefault, modBy, startsWith und andThen.

Neben |> stellt Elm auch einen Operator

(<|) : (a -> b) -> a -> b

zur Verfügung. Die Operatoren <| und |> werden gern verwendet, um Klammern zu sparen. So kann man durch den Operator <| zum Beispiel eine Funktion auf ein Argument angewendet werden, ohne das Argument zu klammern. Wir können statt items (23 + 42) zum Beispiel item <| 23 + 42 schreiben. Wir können die Klammern weglassen, da die Präzedenz von <| und von |> jeweils 0 ist und damit niedriger als die Präzedenz aller anderer Operatoren. Der Operator + hat zum Beispiel die Präzedenz 6.³

Es ist relativ verbreitet, die Operatoren <| und |> zu nutzen. Um existierenden Elm-Code lesen zu können, sollte man die Operatoren daher kennen. In vielen Fällen wird der Code durch die Verwendung dieser Operatoren aber nicht unbedingt lesbarer.

Wichtig

Daher sollten die Operatoren vor allem genutzt werden, wenn es sich tatsächlich um eine längere Sequenz von Transformationen wie in der Definition von sumOfAdultAges handelt.

Wichtig

Der Operator <| kann auch eingesetzt werden, wenn der Ausdruck, der “geklammert” wird, mehrere Zeilen überspannt.

In diesem Fall ist es häufig nicht so einfach, öffnende und schließende Klammer zu finden, daher kann es sinnvoll sein, den Operator <| zu verwenden. Ansonsten sollte man die Operatoren aber eher vermeiden. Leider ist die Verwendung der Operatoren <| und |> auch in solchen Fällen, in denen die Verwendung den Code nicht unbedingt verbessert, in Elm relativ weit verbreitet.

Info

Auch in Haskell ist die Verwendung des entsprechenden Operators $ :: (a -> b) -> a -> b recht weit verbreitet und führt regelmäßig dazu, dass Anfänger*innen, einfachen Haskell-Code nicht lesen können.

Der Operator |> wird häufig mit der funktionalen Sprache F# assoziiert. Der Operator wurde aber laut der Publikation “The Early History of F#”⁴ im Jahr 2003 zur Standardbibliothek von F# hinzufügt, 1994 aber schon für die Programmiersprache ML definiert.

Eta-Reduktion und -Expansion

Mit der gecurryten Schreibweise geht noch ein weiteres wichtiges Konzept einher, die Eta-Reduktion bzw. die Eta-Expansion. Dies sind die wissenschaftlichen Namen für Umformungen eines Ausdrucks. Bei der Reduktion lässt man Argumente einer Funktion weg und bei der Expansion fügt man Argumente hinzu. Im Abschnitt Wiederkehrende rekursive Muster haben wir die Funktion map mittels map viewUser users auf die Funktion viewUser und die Liste users angewendet. Wenn wir eine Lambda-Funktion verwenden, können wir den Aufruf aber auch als map (\user -> viewUser user) users definieren. Diese beiden Aufrufe verhalten sich exakt gleich. Den Wechsel von \user -> viewUser user zu viewUser bezeichnet man als Eta-Reduktion. Den Wechsel von viewUser zu \user -> viewUser user bezeichnet man als Eta-Expansion. Ganz allgemein kann man durch die Anwendung der Eta-Reduktion einen Ausdruck der Form \x -> f x in f umwandeln. Durch die Eta-Expansion kann man einen Ausdruck der Form f in \x -> f x umwandeln, wenn f eine Funktion ist, die mindestens ein Argument nimmt. Dabei muss f nicht unbedingt der Name einer Funktion sein. Bei f muss es sich lediglich um einen Ausdruck handeln, der einen funktionalen Typ hat.

Das Konzept der Eta-Reduktion und -Expansion lässt sich aber nicht nur auf Lambda-Funktionen sondern ganz allgemein auf die Definition von Funktionen anwenden. Als Beispiel betrachten wir noch einmal die folgende Definition aus dem Abschnitt Wiederkehrende rekursive Muster.

viewUsers : List User -> List (Html msg)
viewUsers users =
    List.map viewUser users

Im Abschnitt Gecurryte Funktionen haben wir gelernt, dass diese Definition nur eine Kurzform für die folgende Definition ist.

viewUsers : List User -> List (Html msg)
viewUsers =
    \users -> List.map viewUser users

Durch Eta-Reduktion können wir diese Definition jetzt zur folgenden Definition abändern.

viewUsers : List User -> List (Html msg)
viewUsers =
    List.map viewUser

Das heißt, wenn wir eine Funktion definieren und diese Funktion ruft nur eine andere Funktion mit dem Argument auf, dann können wir dieses Argument durch die Anwendung von Eta-Reduktion auch weglassen.

Wichtig

In einer Programmiersprache wie Elm werden Funktionen nicht syntaktisch identifiziert, sondern anhand ihres Typs.

So hat die Funktion viewUsers zum Beispiel kein Argument. Trotzdem handelt es sich um eine Funktion, da der Typ der Konstante viewUsers der Typ der partiellen Anwendung List.map viewUser ist. Der Ausdruck List.map viewUser wiederum hat einen funktionalen Typ, da die Funktion List.map zwei Argumente erwartet und wir nur ein Argument übergeben.

Anders ausgedrückt stellen die beiden Varianten von viewUsers einfach unterschiedliche Sichtweisen auf die Definition einer Funktion dar. In der Variante mit dem expliziten Argument users wird eine Funktion definiert, indem beschrieben wird, was die Funktion mit ihrem Argument macht. In der Variante ohne explizites Argument users wird eine Funktion definiert, indem eine Funktion als partielle Applikation einer anderen Funktion definiert wird. Man nennt diese zweite Variante auch punkt-frei (point-free).

An dieser Stelle soll noch kurz erwähnt werden, dass sich eine Eta-Reduktion auch anwenden lässt, wenn eine Top Level-Funktion eine lokale Definition enthält. Dazu betrachten wir die folgende Variante der Funktion viewUsers. In dieser Variante haben wir die Funktion viewUser, die auf jedes Element der Liste angewendet wird, als lokale Funktion in einem let-Ausdruck definiert. Es kommt in Elm relativ häufig vor, dass man eine lokale Funktion definiert und diese mithilfe von List.map auf alle Elemente einer Liste anwendet. Häufig definiert man die Funktion, die auf die Elemente der Liste angewendet wird, lokal, da sie außerhalb der Funktion nicht benötigt wird.

viewUsers : List User -> List Int
viewUsers users =
    let
        viewUser user =
            text (user.firstName ++ " " ++ user.lastName)
    in
    List.map viewUser users

Auf diese Variant von viewUsers kann man ebenfalls Eta-Reduktion anwenden und erhält die folgende Definition.

viewUsers : List User -> List Int
viewUsers =
    let
        viewUser user =
            text (user.firstName ++ " " ++ user.lastName)
    in
    List.map viewUser

Die Definition einer Funktion wie viewUsers mithilfe eines let-Ausdrucks ist relativ beliebt. Sie hat den Vorteil, dass die Funktion viewUser nur in der Definition von viewUsers verwendet werden kann. Dies ist vor allem sinnvoll, wenn die Funktion viewUser wirklich nur im Kontext dieser Funktion verwendet werden sollte. Im Fall von viewUsers verwerfen wir zum Beispiel einige der Komponenten, was in vielen anderen Anwendungsfällen möglicherweise nicht sinnvoll ist. Im Unterschied zur Definition mithilfe einer Lambda-Funktion, können wir der Funktion viewUser bei der Verwendung eines let-Ausdrucks einen Namen geben, der Entwickler*innen ggf. hilft, den Code zu verstehen. Im Allgemeinen verwendet man meistens eine Lambda-Funktion, solange die Funktion recht einfach ist und nutzt einen let-Ausdruck sobald die Funktion etwas komplizierter wird.

Funktionskomposition

Am Ende dieses Kapitels wollen wir noch eine weitere Funktion höherer Ordnung betrachten, die es ermöglicht, Eta-Reduktion anzuwenden, wenn mehrere Funktionen hintereinander angewendet werden. Diese Funktion höherer Ordnung wird als Funktionskomposition bezeichnet und ist wie folgt definiert.

(<<) : (b -> c) -> (a -> b) -> a -> c
g << f =
    \x -> g (f x)

Die Funktionskomposition kann genutzt werden, um eine neue Funktion zu definieren, indem wir zwei bestehende Funktionen kombinieren. Wir betrachten noch einmal die Funktion startWithA.

startWithA : List User -> List User
startWithA users =
    List.filter (\user -> String.startsWith "A" user.firstName) users

Mithilfe der Funktionskomposition können wir diese Funktion wie folgt definieren.

startWithA : List User -> List User
startWithA users =
    List.filter (String.startsWith "A" << .firstName) users

Die Funktion String.startsWith "A" << .firstName erhält ein Argument und wendet auf dieses Argument zuerst die Funktion .firstName an. Auf das Ergebnis der Funktion .firstName wird die Funktion String.startsWith "A" angewendet. Hierbei handelt es sich um eine partielle Applikation, da die Funktion String.startsWith zwei Argumente nimmt, wir String.startsWith aber nur auf ein Argument anwenden. Die partielle Applikation String.startsWith "A" nimmt einen String und testet, ob der String mit dem Buchstaben "A" startet.

Um die Funktionsweise der Funktionskomposition noch etwas zu illustrieren, können wir das funktionale Argument von List.filter Eta-expandieren und erhalten die folgende Definition.

startWithA : List User -> List User
startWithA users =
    List.filter (\user -> (String.startsWith "A" << .firstName) user) users

Das heißt, das funktionale Argument ist eine Funktion, die das Argument user nimmt und die Funktion (String.startsWith "A" << .firstName) auf user anwendet.

Als weiteres Beispiel wollen wir uns noch einmal die Funktion sumOfAdultAges anschauen.

sumOfAdultAges : List User -> Int
sumOfAdultAges users =
    List.sum (List.filter (\age -> age >= 18) (List.map .age users))

Die Funktion wendet mehrere Funktionen nacheinander auf das Argument users an. Daher können wir diese Funktion auch mithilfe der Funktionskomposition definieren.

sumOfAdultAges : List User -> Int
sumOfAdultAges users =
    (List.sum << List.filter (\age -> age >= 18) << List.map .age) users

Da wir sumOfAdultAges nun mittels Funktionskomposition definiert haben, können wir Eta-Reduktion anwenden und erhalten das folgende Ergebnis.

sumOfAdultAges : List User -> Int
sumOfAdultAges =
    List.sum << List.filter (\age -> age >= 18) << List.map .age

Das heißt, mithilfe der Funktionskomposition können wir Funktionen eta-reduzieren, die mehrere Funktionen nacheinander auf ein Argument anwenden.

Analog zu den Funktionen <| und |> gibt es neben der klassischen Form der Funktionskomposition << in Elm noch den Operator (>>) : (a -> b) -> (b -> c) -> a -> c, bei dem die Argumente im Vergleich zu << vertauscht sind. Mit der Funktion >> können wir sumOfAdultAges jetzt zum Beispiel im Stil des Pipings wie folgt definieren.

sumOfAdultAges : List User -> Int
sumOfAdultAges =
    List.map .age
        >> List.filter (\age -> age >= 18)
        >> List.sum

Das heißt, auf das Argument der Funktion sumOfAdultAges wird zuerst die Funktion List.map .age angewendet, dann wird List.filter (\age -> age >>= 18) angewendet und zu guter Letzt List.sum.

https://en.wikipedia.org/wiki/Haskell_Curry ↩
https://de.wikipedia.org/wiki/Currying#Anwendung ↩
Präzedenzen und Assoziativitäten der Operatoren in Elm ↩
The early history of F# - Don Syme (2020) ↩