RosettaCodeData/Task/S-expressions/JavaScript/s-expressions-2.js

(() => {
    "use strict";

    // ------------------ S-EXPRESSIONS ------------------
    const main = () => {
        const expr = [
            "((data \"quoted data\" 123 4.5)",
            "  (data (!@# (4.5) \"(more\" \"data)\")))"
        ].join("\n");

        const [parse, residue] = parseExpr(
            tokenized(expr)
        );

        return 0 < residue.length ? (
            `Unparsed tokens: ${JSON.stringify(residue)}`
        ) : 0 < parse.length ? ([
            JSON.stringify(parse, null, 2),
            "Reserialized from parse:",
            parse.map(serialized).join(" ")
        ].join("\n\n")) : "Could not be parsed";
    };

    // ---------------- EXPRESSION PARSER ----------------

    // parseExpr [String] -> ([Expr], [String])
    const parseExpr = tokens =>
        // A tuple of (parsed trees, residual tokens)
        // derived from a list of tokens.
        until(finished)(readToken)([
            [], tokens
        ]);


    // finished :: ([Expr], [String]) -> Bool
    const finished = ([, tokens]) =>
        // True if no tokens remain, or the next
        // closes a sub-expression.
        0 === tokens.length || ")" === tokens[0];


    // readToken :: ([Expr], [String]) -> ([Expr], [String])
    const readToken = ([xs, tokens]) => {
        // A tuple of enriched expressions and
        // depleted tokens.
        const [token, ...ts] = tokens;

        // An open bracket introduces recursion over
        // a sub-expression to define a sub-list.
        return "(" === token ? (() => {
            const [expr, rest] = parseExpr(ts);

            return [xs.concat([expr]), rest.slice(1)];
        })() : ")" === token ? (
            [xs, token]
        ) : [xs.concat(atom(token)), ts];
    };

    // ------------------- ATOM PARSER -------------------

    // atom :: String -> Expr
    const atom = s =>
        0 < s.length ? (
            isNaN(s) ? (
                "\"'".includes(s[0]) ? (
                    s.slice(1, -1)
                ) : {
                    name: s
                }
            ) : parseFloat(s, 10)
        ) : "";


    // ------------------ TOKENIZATION -------------------

    // tokenized :: String -> [String]
    const tokenized = s =>
        // Brackets and quoted or unquoted atomic strings.
        quoteTokens("\"")(s).flatMap(
            segment => "\"" !== segment[0] ? (
                segment.replace(/([()])/gu, " $1 ")
                .split(/\s+/u)
                .filter(Boolean)
            ) : [segment]
        );


    // quoteTokens :: Char -> String -> [String]
    const quoteTokens = q =>
        // Alternating unquoted and quoted segments.
        s => s.split(q).flatMap(
            (k, i) => even(i) ? (
                Boolean(k) ? (
                    [k]
                ) : []
            ) : [`${q}${k}${q}`]
        );

    // ------------------ SERIALIZATION ------------------

    // serialized :: Expr -> String
    const serialized = e => {
        const t = typeof e;

        return "number" === t ? (
            `${e}`
        ) : "string" === t ? (
            `"${e}"`
        ) : "object" === t ? (
            Array.isArray(e) ? (
                `(${e.map(serialized).join(" ")})`
            ) : e.name
        ) : "?";
    };


    // --------------------- GENERIC ---------------------

    // even :: Int -> Bool
    const even = n =>
        // True if 2 is a factor of n.
        0 === n % 2;


    // until :: (a -> Bool) -> (a -> a) -> a -> a
    const until = p =>
        // The value resulting from repeated applications
        // of f to the seed value x, terminating when
        // that result returns true for the predicate p.
        f => {
            const go = x =>
                p(x) ? x : go(f(x));

            return go;
        };

    return main();
})();