Как предотвратить удаление общих подвыражений (CSE) с помощью GHC

Учитывая программу:

import Debug.Trace
main = print $ trace "hit" 1 + trace "hit" 1

Если я компилирую с ghc -O (7.0.1 или выше), я получаю вывод:

hit
2

то есть GHC использовал общее исключение подвыражений (CSE), чтобы переписать мою программу как:

main = print $ let x = trace "hit" 1 in x + x

Если я компилирую с -fno-cse, то я вижу, что hit появляется дважды.

Можно ли избежать ЕГЭ, изменив программу? Есть ли подвыражение e, для которого я могу гарантировать, что e + e не будет подвергнуто CSE? Я знаю о lazy, но не могу найти ничего, предназначенного для подавления CSE.

Предысторией этого вопроса является библиотека cmdargs, где CSE ломает библиотеку (из-за нечистоты в библиотека). Одно из решений — попросить пользователей библиотеки указать -fno-cse, но я бы предпочел изменить библиотеку.

Neil Mitchell 07.05.2011 источник

comment

Хм, дальний план, но это напомнило мне, что я хотел попытаться сделать магия утверждений каким-то образом видна пользователю. В случае, если это окажется возможным, он также может действовать как тег, предотвращающий GHC от вызовов конкретных функций CSE. - Peter Wortmann 07.05.2011

comment

@Peter: я пробовал использовать утверждения, но для этого требовалось -fno-ignore-asserts. - Neil Mitchell 07.05.2011

comment

(due to impurity in the library). Очевидно, что поскольку это нарушает семантику Haskell, компиляторы запутаются. Нет ли способа реорганизовать ваш код, чтобы сделать его ссылочно прозрачным так, чтобы его мог понять компилятор? Например. Монада ST или сделать ее чистой? - Don Stewart 07.05.2011

comment

Вы использовали unsafePerformIO, вы получили то, что заслужили. - augustss 07.05.2011

comment

@Don Stewart: это используется для извлечения аннотаций, таких как opt "example", из пользовательского кода (см. здесь). Поскольку пользовательский код может быть чем угодно, это должно нарушать ссылочную прозрачность по замыслу. Довольно крутой хак, но очень хрупкий. - Peter Wortmann 07.05.2011

Ответы (4)

arrow_upward
29
arrow_downward

Как насчет устранения источника проблемы — неявного эффекта — с помощью монады последовательности, которая создает этот эффект? Например. монада строгого тождества с трассировкой:

data Eval a = Done a
            | Trace String a

instance Monad Eval where
  return x = Done x

  Done x    >>= k = k x
  Trace s a >>= k = trace s (k a)

runEval :: Eval a -> a
runEval (Done x) = x

track = Trace

теперь мы можем написать материал с гарантированным порядком вызовов trace:

main = print $ runEval $ do
            t1 <- track "hit" 1
            t2 <- track "hit" 1
            return (t1 + t2)

оставаясь при этом чистым кодом, и GHC не будет пытаться умничать даже с -O2:

    $ ./A
    hit
    hit
    2

Итак, мы вводим только вычислительный эффект (отслеживание), достаточный для того, чтобы научить GHC той семантике, которую мы хотим.

Это чрезвычайно надежное решение для компиляции оптимизаций. Настолько, что GHC оптимизирует математику до 2 во время компиляции, но при этом сохраняет порядок операторов trace.

В качестве доказательства того, насколько надежен этот подход, вот ядро с -O2 и агрессивным встраиванием:

main2 =
  case Debug.Trace.trace string trace2 of
    Done x -> case x of 
        I# i# -> $wshowSignedInt 0 i# []
    Trace _ _ -> err

trace2 = Debug.Trace.trace string d

d :: Eval Int
d = Done n

n :: Int
n = I# 2

string :: [Char]
string = unpackCString# "hit"

Таким образом, GHC сделал все возможное для оптимизации кода, включая статические расчеты, сохраняя при этом правильную трассировку.

Ссылки: полезная монада Eval для секвенирования была представлена Саймон Марлоу.

Don Stewart 07.05.2011

comment

Не подходит для моего конкретного приложения, но, конечно, именно так это должно быть сделано почти во всех случаях. Для реального кода вы, вероятно, должны использовать putStrLn вместо trace и иметь runEval возврат в монаде IO. - Neil Mitchell; 07.05.2011

comment

Я не уверен, что использование IO кувалды является очевидным решением в производстве. Мы получаем хорошие преимущества оптимизации от монады трассировки без чрезмерной последовательности, и она чистая, поэтому ее легче компоновать. Я подозреваю, что у него есть какое-то применение. - Don Stewart; 07.05.2011

comment

Использование Нилом unsafePerformIO на самом деле довольно умно и совсем не критично для производительности (декодирование аргумента командной строки). Я не знаю способа сделать это так же удобно, как с помощью unsafePerformIO. Но я готов заплатить неудобствами за чистоту. - augustss; 08.05.2011

arrow_upward
12
arrow_downward

При чтении исходного кода в GHC видно, что единственными выражениями, которые не подходят для CSE, являются те, которые не соответствуют exprIsBig. В настоящее время это означает Expr. значения Note, Let и Case, а также выражения, которые их содержат.

Таким образом, ответ на поставленный выше вопрос будет таким:

unit = reverse "" `seq` ()

main = print $ trace "hit" (case unit of () -> 1) +
               trace "hit" (case unit of () -> 1)

Здесь мы создаем значение unit, которое разрешается в (), но для которого GHC не может определить значение (используя рекурсивную функцию, GHC не может оптимизировать - reverse просто под рукой). Это означает, что GHC не может выполнить CSE функцию trace и ее 2 аргумента, и мы получаем hit дважды. Это работает как с GHC 6.12.4, так и с 7.0.3 на -O2.

Neil Mitchell 07.05.2011

comment

Отвечая на свой вопрос? Прохладно! - Tener; 07.05.2011

comment

@augustss Действительно, я подозреваю, что reverse "" упадет до специализации конструктора до того, как CSE изменится - я уверен, что в конечном итоге компилятор меня перехитрит. - Neil Mitchell; 07.05.2011

comment

@Tener У меня не было ответа, когда я опубликовал его, и я надеюсь, что у кого-то все еще может быть лучший ответ, чем мой, который наиболее устойчив к будущим улучшениям GHC. - Neil Mitchell; 07.05.2011

comment

Ответ заключается не в использовании unsafePerformIO. То, как вы его используете, неверно, потому что то, что вы делаете, не реализует чистую функцию нечистым способом. Вы на самом деле используете побочные эффекты. Haskell не для этого. - augustss; 07.05.2011

arrow_upward
8
arrow_downward

Я думаю, что вы можете указать опцию -fno-cse в исходном файле, т.е. поставив прагму

{-# OPTIONS_GHC -fno-cse #-}

наверху.

Еще один способ избежать удаления общих подвыражений или вообще разрешить плавающие выражения — ввести фиктивные аргументы. Например, вы можете попробовать

let x () = trace "hi" 1 in x () + x ()

Этот конкретный пример не обязательно будет работать; в идеале вы должны указать зависимость данных с помощью фиктивных аргументов. Например, следующее, вероятно, сработает:

let
    x dummy = trace "hi" $ dummy `seq` 1
    x1      = x ()
    x2      = x x1 
in x1 + x2

Результат x теперь "зависит" от аргумента dummy и общего подвыражения больше нет.

Heinrich Apfelmus 07.05.2011

comment

-fno-cse в моем исходном файле не будет работать — он должен быть в исходном файле человека, использующего мою библиотеку, что делает его менее желательным. Фактической зависимости от данных нет, поэтому я бы заставил конечного пользователя добавить фальшивые зависимости от данных, что сделало API библиотеки действительно уродливым. Это оба полезных ответа для всех, кто не пишет библиотеку и сталкивается с этой проблемой. - Neil Mitchell; 07.05.2011

arrow_upward
4
arrow_downward

Я немного не уверен в монаде последовательности Дона (отправляю это как ответ, потому что сайт не позволяет мне добавлять комментарии). Немного изменив пример:

main :: IO ()
main = print $ runEval $ do
            t1 <- track "hit 1" (trace "really hit 1" 1)
            t2 <- track "hit 2" 2
            return (t1 + t2)

Это дает нам следующий результат:

hit 1
hit 2
really hit 1

То есть первая трассировка срабатывает, когда выполняется оператор t1 <- ..., а не тогда, когда t1 фактически оценивается в return (t1 + t2). Если мы определим монадический оператор связывания как

Done x    >>= k = k x
Trace s a >>= k = k (trace s a)

вместо этого выходные данные будут отражать фактический порядок оценки:

hit 1
really hit 1
hit 2

То есть трассировка будет срабатывать при выполнении инструкции (t1 + t2), что (IMO) является тем, чего мы действительно хотим. Например, если мы изменим (t1 + t2) на (t2 + t1), это решение выдаст следующий результат:

hit 2
really hit 2
hit 1

Вывод исходной версии остается неизменным, и мы не видим, когда наши термины действительно оцениваются:

hit 1
hit 2
really hit 2

Как и исходное решение, это также работает с -O3 (проверено на GHC 7.0.3).

Mikhail Glushenkov 07.05.2011

Как предотвратить удаление общих подвыражений (CSE) с помощью GHC

Ответы (4)

Вопросы по теме