Около программизма: Расширенный алгоритм Евклида

07.11.2020

Расширенный алгоритм Евклида

Ситуация сложилась так, что временно три компьютера мне не доступны для теста производительности на решении СЛАУ методом Гаусса-Жордана. Поэтому пока я жду их доступности, что бы получить результаты, и тогда проведу детальный анализ.

Во время ожидания у меня возникла необходимость посчитать обратный элемент по модулю. Это можно делать либо с помощью расширенного алгоритма Евклида, либо по теореме Эйлера с помощью быстрого возведения в степень.

Сам-то я не очень силен в модулярной арифметике, поэтому принялся искать готовое описание, годное для реализации, расширенного алгоритма Евклида. Не скажу, что бы прям сильно глубоко искал, но потратил в районе часа.
И выяснил в результате, что в русскоязычном сегменте Инета нет годного внятного описания алгоритма. В англоязычном искал существенно меньше, но и там, похоже, ситуация не лучше. То, что нашел, работает лишь частично верно.

В результате получил верно работающую лишь рекурсивную версию классического расширенного алгоритма Евклида. Догадываюсь, что можно перенести на итерации, но что-то туплю, и не могу понять, как это сделать. И самое главное: не ясно, будет ли с этого какой толк в плане производительности. Возможно, кому-то понадобится рабочий вариант, поэтому выкладываю его на Pascal:

function ExtEuclidRec(X, Y : Int64; var A, B : Int64) : Int64;
var
OldA : Int64;
begin
OldA := X mod Y;
if OldA = 0 then
begin
    Result := Y;
    A := 0;
    B := 1;
end
else
begin
    Result := ExtEuclidRec(Y, OldA, A, B);
    OldA := A;
    A := B;
    B := OldA - B*(X div Y);
end;
end;

Уточню обозначения. Расширенный алгоритм Евклида фактически решает линейное диофантово уравнение Ax + By = D.
Встречаются разные трактовки переменных в этом выражении. У меня x и у ‒ заданные значения, а A и B ‒ те константы, которые находит алгоритм Евклида, D же, соответственно ‒ наибольший общий делитель x и у.
Часто встречает обратный подход, когда A и B задано, а x и y необходимо найти.
Не тестил, но, возможно при значения x, y, близких к 2^63 будет работать неверно, из-за переполнения при операциях вычитания. При меньших значения работает всегда верно.

Есть еще бинарный вариант расширенного алгоритма Евклида. Вроде как в обычном варианте, по утверждению Кнута, бинарный вариант быстрее на 60% классического. Но с того момента много воды утекло, и операции деления, хоть и остаются медленными, но стали все же намного быстрее, чем это было 20 лет назад, поэтому это утверждение требует проверки на современных компьютерах. Тем не менее, вполне допускаю это для обычного алгоритма Евклида, так как он вполне себе компактен и красив.
Но вот та версия расширенного бинарного алгоритма, что мне удалось найти, не так как красива, как обычного. Приведу ее рабочий и протестированный вариант:

function ExtEuclidBin(X, Y : Int64; var A, B : Int64) : Int64;
var
g : int64;
u, v : Int64;
A1, B1, C, D : Int64;
begin
g := 1;
while (X and 1 = 0) and (Y and 1 = 0) do
begin
    X := X shr 1;
    Y := Y shr 1;
    g := g shl 1;
end;
u := X;
v := Y;
A1 := 1;
B1 := 0;
C := 0;
D := 1;
repeat
    while (u and 1 = 0) do
    begin
      u := u shr 1;
      if (A1 and 1 = 0) and (B1 and 1 = 0) then
      begin
        A1 := A1 div 2;
        B1 := B1 div 2;
      end
      else
      begin
        A1 := (A1+Y) div 2;
        B1 := (B1-X) div 2;
      end;
    end;
    while (v and 1 = 0) do
    begin
      v := v shr 1;
      if (C and 1 = 0) and (D and 1 = 0) then
      begin
        C := C div 2;
        D := D div 2;
      end
      else
      begin
        C := (C+Y) div 2;
        D := (D-X) div 2;
      end;
    end;
    if u > v then
    begin
      u := u-v;
      A1 := A1-C;
      B1 := B1-D;
    end
    else
    begin
      v := v-u;
      C := C-A1;
      D := D-B1;
    end;
until (u = 0) or (v=0);
if u = 0 then
begin
    Result := v*g;
    A := C;
    B := D;
end
else
begin
    Result := u*g;
    A := A1;
    B := B1;
end;
end;

Здесь такое же обозначение переменных, как и в предыдущем примере.
Это просто жесть, конечно, по сравнению с компактной рекурсивной записью расширенного алгоритма Евклида в классическом варианте. Как думаете, будет ли такой алгоритм работать быстрее классического?
Кроме сложности алгоритма, у него есть и другие особенности. В частности, линейное диофантово уравнение допускает множество решений, и классический расширенный алгоритм Евклида дает минимальный вариант коэффициентов А и B, в то время как бинарный дает произвольное правильное решение, то есть найденные А и B могут быть не минимальными по абсолютному значению.
В связи с этим у приведенного бинарного алгоритма есть более серьезное ограничение, чем у классического варианта: он гарантированно корректно работает только при x и у < 2^32. Вызвано это возможным переполнением при вычислении A1, B1, C, D. Может быть, и есть вариант, у которого данное ограничение отсутствует, но мне про него не известно.

Кстати, любопытно, но последние версии Delphi не умеют оптимизировать деление знаковых целых на два, хотя, например, Delphi 7 делала это влет.

12 комментариев:

Ivan Kolesnikov07.11.2020, 18:13
Итеративный алгоритм вроде аналогичен итеративному обычного алгоритма Евклида: gcd(x, y) = gcd(y, x%y) = ... = gcd(d, 0), в расширенном только нужно видоизменять уравнения целиком:

На i-й итерации:
a_prev * x + b_prev * y = d_prev
a * x + b * x = d

На i+1 итерации:
a_next * x + b_next * y = d_next

По алгоритму Евклида: d_next = d_prev % d = d_prev - d * (d_prev / d)

Подставляем уравнения из i-й итерации, получаем:
a_next = a_prev - a*(d_prev / d)
b_next = b_prev - b*(d_prev / d)
d_next = d_prev - d*(d_prev / d)

Далее заменяем xx_prev = xx, xx = xx_next и повторяем, пока d_next != 0

В итоге получаем:
a * x + b * y = d где d - НОД

А ну и для 1-й итерации:
1 * x + 0 * y = x
0 * x + 1 * y = y

Дальнейшая оптимизация: считать обе "a" и "b" не обязательно, достаточно только "a" или "b", а в конце можно легко найти вторую зная "d"

Реализация бинарного варианта какая-то запутанная :) я бы для начала переименовал u -> D1, v -> D2, C -> A2, D -> B2, тогда все становится понятнее, по крайней мере мне :), все те же 2 уравнения:

A1 * X + B1 * Y = D1
A2 * X + B2 * Y = D2

Которые трансформируются используя:
- НОД(2*P, 2*Q) = 2*НОД(P, Q) - 1-й цикл в функции
- НОД(2*P, 2*Q+1) = НОД(P, 2*Q+1) - 2 внутренних цикла. Там правда есть хитрость: D может быть чётным, а A и B оба нечетными, в этом случае нужно преобразовывать уравнение: A*X+B*Y=D в (A+Y)*X+(B-X)*Y=D Можно доказать что пары A+Y и B-X станут четными.
- НОД(P, Q) = НОД(abs(P-Q), min(P, Q)) - 2 условия в конце repeat цикла.

Я бы чуток по проще написал основной цикл:
1. Если D1 > D2 (u и v в текущей реализации), меняем уравнения местами
2. A2 -= A1, B2 -= B1, D2 -= D1
3. Если D2 0 выходим
4. Пока D2 четное: сдвигаем, обновляя A2 и B2 аналогично текущей реализации

Во 1-х это будет короче, во 2-х меньше условий, если я конечно не напутал, но это не убирает проблему переполнения.

И также можно обойтись подсчетом только A или B, и в конце, зная D, рассчитать вторую переменную.

Какой метод быстрее? Так сходу сложно сказать... Голосую за бинарный :)
ОтветитьУдалить
Ответы

Добавить комментарий

Около программизма

07.11.2020

Расширенный алгоритм Евклида

12 комментариев:

Архив блога

Обо мне