Около программизма: Про указатели

29.08.2020

Про указатели

Итак, накидал тут намеднясь первую версию теста с заменой указателей на индексы в массиве. Что бы избавиться от длинных операций с памятью, заменив их вычислением адреса. Надо сказать, что 16 РОН тут решают, без них вся затея не стоила бы выделки.
В итоге получилось, что одна операция чтения из памяти 8 байт заменяется на чтение 2 байт, одно 32-битное умножение и сложение.

И вот здесь возникло у меня сомнение. А точно ли второе быстрее первого? Решил проверить. Чисто на паскале это вообще не так, с указателями работает гораздо быстрее. А вот на ассемблере все не так однозначно.
Код на указателях почти всегда чуть быстрее кода на индексах, малоуловимо, чуть выше погрешности измерения.

С памятью, конечно, ситуация не в пользу указателей. Если использовать указатели, то в худшем случае (СЛАУ из 3-х переменных типа float32) на хранение коэффициентов можно использовать 60% памяти, 40% уйдет на указатели. В случае же использования индексов можно под коэффициенты использовать не менее 83% памяти.
Так что даже не знаю, какой вариант выбрать. Как думаете?

Из любопытного. Для работы с массивами часто используется индексная адресация, вычисляемая как сумма базы и смещения, масштабированного на размер элемента данных. Но при последовательной обработке строк можно было бы ограничиться только базой, так как следующий элемент находится рядом. То есть вот такой код

@LOOP:
inc BX;
fmul dword ptr [R11 + RBX*4]; // вычисление адреса займет 2 такта
...
jb @LOOP;

заменить таким
lea RDX, [R11 + RBX*4];
@LOOP:
add RDX, 4;// вычисление адреса займет 1 такт
inc BX;
fmul dword ptr [RDX];
...
jb @LOOP;

Идея состояла в том, что бы немного ускорить перемещение от элемента к элементу. Так вот, такой вариант оказался медленнее, по крайней мере для операций с плавающей точкой на моем процессоре. Честно говоря, несколько удивился этому.

3 комментария:

Ivan Kolesnikov31.08.2020, 13:35
> Так что даже не знаю, какой вариант выбрать. Как думаете?

Вроде есть еще один вариант: информация о перестановках вроде нужна только на время решения системы, что если хранить данные плоско, а массив указателей переиспользовать между системами для перестановки уравнений? Правда сходу сложно сказать на сколько этот вариант будет лучше/хуже: с одной стороны массив нужно заполнять каждый раз, но с другой минимум математики при самом решении системы. По памяти точно экономнее.

> вычисление адреса займет 2 такта

Вроде масштабирование индекса не влияет на производительность, и lea выполняет умножение и сложение за 1 такт. Забавно что хоть lea и про адреса, но на деле ей можно подсунуть произвольные числа, и тот же clang этим активно пользуется, например "x*5" компилируется в "lea eax, [rdi + 4*rdi]".
ОтветитьУдалить
Ответы

Добавить комментарий

Около программизма

29.08.2020

Про указатели

3 комментария:

Архив блога

Обо мне