Главная - Литература



( 1.0 - Math.pow( 1.0 + monthlylnterest, - months ) ) / monthlylnterest

Результаты не впечатляют:

Время выполнения

Время выполнения

Экономия

Язык

кода до оптимизации

оптимизированного кода

время он и

Java

2,94

2,83

Python

3,91

3,94

По-виднмому, метод MathpowQ настолько дорог, что он перекрывает выгоду устранения подвыражения. Возможно также, что подвыражение уже было устранено компилятором. Если бы подвыражение составляло не такую малую часть стоимости всего выражения или если бы оптимизатор компилятора был менее эффективен, этот вид оптимизации, наверное, оказал бы большее влияние на производительность.

26.5. Методы

Одним из самых эффективных способов оптимизации кода птиитниит ш11Ш1 т» является грамотная декомпозиция программы на методы, заании ттУ* Небольшие, хорошо определенные методы делают програм- , . -

му компактнее, устраняя повторяющиеся фрагменты кода. Они упрощают оптимизацию, потому что рефакторинг одного метода улучшает все методы, которые его вызывают. Небольшие методы относительно легко переписать на низкоуровневом языке. Объемные хитроумные методы понять сложно, а после переписывания их на низкоуровневом языке вроде ассемблера это вообще невыполнимо.

Встраивание методов

На заре программирования вызывать методы на некоторых компьютерах было крайне дорого. Вызов метода означал, что ОС должна выгрузить программу, загрузить каталог методов, загрузить конкретный метод, выполнить метод, выгрузить метод и снова загрузить вызвавший метод. Все это потребляло много ресурсов и замедляло программу.

Современные компьютеры облагают вызовы методов гораздо меньшей пошлиной. Например, встраивание метода копирования строк приводит к таким результатам:

Время выполнения

Время выполнения

Экономия

Язык

метода

встроенного кода

времени

0,471

0,431

Java

13,1

14,4

-10%

В некоторых случаях вы можете сэкономить несколько наносекунд, встроив код метода в программу, используя ключевое слово inline языка С++ или аналогичную возможность. Если ваш язык не поддерживает inline непосредственно, но имеет препроцессор макросов, вы можете встраивать код при помощи макроса, включая и выключая встраивание по требованию. Однако современные компьютеры



(под «современными» я понимаю любые машины, с которыми вы можете столкнуться в своей работе), при вызове метода почти не тратят дополнительных ресурсов. Как показывает пример, встроив код, вы можете как улучшить производительность, так и ухудшить ее.

26.6. Переписывание кода

на низкоуровневом языке

Давняя мудрость, которую не стоит оставлять без внимания, гласит, что при низком быстродействии код следует переписать на языке низкого уровня. Если вы пишете на С++, языком низкого уровня может быть ассемблер, если на Python - С. Переписывание кода на низкоуровневом языке обычно положительно влияет и на быстродействие кода, и на его объем. Типичный подход к оптимизации при помощи низкоуровневого языка таков.

1. Напишите все приложение на высокоуровневом языке.

2. Выполните полное тестирование приложения и проверьте его корректность. ftepiKfiiHii (Бшш Пйдроб- 5- Если производительность недостаточна, выполните пронес & том, ЧТ0 оеновная тш филирование приложения с целью выявления горячих то-щшт штшш пты- чек. Так как около 50% времени выполнения программы ш ftpti)c&jpr?я на «аный що обычно приходится примерно на 5% кода, горячими точ-т Парвто* рщеяаТо. обычно будут небольшие фрагменты программы.

4. Перепишите несколько небольших фрагментов на низкоуровневом языке для повышения общей производительности программы.

Последуете ли вы по этому проторенному пути, зависит от того, насколько хорошо вы программируете на низкоуровневых языках, насколько хорошо проблема подходит для решения на низкоуровневом языке, а также от степени вашего отчаяния. Сам я впервые применил эту методику при реализации алгоритма Data Encryption Standard, о чем я упоминал в главе 25. Я перепробовал все виды оптимизации, о которых когда-либо слышал, но программа все равно работала вдвое медленнее, чем нужно. Мне ничего не оставалось делать, кроме как переписать часть программы на ассемблере. Не имея особого опыта программирования на ассемблере, я по сути ограничился простым переводом кода с высокоуровневого языка на ассемблер, но даже этот примитивный подход ускорил выполнение программы на 50%.

Рассмотрим переписывание на ассемблере метода, преобразующего двоичные данные в символы ASCII верхнего регистра. В следующем примере показан соответствующий код Delphi:

Пример кода на Delphi, который лучше переписать на ассемблере

procedure HexExpanci( var source: ByteArray; var target: WordArray; byteCount: word



index: integer; lowerByte: byte; upperByte: byte; targetlndex: integer; begin

targetlndex := 1;

for index := 1 to byteCount do begin

target[ targetlndex ] := ( (source[ index target[ targetIndex+1 ] := (source[ index targetlndex := targetlndex + 2;

end; end;

] and $F0) shr 4 ) ] and $0f) + $41;

+ $41;

фудно увидеть жир в этом коде, однако он содержит много манипуляций с битами, что не является сильной стороной Delphi. А вот ассемблер подходит для этого как нельзя лучше, так что этот код является хорошим кандидатом на переписывание. Вот что получается в итоге:

Пример метода, переписанного на ассемблере

procedure HexExpand( var source; var target; byteCount : Integer

label EXPAND;

EXPAND:

ECX,byteCount

Загрузка числа расширяемых байт.

ESI,source

Смещение источника.

EDI,target

Смещение приемника.

EAX,EAX

Обнуление индекса смещения в массиве.

): MOV

EBX,EAX

Смещение в массиве.

DL,[ESI+EBX]

Получение байта источника.

DH.DL

Копирование байта источника.

DH,$F

Получение старших разрядов.

DH,$41

Преобразование символа в верхний регистр

DL,4

Сдвиг разрядов на нужную позицию.

DL,$F

Получение младших разрядов.

DL,$41

Преобразование символа в верхний регистр

BX,1

Удвоение смещения в массиве-приемнике.

[EDI+EBX],DX

Копирование слова в приемник.







0.0113