Главная - Литература



Табл. 20-2. Эффективность нахождения дефектов при использовании разных методик

Методика

Минимальная

Типичная

Максимальная

устранения дефектов

эффективность

эффективность

эффективность

Неформальные

обзоры проекта

Формальные

инспекции проекта

Неформальные

обзоры кода

Формальные

инспекции кода

Моделирование

или прототипирование

Самостоятельная

проверка кода

Блочное тестирование

Тестирование новых

функций (компонентов)

Интеграционное

тестирование

Регрессивное

тестирование

Тестирование системы

Ограниченное бета-тес-

тирование (менее чем

в 10 организациях)

Крупномасштабное бета-

тестирование (более чем

в 1000 организаций)

Источники: «Programming Productivity» Ooris, 1986а), «Software Defect-Removal Efficiency» Qones, 1996) и «What We Have Learned About Fighting Defects» (Shull et al., 2002).

Самое интересное в этих данных то, что типичная эффективность об-наружения дефектов при использовании любой методики не превышает 75% и что в среднем она равна примерно 40%. Более того, самые популярные методики - блочное тестирование и интеграционное тестирование - позволяют найти обычно только около 30-35% дефектов. Как правило, используется подход, основанный на интенсивном тестировании, что позволяет устранить лишь около 85% дефектов. Ведущие организации используют более широкий диапазон методик, достигая при этом 95%-ой или более высокой эффективности устранения дефектов (Jones, 2000).

Итак, если разработчики хотят достигнуть более высокой эффективности обнаружения дефектов, они должны полагаться на комбинацию методик. Одно из подтверждений этого вывода было получено в классическом исследовании Глен-форда Майерса (Myers, 1978b). Участниками исследования были программисты, обладавшие минимум 7-, а в среднем - 11-летним опытом. Исследуемая программа



содержала 15 известных ошибок. Майерс попросил каждого программиста найти эти ошибки, используя одну из следующих методик:

тестирование выполнения программы по спецификации;

тестирование выполнения программы по спецификации с возможностью изучения исходного кода;

анализ/инспекция с использованием и спецификации, и исходного кода.

Различия эффективности обнаружения дефектов оказались очень большими: программисты нашли от 1 до 9 дефектов. Средний показатель был равен 5,1, или 1/3 от общего числа известных дефектов.

При использовании одной методики никакая из них не имела статистически значимого преимущества над любой другой. В то же время любая комбинация двух методик - в том числе использование одной методики двумя независимыми группами - приводила к увеличению общего числа найденных дефектов почти вдвое. В исследованиях, проведенных в Лаборатории проектирования ПО NASA, компании Boeing и других компаниях, было обнаружено, что разные программисты находят разные дефекты. Только примерно каждую пятую ошибку, обнаруженную в ходе инспекций, находят двое или более разработчиков (Kouchakdjian, Green, and Basili, 1989; Tripp, Struck, and Pflug, 1991; Schneider, Martin, and Tsai, 1992). Майерс обращает внимание на то, что поиск одних видов ошибок оказывается более эффективным при непосредственном участии людей (например, при инспекции или анализе кода), а других видов - при компьютерном тестировании (Myers, 1979). Этот вывод подтвердился в более позднем исследовании, показавшем, что чтение кода способствует нахождению дефектов интерфейса, а функциональное тестирование - нахождению дефектов управляющих структур (Basili, Selby and Hutchens, 1986). lypy тестирования Борис Бейзер (Boris Beizer) сообщает, что неформальные подходы к тестированию обычно позволяют достигнуть покрытия кода тестами лишь на 50-60%, если только вы не используете анализатор покрытия Oohnson, 1994).

Таким образом, методики поиска дефектов лучше применять в комбинации. Джонс Gories) также подтверждает этот вывод. Используя исключительно тестирование, высоких результатов добиться невозможно. Джонс сообщает, что комбинация блочного тестирования, функционального тестирования и тестирования системы часто приводит к обнаружению менее б0%.дефектов, что обычно неприемлемо для конечного продукта.

Эти данные также помогают понять, почему программисты, начинающие применять дисциплинированную методику устранения дефектов, такую как экстремальное программирование, добиваются более высокой степени устранения дефектов. Как показывает табл. 20-3, набор методик устранения дефектов, применяемых в экстремальном программировании, позволяет устранить около 90% дефектов в обычной ситуации и 97% в лучшем случае, что гораздо выше среднего для отрасли показателя, равного 85%. Некоторые программисты связывают этот факт с синергичными отношениями между методиками экстремального программирования, но на самом деле это просто предсказуемый результат использования конкретного набора методик устранения дефектов. Эффективность других комбинаций методик может оказаться такой же или даже более высокой, поэтому выбор кон-



кретных методик устранения дефектов, позволяющих достичь желаемого уровня качества, является одним из аспектов эффективного планирования проекта.

Табл. 20-3. Эффективность обнаружения дефектов, характерная для экстремального программирования

Методика устранения дефектов

Минимальная эффективность

Типичная эффективность

Максимальная эффективность

Неформальные обзоры проекта (парное программирование)

Неформальные обзоры кода (парное программирование)

Самостоятельная

проверка кода

Блочное тестирование

Интеграционное тестирование

Регрессивное тестирование

Общая эффективность устранения дефектов

-74%

-90%

-97%

Стоимость нахождения дефектов

Некоторые методики обнаружения дефектов дороже других. Наиболее экономичные при прочих равных условиях имеют наименьшую стоимость в расчете на один обнаруженный дефект. Равенством прочих условий пренебрегать нельзя, поскольку стоимость методики в расчете на один дефект зависит от общего числа обнаруженных дефектов, этапа обнаружения каждого дефекта и других факторов, не связанных с экономическими аспектами конкретной методики.

Как правило, эксперименты показывают, что инспекции обходятся дешев-Л[ ле, чем тестирование. В исследовании, проведенном в Лаборатории проектирования ПО, было обнаружено, что при чтении кода число дефектов, находимых в час, было примерно на 80% более высоким, чем при тестировании (Basili and Selby, 1987). В другой организации поиск дефектов проектирования с использованием блочного тестирования был вшестеро дороже, чем при использовании инспекций (Ackerman, Buchwald, and Lewski, 1989). Более позднее исследование, проведенное в IBM, показало, что на обнаружение каждой ошибки разработчики тратили 3,5 человеко-часа в случае инспекций кода и 15-25 в случае тестирования (Kaplan, 1995).

Стоимость исправления дефектов

Стоимость нахождения дефектов - только одна часть уравнения. Другой частью является стоимость их исправления. На первый взгляд, методика обнаружения дефектов не играет роли: стоимость их исправления всегда будет одинаковой.

Это неверно, потому что чем дольше дефект остается в системе, тем больше средств придется потратить на его устранение. Следовательно, методика, способствующая раннему обнаружению ошибок, снижает стоимость их исправления. Еще важнее







0.008