Линейные графики, диаграммы и статистические карты. Типы и виды диаграмм

11.09.2019

Среди плоскостных диаграмм наибольшее распространение получили столбиковые, полосовые или ленточные, треугольные, квадратные, круговые, секторные, фигурные.

Столбиковые диаграммы изображаются в виде прямоугольников (столбиков), вытянутых по вертикали, высота которых соответствует значению показателя (рис. 6.9).

Полосовая диаграмма

Принцип построения полосовых диаграмм тот же, что и столбиковых. Отличие заключается в том, что полосовые (или ленточные) графики представляют значение показателя не по вертикальной, а по горизонтальной оси.

Оба вида диаграмм применяются для сравнения не только самих величин, но и их частей. Для изображения структуры совокупности строят столбики (полосы) одинакового размера, принимая целое за 100%, а величину частей целого - соответствующей удельным весам (рис. 6.10).

Для изображения показателей с противоположным содержанием (импорт и экспорт, сальдо положительное и отрицательное, возрастная пирамида) строят разнонаправленные столбиковые или полосовые диаграммы.

Основу квадратных, треугольных и круговых диаграмм составляет изображение значения показателя величиной площади геометрической фигуры.

Квадратная диаграмма

Для построения квадратной диаграммы устанавливают размер стороны квадрата путем извлечения корня квадратного из значения показателя.

Так, например, для построения диаграммы на рис. 6.11 из объема услуг связи за 1997 г. в России по отправлению телеграмм
(73 млн.), пенсионных выплат (392 млн.), посылок (24 млн.) квадратные корни составили соответствено 8,5; 19,8; 4,9.

Круговая диаграмма

Круговые диаграммы строятся в виде площади кругов, радиусы которых равны корню квадратному из значений показателя.

Секторная диаграмма

Для изображения структуры (состава) совокупности используются секторные диаграммы . Круговая секторная диаграмма строится путем разделения круга на секторы пропорционально удельному весу частей в целом. Размер каждого сектора определяется величиной угла расчета (1% соответствует 3,6 0).

Пример. Доля продовольственных товаров в объеме розничного товарооборота России составила в 1992 г. 55%, а в 1997 г. - 49%, доля непродовольственных товаров составила соответственно 45% и 51%.

Построим два круга одинакового радиуса, а для изображения секторов определим центральные углы: для продовольственных товаров 3,6 0 *55 = 198 0 , 3,6*49 = 176,4 0 ; для непродовольственных товаров 3,6 0 *45 = 162 0 ; 3,6 0 *51 = 183,6 0 . Разделим круги на соответствующие секторы (рис. 6.12).

Треугольная диаграмма

Разновидностью диаграмм, представляющих структуру (кроме столбиковых и полосовых), является диаграмма треугольная. Она применяется для одновременного изображения трех величин, изображающих элементы или составные части целого. Треугольная диаграмма представляет собой равносторонний треугольник, каждая сторона которого является равномерной масштабной шкалой от 0 до 100. Внутри строится координатная сетка, соответствующая линиям, проводимым параллельно сторонам треугольника. Перпендикуляры из любой точки координатной сетки представляют доли трех компонентов, соответствует в сумме 100% (рис. 6.13). Точка на графике соответствует 20% (по А), 30% (по В) и 50% (по С).

Рис. 6.13. Треугольная диаграмма

Фигурная диаграмма

Диаграммы фигурные представляют собой изображение в виде рисунков, силуэтов, фигур.

Прежде чем составить какой либо график, необходимо определиться с вопросом о том, какие виды диаграмм вас именно интересуют.

Рассмотрим основные из них.

Гистограмма

Само название этого вида позаимствовано из греческого языка. Дословный перевод - писать столбом. Это своеобразный столбчатый такого вида могут быть объемные, плоские, отображать вклады (прямоугольник в прямоугольнике) и т.д.

Точечная диаграмма

Показывает взаимную связь между числовыми данными в некотором количестве рядов и представляет собой пару групп цифр или чисел в виде единственного ряда точек в координатах. Виды диаграмм такого типа отображают кластеры данных, используются для научных целей. При предварительной подготовке к построению точечной диаграммы все данные, которые вы хотите расположить по иксовой оси, следует расположить в одной строке/столбце, а значения по оси «игрик» - в смежной строке/столбце.

Линейчатая диаграмма и график

Диаграмма линейчатая описывает некое соотношение отдельных данных. На такой диаграмме значения располагаются по вертикальной оси, категории же - по горизонтальной. Из этого следует, что большее внимание такая диаграмма уделяет сопоставлению данных, нежели изменениям, происходящим с течением времени. Данный вид диаграмм существует с параметром «накопление», что позволяет показать взнос отдельных частей в общий конечный результат.

График же отображает последовательность изменений числовых значений за абсолютно равные промежутки времени.

Эти виды диаграмм наиболее часто используются для построений.

Диаграммы с областями

Основной целью такой диаграммы является акцент на величине изменения данных в течение некоторого периода, путем показа суммирования введенных значений. А также отображение доли отдельно взятых значений в общей сумме.

Кольцевая и круговая диаграммы

Диаграмм весьма схожи по целям. Обе они отображают роль каждого элемента в общей сумме. Их отличие заключается лишь в том, что диаграмма кольцевая имеет возможность содержать несколько рядов с данными. Каждое отдельное вложенное кольцо представляет собой индивидуальный ряд значений/данных.

Пузырьковая

Одна из разновидностей точечной. Величина маркера зависит от величины третьей переменной. При предварительной подготовке располагать данные следует точно так же, как и при подготовке к построению точечной диаграммы.

Биржевая диаграмма

Использование таковой часто является неотъемлемым процессом при продаже акций или других ценных бумаг. Также возможно ее построение для наглядного определения изменения Для трех и пяти значений такой вид графика может содержать в себе пару осей: первую - для столбиков, которые представляют интервал неких колебаний, вторую - для изменения ценовой категории.

Это лишь малая часть типов диаграмм, которые могут вам понадобиться. Виды диаграмм в Excel весьма разнообразны. Выбор всегда зависит от целей. Так что определяйтесь с тем, что вы хотите получить в конечном итоге, а мастер построения поможет определиться!

Зачастую графическое представление данных позволяет наглядно понять смысл явления, которое описывается табличными данными. Одним из способов графического изображения зависимости между величинами является диаграмма.

В табличном процессоре MS Excel для представления данных в графической форме можно использовать почти два десятка различных типов диаграмм, причем каждый тип содержит несколько форматов. Для построения диаграмм могут использоваться различные геометрические объекты - линии, плоскости или объемные тела.

Каждый тип диаграмм служит для определенных целей. Обычно пользователь не ограничен жесткими правилами использования какого-либо типа диаграмм для определенных данных. Например, чтобы отобразить итоги продажи по каждому отделу, одинаково хорошо подходят заполненная диаграмма, линейчатая диаграмма, гистограмма или круговая диаграмма. Предположим, что мы располагаем данными об объемах продаж четырьмя региональными торговыми организациями (табл. 6.11).

Таблица 6.11. Объемы продаж по регионам

Регион Январь Февраль Март Апрель Май Июнь
Север 26 20 22 28 24 24
Юг 36 28 34 40 36 30
Восток 31 24 28 34 30 27
Запад 27 27 23 37 30 28

Нетрудно убедиться, что для сравнения динамики изменения объемов продаж лучше использовать графики (рис. 6.32), а для сравнения показателей подразделений друг с другом больше подходит гистограмма (рис. 6.33).

Сравнение этих диаграмм достаточно убедительно показывает, что задача пользователя состоит в том, чтобы выбрать ту диаграмму, которая наилучшим образом отображала бы сущность

Объем продаж, уел. ед.

Рис. 6.32. График изменения объемов продаж

Рис. 6.33. Гистограмма продаж в первом полугодии

того, что следует представить потребителю информации. Поэтому представляется целесообразным рассмотреть краткие характеристики основных типов диаграмм.

График (см. рис. 6.32) представляет собой линию, соединяющую между собой точки, каждая из которых отображает данные, расположенные в одной ячейке. Эта совокупность точек соответствует одному ряду данных. Точки на графике располагаются через равные промежутки. Поэтому график полезен для отображения тенденций изменения данных за равные промежутки времени. Графики отображают данные через некоторые промежутки времени. Данные должны быть последовательными, без пропусков значений. На одном графике можно разместить либо один ряд данных, либо несколько. На представленной диаграмме четко видна взаимосвязь между объемами продаж по каждому региону, но подсчитать итоговый объем продаж по этой диаграмме практически невозможно.

Графики позволяют увидеть и предсказать тенденции развития какого-либо процесса или явления. Иногда важнее видеть тенденцию развития, чем проанализировать реальные данные. (Например, очень важно предугадать уровень инфляции, определить рынок сбыта, прибыль, состояние рынка акций и т. д.) Графики часто используются для отображения информации о деловых и финансовых операциях, таких, как учет прибы- лей/потерь, производства/продажи, отчеты по заработной плате служащих и др.

Гистограмма (см. рис. 6.33) позволяет представить ряд данных в форме вертикально расположенных столбцов, что позволяет сравнивать, например, изменение данных на протяжении отрезка времени. Диаграммы этого типа удобны также для наглядного сравнения различных величин. Ось категорий В на гистограмме располагается по горизонтали, ось значений - по вертикали. Такое расположение осей подчеркивает характер изменения значений во времени.

Заполненные диаграммы (рис. 6.34) отображают изменения объемов производства или потребления во времени, например количество кубометров газа, израсходованного за год; дневное потребление калорий в течение месяца; изменение стоимости коммунальных услуг за год (газ, электричество, телефон и т. д.). Заполненные диаграммы фактически представляют ту же информацию, что и графики. Но при этом она показывает сумму введенных значений и отображает вклад отдельных рядов в об-

Рис. 6.34. Диаграмма с областями (заполненная диаграмма), построенная на основе данных табл. 6.11

щую сумму. Главное достоинство заполненных диаграмм состоит в том, что они позволяют увидеть соотношение отдельных составляющих и общего объема. На рис. 6.34 верхняя линия представляет общий объем продаж по месяцам. Каждая полоса на этой диаграмме - часть общего объема, которая приходится на один регион.

Эта диаграмма позволяет проследить, например, тенденцию к увеличению продаж в целом по всем четырем регионам.

Заполненные диаграммы более наглядны, чем графики, поскольку они в значительной мере отображают картину в целом, а не отдельные изменения. C помощью заполненных диаграмм достигаются две цели: визуально представляются зависимости между сериями данных и указываются их точные значения. Эти диаграммы полезно применять в тех случаях, когда следует обратить внимание получателя информации на потребление или объем продажи, производства и т. п.

Круговая диаграмма в отличие от ранее рассмотренных показывает отношение размеров элементов, образующих только один ряд данных, к размеру их суммы. Используя круговую диаграмму, необходимо постоянно помнить, что они всегда отображают только один ряд данных. Такой тип диаграммы целесообразно использовать, когда необходимо подчеркнуть значение того или иного элемента в их совокупности (рис. 6.35).

Рис. 6.35. Соотношение объемов продаж в регионах за январь (по данным табл. 6.11)

В том случае, когда необходимо решить аналогичную задачу для отображения нескольких рядов данных, следует использовать кольцевые диаграммы. Здесь каждому ряду данных соответствует одно кольцо (рис. 6.36).

Рис. 6.36. Соотношение объемов продаж в регионах за первый квартал (по данным табл. 6.11)

Лепестковая диаграмма позволяет сравнивать совокупные значения нескольких рядов данных (рис. 6.37). В ней каждая категория данных имеет собственную ось координат. Эти оси расходятся лучами от начала координат. Линиями соединяются значения, относящиеся к одному ряду. Диаграммы такого типа по-

Рис. 6.37. Показатели оценки места возможного расположения филиала

лезны в тех случаях, когда необходимо выбрать один объект из нескольких, сравнивая численные показатели их характеристик. Предположим, предприятие планирует открыть филиал. Предварительная оценка каждого из возможных мест расположения филиала приведена в табл. 6.12.

Таблица 6.12, Оценка места возможного расположения филиала (по десятибалльной шкале)

На основании этих данных будет получена лепестковая диаграмма (рис. 6.37).

Точечная диаграмма (рис. 6.38) применяется для отображения отношений между численными значениями в нескольких рядах данных. Этот тип диаграмм особенно полезен, когда нужно сравнить данные, расположенные в разных рядах. Такая необходимость может возникнуть, например, при сравнении расчетных и фактических данных, полученных в ходе эксперимента (табл. 6.13), в котором измерялась температура объекта.

Таблица 6.13. Данные измерений

Время наблюдения 9:00 9:30 10:00 10:30 11:00 11:30 12:00 12:30
Трасч 21,00 21,05 21,10 21,15 21,20 21,25 21,30 21,35
Тфакт 21,62 21,71 21,19 21,33 21,72 21,31 21,35 21,67

Наиболее распространенными диаграммами сравнения являются столбиковые диаграммы, принцип построения которых состоит в изображении статистических показателей в виде поставленных по вертикали прямоугольников - столбиков (рис. 2.1.1). Каждый столбик изображает величину отдельного уровня исследуемого статистического ряда. Таким образом, сравнение статистических показателей возможно потому, что все сравниваемые показатели выражены в одной единице измерения.

При построении столбиковых диаграмм необходимо начертить систему прямоугольных координат, в которой располагаются столбики. На горизонтальной оси располагаются основания столбиков, величина основания определяется произвольно, но устанавливается одинаковой для всех.

Рисунок 2.1.1 - Пример столбиковой диаграммы

Шкала, определяющая масштаб столбиков по высоте, расположена по вертикальной оси. Величина каждого столбика по вертикали соответствует размеру изображаемого на графике статистического показателя. Таким образом, у всех столбиков, составляющих диаграмму, переменной величиной является только одно измерение.

Размещение столбиков в поле графика может быть различным:

  • · на одинаковом расстоянии друг от друга;
  • · вплотную друг к другу;
  • · в частном наложении друг на друга.

Правила построения столбиковых диаграмм допускают одновременное расположение на одной горизонтальной оси изображений нескольких показателей. В этом случае столбики располагаются группами, для каждой из которых может быть принята разная размерность варьирующих признаков.

Разновидности столбиковых диаграмм составляют так называемые ленточные или полосовые диаграммы. Их отличие состоит в том, что масштабная шкала расположена по горизонтали сверху и она определяет величину полос по длине.

Область применения столбиковых и полосовых диаграмм одинакова, так как идентичны правила их построения. Одномерность изображаемых статистических показателей и их одномасштабность для различных столбиков и полос требуют выполнения единственного положения: соблюдения соразмерности (столбиков - по высоте, полос - по длине) и пропорциональности изображаемым величинам. Для выполнения этого требования необходимо: во-первых, чтобы шкала, по которой устанавливается размер столбика (полосы) , начиналась с нуля; во-вторых, эта шкала должна быть непрерывной, т.е. охватывать все числа данного статистического ряда; разрыв шкалы и соответственно столбиков (полос) не допускается. Невыполнение указанных правил приводит к искаженному графическому представлению анализируемого статистического материала.

Столбиковые и полосовые диаграммы как прием графического изображения статистических данных, по существу, взаимозаменяемы, т.е. рассматриваемые статистические показатели равно могут быть представлены как столбиками, так и полосами. И в этом, и в другом случае для изображения величины явления используется одно измерение каждого прямоугольника - высота столбика или длина полосы. Поэтому и сфера применения этих двух диаграмм в основном одинакова.

Разновидностью столбиковых (ленточных) диаграмм являются направленные диаграммы. Они отличаются от обычных двусторонним расположением столбиков или полос и имеют начало отсчета по масштабу в середине. Обычно такие диаграммы применяются для изображения величин противоположного качественного значения. Сравнение между собой столбиков (полос), направленных в разные стороны, менее эффективно, чем расположенных рядом в одном направлении. Несмотря на это, анализ направленных диаграмм позволяет делать достаточно содержательные выводы, так как особое расположение придает графику яркое изображение. К группе двусторонних относятся диаграммы чистых отклонений. В них полосы направлены в обе стороны от вертикальной нулевой линии: вправо - для прироста; влево - для уменьшения. С помощью таких диаграмм удобно изображать отклонения от плана или некоторого уровня, принятого за базу сравнения. Важным достоинством рассматриваемых диаграмм является возможность видеть размах колебаний изучаемого статистического признака, что само по себе имеет большое значение для анализа.

Для простого сравнения не зависимых друг от друга показателей могут также использоваться диаграммы, принцип построения которых состоит в том, что сравниваемые величины изображаются в виде правильных геометрических фигур, которые строятся так, чтобы площади их относились между собой как количества, этими фигурами изображаемые. Иными словами, эти диаграммы выражают величину изображаемого явления размером своей площади.

Для получения диаграмм рассматриваемого типа используют разнообразные геометрические фигуры - квадрат, круг, реже - прямоугольник. Известно, что площадь квадрата равна квадрату его стороны, а площадь круга определяется пропорционально квадрату его радиуса. Поэтому для построения диаграмм необходимо сначала из сравниваемых величин извлечь квадратный корень. Затем на базе полученных результатов определить сторону квадрата или радиус круга соответственно принятому масштабу (рис. 2.1.2).

Рисунок 2.1.2 - Пример фигурной диаграммы

Наиболее выразительным и легко воспринимаемым является способ построения диаграмм сравнения в виде фигур-знаков. В этом случае статистические совокупности изображаются не геометрическими фигурами, а символами или знаками, воспроизводящими в какой-то степени внешний образ статистических данных. Достоинство такого способа графического изображения заключается в высокой степени наглядности, в получении подобного отображения, отражающего содержание сравниваемых совокупностей.

Важнейший признак любой диаграммы - масштаб. Поэтому чтобы правильно построить фигурную диаграмму, необходимо определить единицу счета. В качестве последней принимается отдельная фигура (символ), которой условно присваивается конкретное численное значение. А исследуемая статистическая величина изображается отдельным количеством одинаковых по размеру фигур, последовательно располагающихся на рисунке. Однако в большинстве случаев не удается изобразить статистический показатель целым количеством фигур. Последнюю из них приходится делить на части, так как по масштабу один знак является слишком крупной единицей измерения. Обычно эта часть определяется на глаз. Сложность точного ее определения является недостатком фигурных диаграмм. Однако большая точность представления статистических данных не преследуется, и результаты получаются вполне удовлетворительными.

Как правило, фигурные диаграммы широко используются для популяризации статистических данных и рекламы .

— В некотором смысле, показывая человеку круговую диаграмму, вы можете оскорбить его интеллектуальные способности

К. Г. Карстен, «Диаграммы и графики» (1923)

Первые негативные выпады в сторону круговых (секторных) диаграмм начались более 100 лет назад. В 1914 году инженер и сторонник визуализации, Виллард Бринтон (Willard Brinton), опубликовал работу под названием «Графические методы», которую принято считать первой книгой о правильной визуализации данных для широкой аудитории. Он был Эдвардом Тафтом своего времени: пропагандистом наглядного обмена информацией и памфлетистом плохих форм.

Значительная часть книги Бринтона предостерегает читателей от использования круговых диаграмм (pie chart). В самой первой главе, описывая «составные элементы», автор объясняет:

«Круговая диаграмма, вероятно, используется гораздо чаще, чем любая другая форма, для демонстрации пропорций элементов. Однако, круг с секторами — это далеко не оптимальная форма, поскольку он и близко не обладает такой же выразительностью, как столбиковые диаграммы. Недостатком секторного представления является невозможность размещения частей таким образом, чтобы их можно было легко сравнить или просуммировать».

С тех пор, как Бринтон написал эти слова, многие статистики и эксперты в области визуализации выступили против секторных диаграмм и настаивали на использовании различных альтернатив. Хотя изначально в своих суждениях критики апеллировали к логике, за последние 40 лет они отыскали экспериментальные доказательства, которые указывают на неполноценность таких диаграмм в плане точности передачи информации.

Тем не менее, круговые диаграммы остаются весьма востребованными. Крупные издательства и медиа-корпорации, например, The Walt Street Journal и Target Corporation, до сих пор используют их, чтобы отображать свои данные. Кроме того, некоторые веб-ресурсы также задействуют этот довольно спорный графический метод.

Чтобы понять суть проблемы, вернемся к ее истокам и рассмотрим аргументы сторонников и критиков секторных диаграмм.

История возникновения

Отцом современной визуализации данных можно по праву назвать Уильяма Плейфэра (William Playfair). Он родился в Шотландии в 1759 году и вел очень увлекательный образ жизни. Плейфэр принимал участие во взятии Бастилии, внес свой вклад в развитие телеграфа и, конечно же, опубликовал первую круговую диаграмму. Он также является создателем столбиковой и линейной диаграмм.

Круговая диаграмма является одной из многих инноваций шотландского «мошенника» Уильяма Плейфэра

На рубеже XVIII века, использование иллюстраций в серьезной интеллектуальной литературе считалось слишком детским подходом. Но, как свободно мыслящего человека, Плейфэра это не остановило.

В 1801 году он опубликовал «Статистический Бревиарий» (Statistical Breviary) — книгу, посвященную демографическим и экономическим данным европейских государств. В этой работе, которая содержала первую круговую диаграмму, Плейфэр аргументирует ценность использования графических элементов: «Создание визуального образа для наших глаз при сохранении всех пропорций и размеров — это наиболее оптимальный и читабельный способ выражения определенной идеи».

Секторная диаграмма, опубликованная на страницах «Статистического Бревиария», показана ниже. На ней изображены доли земельных участков Турецкой Империи, расположенных в Азии, Африке и Европе тех времен. Этот рисунок принято считать первой круговой диаграммой, где идея о целом была представлена в виде круга, а для различия секторов использовался цвет.

Распределение площади Турецкой Империи является первой известной секторной диаграммой

Но как Плейфэр пришел к такой идее?

Некоторые эксперты считают, что секторная диаграмма обязана своим появлением кругам, которые использовались для представления понятий в философии и математике. Брат Плейфэра, Джон, был уважаемым математиком и ученым. Вполне вероятно, что Уильям увидел разделенный круг, изображающий составные части категории, в одной из его работ. Математики и философы применяют этот тип иллюстрации еще с XIV века.

Пример использования круга для представления составных частей в XIV веке

Секторная диаграмма, впрочем как и другие инновации Плейфэра, обрела широкое распространение не сразу. В то время Уильяма считали «мошенником» и нечистым на руку бизнесменом, поэтому, как правило, его идеи игнорировались.

Так продолжалось до 1850-х годов, пока круговая диаграмма не обрела еще одного важного сторонника — французского инженера Чарльза Джозефа-Минарда (Charles Joseph-Minard), который подтвердил эффективность данного метода. Минард был «пионером» статистических графиков и, по мнению многих, создателем самых гениальных методик визуализации данных.

Будучи в первую очередь картографом, Минард дополнил круговыми диаграммами свои карты. На размещенном ниже примере он изобразил в виде таких диаграмм количество мяса, поставляемого в парижские магазины из различных регионов Франции. Размер круга представляет общее количество мяса, и каждый круг разделен пропорционально на доли баранины, телятины и говядины:

Карта, созданная пионером визуализации данных Чарльзом Джозефом-Минардом в 1858 году, с использованием круговых диаграмм

Изобретение секторной диаграммы иногда ошибочно приписывают легендарной британской медсестре и общественному деятелю Флоренс Найтингейл (Florence Nightingale). В 1858 году она распределила причины смертности британских солдат в Крымской войне по месяцам. Флоренс использовала эту диаграмму, чтобы убедить правительство Великобритании улучшить санитарные условия и питание в военных лагерях.

Несмотря на то, что ее чертеж смотрится очень мощно и убедительно, на самом деле он не является круговой диаграммой. Это так называемая областная диаграмма (polar-area chart), в которой круг делится на ровные части, но их длина зависит от величины переменной:

Областная диаграмма Флоренс Найтингейл, которую часто путают с круговой диаграммой

Критика в адрес круговой диаграммы

Первые сто лет истории круговой диаграммы были мирным временем, но буря уже надвигалась. Слова Бринтона, которые мы цитировали в начале поста, являются самым ранним примером критики в сторону данной инновации, но к 1920 году в мире появилось еще больше литературы, резко осуждающий этот метод.

В 1923 году американский экономист Карл Густав Карстен (Karl G. Karsten) согласился с предупреждением Бринтона касательно секторных диаграмм. Заявления Карстена в его книге «Диаграммы и графики» (Charts and Graphs) удивительно похожи на те, что мы слышим сегодня:

«У секторной диаграммы очень много недостатков. Во-первых, человеческий глаз не может нормально сравнить длину дуги окружности, поскольку секторы направлены в различные стороны. Во-вторых, человеческое зрение не приспособлено к сравнению углов в принципе…

Наконец, невозможно эффективно оценить величину областей, особенно если они представлены в виде неравномерных секторов в круге. Не существует способа, который бы позволял сравнивать компоненты круглой фигуры так же быстро и точно, как части прямой линии или столбца»

Однако, хотя подобные выпады звучали все чаще, статистик Вальтер Кросби Иллс (Walter Crosby Eells) отметил, что многие критические замечания основываются «исключительно на личных предпочтениях». Иллс и другие решили проверить это предположение.

Ранние исследования в этой области были направлены на то, чтобы выяснить, пропорции какой разделенной фигуры — круга или столбца — люди определяют более точно. В ходе эксперимента 1927 года, проведенного Фредериком Крокстоном (Frederick Croxton) и Роем Страйкером (Roy Stryker), ученые попросили более 800 испытуемых угадать пропорции каждого компонента различных сегментированных фигур:

В данном случае пропорции практически идентичны.

Исследователи рассчитали среднюю погрешность предположений респондентов, но в этом эксперименте и многих других экспериментах ученым так и не удалось отыскать серьезных доводов, дискредитирующих круговые диаграммы. Сторонники данного типа визуализации до сих пор используют результаты проведенных в 1927 году исследований, чтобы аргументировать свою точку зрения.

Тем не менее, как отметил ученый Майкл Макдональд-Росс (Michael Macdonald-Ross) в обширном обзоре «Конфронтации круга и столбца», эти первоначальные эксперименты на самом деле не отображают реальное положение вещей. Несмотря на то, что сегментированный столбец в то время считался основной альтернативой кругу, сегодня специалисты практически всегда предлагают использовать гистограммы или точечные диаграммы.

Основной и, возможно, наиболее мощный удар по секторным диаграммам пришелся на 1980-е года, благодаря усилиям статистика Уильяма Кливленда (William Cleveland). Кливленд является автором новаторской книги «Элементы графических данных», в результате которой, как многие считают, визуализация данных обрела научную основу. Его работа не только описывает базовые «задачи восприятия», решаемые при просмотре диаграммы (например, суждения касаемо длины или площади), но и утверждает, с какими из них люди справляются лучше всего.

В эксперименте, проведенном в 1984 году, Кливленд и его друг, исследователь Роберт МакГилл (Robet McGill) тестировали круговую диаграмму. Вместо того, чтобы сравнивать ее с сегментированным столбцом, они сопоставили разделенный на части круг с его истинным конкурентом — гистограммой:.

В эксперименте Кливленда задачей восприятия гистограммы было определение позиции на шкале, а при просмотре круговых диаграмм — угол сегмента. Ученые обнаружили, что гипотез на счет высоты столбцов гистограммы были в 1,96 раз точнее, чем суждения, касающиеся угла. Кливленд отметил: «Круговые диаграммы не обеспечивают эффективную передачу информацию о разнице значений».

После этого, статистик Наоми Роббинс (Naomi Robbins) проводила исследования, чтобы понять, почему мы так плохо определяем углы. В книге «Создание более эффективных графиков» (Creating More Effective Graphs) она пишет, что, как правило, люди склонны недооценивать острые углы и переоценивать тупые. Роббинс также утверждает, что сегменты круга, направленные в стороны, кажутся большими, чем те, что размещены вверху или внизу.

Это исследование подбодрило ярых противников секторных диаграмм, к которым относятся и сегодняшние ведущие специалисты в области визуализации данных — Эдвард Тафт (Edward Tuft) и Стивен Фью (Spethen Few). Тафт пишет: «Таблица практически всегда лучше, чем дурацкая круговая диаграмма, а Фью добавляет: «Пироги можете оставить на десерт» (pie — пирог по-английски).

Кроме того, круговые диаграммы постоянно высмеиваются популярными СМИ, например, в Washington Post, и в New York Times:

Круговая диаграмма, демонстрирующая эффективность круговой диаграммы

Тем не менее, у этого инструмента есть и свои защитники.

Доводы в защиту круговой диаграммы

По мнению многих пользователей, основным преимуществом круговой диаграммы является то, что все сегменты выглядят частью чего-то целого. К примеру, рассматривая график населения страны, распределенного по возрастным группам, зритель понимает, что представленные данные касаются всех людей, проживающих в этой стране. Это допущение не будет столь очевидным в случае с гистограммами.

Некоторые ученые также оспаривают эмпирическую литературу, которая резко критикует секторные диаграммы. Пожалуй, ни один человек не потратил больше времени на поиск аргументов в пользу этих диаграмм, чем психолог Ян Спенс (Ian Spence). В своей книге «Возникновение и использование статистических диаграмм (No Humble Pie: The Origins and Usage of a Statistical Chart) он активно защищает этот осуждаемый многими визуальный элемент.

Спенс утверждает, что исследования восприятия «пирожковых» диаграмм плохо проработаны. Он считает работу Кливленда ошибочной, поскольку в ней испытуемых просят сравнить размеры отдельных сегментов круга, а не оценить величину сегмента по отношению к целой фигуре. По его мнению, круговые диаграммы чаще используются для второй цели. Ссылаясь на другое исследование 1987 года, Спенс заявляет, что в этом плане секторные диаграммы и сегментированные столбцы абсолютно идентичны. Он пишет:

«На мой взгляд, чаще всего круговые диаграммы критиковали люди, которые хотели сделать больше, чем могли на самом деле. Секторная диаграмма — это простой информационный график, и его основное назначение заключается в демонстрации связи между сегментом и целой фигурой»

Исследование 2013 года о толковании человеком круговых диаграмм и столбцов дало сторонникам «пирогов» еще больше аргументов. В ходе эксперимента, проведенного Университетом Тафтса для измерения психической энергии, требуемой при просмотре различных графиков, использовалась около инфра-красная спектроскопия. Авторы обнаружили, что круговые диаграммы оцениваются не менее точно и что среднестатистический человек не считает их изучение более утомительным, чем просмотр гистограмм.

Однако, критикуя данное исследование, Стивен Фью утверждает, что заявления, сделанные психологами, ошибочны и безответственны. Эксперимент проверял способность людей делать гипотезы касаемо отдельных диаграмм (круговой и столбиковой), а не одной и той же. По словам Фью, на самом деле, глядя на эти графики, респонденты должны были действовать не совсем так, поэтому данная работа не имеет большого значения.

Другие считают, что секторная диаграмма может быть полезной, когда она используется редко и в эстетических целях. Нейтан Яу (Nathan Yau) из Flowing Datapoints говорит, что даже если предположения об углах в круговой диаграмме не так точны, как в других случаях, это не особо важно, ведь на практике выдвигать такие допущения не нужно практически никогда (в частности, когда на чертеже изображено только два или три значения). При определенных обстоятельствах, круговую диаграмму выбрать даже лучше, чисто из дизайнерских соображений:

Эта диаграмма не очень информативна с точки зрения представления данных, но она красива и оригинальна (Sky — небо, Sunny side of pyramid — солнечная сторона пирамиды, Shady side of pyramid — теневая сторона пирамиды)

Вместо заключения

Даже после столетних споров об их полезности, круговые диаграммы никуда не делись. На защиту (как и на критику) этого визуального инструмента представления данных было затрачено много энергии, при этом ученым так и не удалось объяснить привлекательность данной фигуры. Возможно, она связана с тем, что это первый тип диаграмм, с которыми люди сталкиваются еще в школе, или же нам попросту нравятся круги. А может, стоит винить Microsoft за то, что они добавили секторные диаграммы в Excel.

Так или иначе, по мере увеличения роли информации и цифровых данных в современной жизни, их грамотная визуализация требует все больше внимания. Многие уже выступают за то, чтобы статистика стала обязательной дисциплиной для изучения в старших классах. Как знать, возможно, благодаря более широкому использованию гистограмм и других графических методик, круговые диаграммы наконец утратят свою актуальность. Или нет.

Похожие статьи