Изменение пароля
Пользователь
anonymous
Текущий пароль
*
Новый пароль
*
Подтверждение
*
Запомнить меня
Забыли пароль?
Электронная библиотека (16+)
Впервые на сайте?
Вход
/
Регистрация
Национальный цифровой ресурс
Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 612819)
Для выхода нажмите Esc или
Визуализация данных с помощью ggplot2 (4000,00 руб.)
0
0
Первый автор
Мастицкий Сергей
Издательство
М.: ДМК Пресс
Страниц
224
Предпросмотр
ID
794807
Аннотация
Визуализация данных играет важную роль на всех этапах статистического анализа — от первичного ознакомления со свойствами данных до диагностики качества построенных моделей и представления полученных результатов. Из всего разнообразия статистических программ выделяется R — интенсивно развивающаяся и свободно распространяемая система статистических вычислений, в которой реализовано множество классических и современных методов анализа данных. Программные реализации алгоритмов, входящих в базовую версию R, проверены на практике не одним поколением пользователей и ученых. Кроме того, пользователи R постоянно разрабатывают многочисленные дополнения для этой системы. Настоящая книга посвящена ggplot2 — одному из таких пакетов, который значительно расширяет и без того богатые базовые графические возможности R. В 2015 г. ggplot2 был установлен более миллиона раз. Такая популярность этого пакета обусловлена несколькими причинами, среди которых можно отметить эстетическую привлекательность и пригодное для публикации качество получаемых с его помощью графиков, возможность создавать пользовательские типы диаграмм, а также большой набор опций для тонкой настройки внешнего вида графиков. В этой книге описаны основы работы с ggplot2 и приведены многочисленные примеры кода, которые читатели легко могут модифицировать для собственных нужд.
Кому рекомендовано
Книга окажется полезной для всех пользователей R, желающих освоить новый мощный инструмент анализа данных.
ISBN
978-5-97060-470-0
УДК
311:004.9R
ББК
60.6с515
Мастицкий, С. Э. Визуализация данных с помощью ggplot2 / С. Э. Мастицкий .— Москва : ДМК Пресс, 2017 .— 224 с. : ил. — ISBN 978-5-97060-470-0 .— URL: https://rucont.ru/efd/794807 (дата обращения: 04.06.2025)
Популярные
Этика и права человека в информационном ...
220,00 руб
Блок-схемы на основные технологические ц...
220,00 руб
Программирование технологических контрол...
200,00 руб
Современные направления развития измерит...
150,00 руб
Библиотековедение, библиографоведение и ...
290,00 руб
Технологии бизнес-презентаций
80,00 руб
Вы уже смотрели
СОЦИАЛЬНАЯ ИНФРАСТРУКТУРА СЕЛЬСКИХ ТЕРРИ...
330,00 руб
Управление образовательными организациям...
148,50 руб
Альманах Узбекистан (на английском языке...
1364,00 руб
Learning to read and discuss fiction
242,00 руб
«Основы педагогики»
220,00 руб
«Великая Германия». Формирование немецко...
249,00 руб
Предпросмотр (выдержки из произведения)
Резюме документа
Страницы
Текст
Визуализация_данных_с_помощью_ggplot2.pdf
Стр.3
Стр.5
Стр.6
Стр.7
Визуализация_данных_с_помощью_ggplot2.pdf
УДК 311:004.9R ББК 60.6с515 М32 М32 Визуализация данных с помощью ggplot2. – М.: ДМК Пресс, 2017. – 222 с.: ил. Мастицкий С. Э. ISBN 978-5-97060-470-0 Визуализация данных играет важную роль на всех этапах статистического анализа – от первичного ознакомления со свойствами данных до диагностики качества построенных моделей и представления полученных результатов. Из всего разнообразия статистических программ выделяется R – интенсивно развивающаяся и свободно распространяемая система статистических вычислений, в которой реализовано множество классических и современных методов анализа данных. Программные реализации алгоритмов, входящих в базовую версию R, проверены на практике не одним поколением пользователей и ученых. Кроме того, пользователи R постоянно разрабатывают многочисленные дополнения для этой системы. Настоящая книга посвящена ggplot2 – одному из таких пакетов, который значительно расширяет и без того богатые базовые графические возможности R. В 2015 г. ggplot2 был установлен более миллиона раз. Такая популярность этого пакета обусловлена несколькими причинами, среди которых можно отметить эстетическую привлекательность и пригодное для публикации качество получаемых с его помощью графиков, возможность создавать пользовательские типы диаграмм, а также большой набор опций для тонкой настройки внешнего вида графиков. В этой книге описаны основы работы с ggplot2 и приведены многочисленные примеры кода, которые читатели легко могут модифицировать для собственных нужд. Книга окажется полезной для всех пользователей R, желающих освоить новый мощный инструмент анализа данных. УДК 311:004.9R ББК 60.6с515 Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Материал, изложенный в данной книге, многократно проверен. Но поскольку вероятность технических ошибок все равно существует, издательство не может гарантировать абсолютную точность и правильность приводимых сведений. В связи с этим издательство не несет ответственности за возможные ошибки, связанные с использованием книги. © Мастицкий С.Э. ISBN 978-5-97060-470-0 © Оформление, издание, ДМК Пресс, 2017
Стр.3
Оглавление Предисловие 7 1 Введение 10 1.1 Что представляет собой ggplot2? . . . . . . . . . . . . . . . . 10 1.2 Инсталляция ggplot2 и начало работы . . . . . . . . . . . . 10 1.3 Грамматика графических элементов . . . . . . . . . . . . . . 11 1.4 Данные, используемые в примерах . . . . . . . . . . . . . . . 12 2 Функция qplot(): быстрое решение для задач визуализации 15 2.1 Аргументы функции qplot() . . . . . . . . . . . . . . . . . . 15 2.2 Построение диаграмм рассеяния с помощью qplot() . . . . 16 2.3 Другие примеры использования qplot() . . . . . . . . . . . . 19 2.3.1 Линии тренда . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.2 Одномерные диаграммы рассеяния . . . . . . . . . . . 21 2.3.3 Диаграммы размахов . . . . . . . . . . . . . . . . . . . 22 2.3.4 Гистограммы, кривые плотности вероятности, полигоны частот . . . . . . . . . . . . . . . . . . . . . . 25 2.3.5 Столбиковые диаграммы . . . . . . . . . . . . . . . . . 30 2.4 Категоризованные графики . . . . . . . . . . . . . . . . . . . 31 3 Построение графиков слой за слоем 34 3.1 Аргументы функции ggplot() . . . . . . . . . . . . . . . . . 34 3.2 Слои . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.3 Требования к данным . . . . . . . . . . . . . . . . . . . . . . . 38 3.4 Присваивание эстетических атрибутов . . . . . . . . . . . . . 39 3.5 Группирование данных . . . . . . . . . . . . . . . . . . . . . . 41 3.6 Геометрические объекты, реализованные в ggplot2 . . . . . 43 3.7 Статистические преобразования . . . . . . . . . . . . . . . . . 46 4 Основные типы статистических графиков 49 4.1 Общие аргументы geom– и stat–функций . . . . . . . . . . . 49 4.2 Визуализация одномерных распределений . . . . . . . . . . . 50 4.2.1 Точечные диаграммы Уилкинсона: geom_dotplot() . 50 4.2.2 Столбиковые диаграммы: geom_bar() . . . . . . . . . 54 4.2.3 Гистограммы: geom_histogram() . . . . . . . . . . . . 60 4.2.4 Полигоны частот: geom_freqpoly() . . . . . . . . . . 62 4.2.5 Кривые плотности вероятности: geom_density() . . . 64
Стр.5
ОГЛАВЛЕНИЕ 5 4.2.6 Кумулятивные функции распределения: geom_step() 67 4.2.7 Квантильные графики: stat_qq() . . . . . . . . . . . 71 4.3 Визуализация 2D– и 3D–распределений . . . . . . . . . . . . 73 4.3.1 Контуры плотности вероятности: geom_density2d() . 74 4.3.2 Изолинии: geom_contour() . . . . . . . . . . . . . . . 76 4.3.3 Сотовые диаграммы: geom_hex() . . . . . . . . . . . . 78 4.4.1 Диаграммы диапазонов: geom_linerange(), geom_pointrange(), geom_errorbar(), geom_crossbar() . . . . . . . . . . . . . . . . . . . . . 79 4.4 Визуализация сводной статистической информации о количественных переменных . . . . . . . . . . . . . . . . . . 79 4.4.2 Диаграммы размахов: geom_boxplot() . . . . . . . . . 85 4.4.3 Скрипичные диаграммы: geom_violin() . . . . . . . 89 4.5 Визуализация зависимостей . . . . . . . . . . . . . . . . . . . 92 4.5.1 Диаграммы рассеяния: geom_point() . . . . . . . . . 93 4.5.2 Линии тренда: geom_smooth() . . . . . . . . . . . . . . 95 4.5.3 Линии квантильной регрессии: geom_quantile() . . . 99 4.6 Визуализация временных рядов . . . . . . . . . . . . . . . . . 101 4.6.1 Функция geom_line() . . . . . . . . . . . . . . . . . . 102 4.6.2 Функция geom_ribbon() . . . . . . . . . . . . . . . . . 104 4.7 Тепловые карты: geom_tile() . . . . . . . . . . . . . . . . . . 105 4.8 Другие геометрические объекты . . . . . . . . . . . . . . . . 107 4.8.1 «График–щетка»: geom_rug() . . . . . . . . . . . . . . 107 4.8.2 Горизонтальные и вертикальные линии: geom_hline(), geom_vline() . . . . . . . . . . . . . . . 109 4.8.3 Прямоугольные области: geom_rect() . . . . . . . . . 111 4.8.4 Отрезки: geom_segment() . . . . . . . . . . . . . . . . 112 4.8.5 Ломаные линии: geom_path() . . . . . . . . . . . . . . 113 4.8.6 Многоугольники: geom_polygon() . . . . . . . . . . . 116 4.8.7 Площадь под кривой: geom_area() . . . . . . . . . . . 118 4.8.8 Текстовые аннотации: geom_text() . . . . . . . . . . . 119 134 4.9 Географические карты: geom_map() . . . . . . . . . . . . . . . 124 4.10 Добавление слоев при помощи функций семейства stat . . . 131 5 Шкалы 5.1 Шкалы и их основные типы . . . . . . . . . . . . . . . . . . . 134 5.2 Аргументы, общие для всех scale–функций . . . . . . . . . 137 5.3 Шкалы положения . . . . . . . . . . . . . . . . . . . . . . . . 140 5.3.1 Шкалы положения для количественных переменных 140 5.3.2 Шкалы положения для дат и времени . . . . . . . . . 145 5.3.3 Шкалы положения для качественных переменных . . 147 5.4 Цветовые шкалы . . . . . . . . . . . . . . . . . . . . . . . . . . 149 5.4.1 Цветовые шкалы для количественных переменных . 150 5.4.2 Цветовые шкалы для качественных переменных . . . 154 5.5 Пользовательские шкалы для качественных переменных . . 158 5.6 Тождественные шкалы . . . . . . . . . . . . . . . . . . . . . . 160
Стр.6
6 ОГЛАВЛЕНИЕ 6 Системы координат 162 6.1 Декартова система и ее разновидности . . . . . . . . . . . . . 163 6.2 Полярная система . . . . . . . . . . . . . . . . . . . . . . . . . 166 6.3 Картографические проекции . . . . . . . . . . . . . . . . . . . 168 7 Подробнее о категоризованных графиках 171 7.1 Два способа организации панелей . . . . . . . . . . . . . . . . 171 7.2 Функция facet_grid() . . . . . . . . . . . . . . . . . . . . . . 172 7.3 Функция facet_wrap() . . . . . . . . . . . . . . . . . . . . . . 180 8 Подготовка графиков к публикации 183 8.1 Стили . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 8.2 Создание составных рисунков . . . . . . . . . . . . . . . . . . 201 8.2.1 Использование окон просмотра . . . . . . . . . . . . . 203 8.2.2 Использование пакета gridExtra . . . . . . . . . . . . 206 8.3 Экспорт графиков из среды R . . . . . . . . . . . . . . . . . . 208 9 Дополнительные ресурсы для изучения ggplot2 212 9.1 Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 9.2 Онлайн–ресурсы . . . . . . . . . . . . . . . . . . . . . . . . . . 213 9.3 Расширения, созданные на основе ggplot2 . . . . . . . . . . 214 Предметный указатель 217
Стр.7
Облако ключевых слов *
* - вычисляется автоматически