|
|
|||||||||||||||||||||||||||||
|
Учебник. Анализ данных сводных таблиц с помощью модели данных в Excel 2013Источник: officemicrosoft office.microsoft
Менее чем за час вы научитесь создавать в Excel отчеты сводной таблицы, объединяющие данные из нескольких таблиц. Первая часть этого учебника поможет вам импортировать данные и изучить их. Во второй части вы научитесь уточнять модель данных, лежащую в основе отчета, добавлять в отчеты Power View новые вычисления и иерархии, а также оптимизировать их с помощью надстройки Power Pivot. Начнем с импорта данных.
ПРИМЕЧАНИЕ. Поздравляем! Вы только что создали модель данных. Модель - это уровень интеграции данных, который создается автоматически, когда вы импортируете несколько таблиц или работаете с ними одновременно в одном отчете сводной таблицы. Модель практически не видна в Excel, но вы можете просматривать и изменять ее напрямую с помощью надстройки Power Pivot . В Excel наличие модели данных прослеживается тогда, когда вы видите набор таблиц в списке полей сводной таблицы. Существует несколько способов создать модель. Просмотр данных в сводной таблицеЧтобы просмотреть данные в понятном виде, вы можете перетащить поля в области Значения, Столбцыи Строки в списке полей сводной таблицы.
Сводная таблица должна быть похожа на изображенную ниже. Не затрачивая особых усилий, вы создали сводную таблицу, которая содержит поля из четырех разных таблиц. Эта задача оказалась настолько легкой благодаря заранее созданным связям между таблицами. Так как связи между таблицами существовали в источнике данных и вы импортировали все таблицы сразу, приложение Excel смогло воссоздать эти связи в модели. Но что делать, если данные происходят из разных источников или импортируются не одновременно? В общих случаях вы сможете внести новые данные, создав связи на основе совпадающих столбцов. На следующем этапе вы импортируете дополнительные таблицы и узнаете о требованиях к новым связям и этапах их создания. Добавление дополнительных таблицЧтобы научиться устанавливать связи, вам нужны дополнительные несвязанные таблицы. На этом этапе вы получите оставшиеся данные, используемые в этом учебнике, импортировав дополнительную базу данных и вставив данные из двух других книг. Добавление категорий продуктов
Добавление географических данных
Добавление данных по магазинам
Теперь получилось четыре листа. Лист1 содержит сводную таблицу, лист Лист2 содержит ProductCategories, Лист3 содержит Geography, а Лист4 - Stores. Поскольку вы уже присвоили имена всем таблицам, следующий шаг - создание связей - будет гораздо проще. Использование полей из новых импортированных таблицВы можете прямо сейчас использовать поля из только что импортированных таблиц. Если приложению Excel не удается определить, как внести поле в отчет сводной таблицы, появится запрос на создание связи между таблицами, с помощью которого новая таблица будет сопоставлена с той, которая уже является частью модели.
На самом деле Excel создает модель данных, которую можно использовать глобально во всей книге в любом количестве сводных таблиц и диаграмм, а также отчетов Power View. Для этой модели фундаментальными являются связи между таблицами, определяющие пути навигации и вычисления данных в отчете сводной таблицы. Выполняя следующую задачу, вы вручную создадите связи для подключения к только что импортированным данным. Добавление связейВы можете систематически создавать связи для всех новых таблиц, которые вы импортируете. Если вы используете книгу совместно с сотрудниками, следует заранее определить связи на случай, если сотрудники не ориентируются в данных так же хорошо, как вы. Создавая связи вручную, вы будете работать с двумя таблицами одновременно. Для каждой таблицы можно выбрать столбцы, которые указывают приложению Excel метод поиска связанных строк в другой таблице.
Связывание ProductSubcategory с ProductCategory
Добавление категорий в сводную таблицуХотя в модель данных были добавлены дополнительные таблицы и связи, они еще не используются в сводной таблице. В этой задаче в список полей сводной таблицы добавляется ProductCategory.
Контрольная точка: повторите изученный материалВы создали сводную таблицу, которая содержит данные из нескольких таблиц, импортированных на предыдущем этапе. Чтобы свести данные воедино, потребовалось создать связи таблиц, которые Excel использует для согласования строк. Вы узнали, что наличие столбцов с данными о сопоставлении необходимо для поиска связанных строк. В образце данных все таблицы содержат столбец, который можно использовать с этой целью. Хотя сводная таблица работает, вы, возможно, заметили некоторые оставшиеся недочеты. Список полей сводной таблицы выглядит так, будто в нем есть лишние таблицы (DimEntity) и столбцы (ETLLoadID), никак не связанные с компанией Contoso. Кроме того, данные из таблицы Geography все еще не интегрированы. Далее: просмотр и расширение модели с помощью Power PivotВ следующей серии задач вы расширите модель с помощью надстройки Microsoft Office Power Pivot в Microsoft Excel 2013. Вы узнаете, что проще всего создавать связи с помощью представления диаграммы, предусмотренного в этой надстройке. Кроме того, вам предстоит использовать эту надстройку для создания вычислений и иерархий, скрытия элементов, которые не должны отображаться в списке полей, и оптимизации данных для дополнительных отчетов. ПРИМЕЧАНИЕ. Надстройка Power Pivot в Microsoft Excel 2013 доступна в Office профессиональный плюс. Добавьте Power Pivot на ленту Excel, включив надстройку Power Pivot.
На ленте появится вкладка Power Pivot. Добавление связи с помощью представления диаграммы в Power Pivot
В этой задаче вы узнали новый способ добавления таблицы и создания связей. Теперь у вас полностью интегрированная модель, в которой все таблицы соединены и доступны для сводной таблицы на листе Лист1. СОВЕТ. В представлении схемы некоторые схемы таблиц полностью расширены и отображают столбцы ETLLoadID, LoadDate и UpdateDate. Эти конкретные поля являются частью исходного хранилища данных Contoso и добавлены для поддержки операций извлечения и загрузки данных. В вашей модели они не нужны. Чтобы избавиться от них, выделите и щелкните поля правой кнопкой мыши, а затем нажмитеУдалить . Создание вычисляемого столбцаВ надстройке Power Pivot вы можете использовать формулы DAX, чтобы добавить вычисления. В этой задаче вы вычислите итоговую прибыль и добавите вычисляемый столбец, который ссылается на значения данных из других таблиц. Позже вы узнаете, как использовать ссылочные столбцы для упрощения модели.
= [SalesAmount] - [TotalCost] - [ReturnAmount]
Все строки вычисляемого столбца будут заполнены значениями. При прокрутке таблицы вниз будет видно, что строки могут содержать различные значения для данного столбца, на основе данных, которые содержатся в каждой строке.
= RELATED(ProductCategories[ProductCategoryName]) Функция RELATED возвращает значение из связанной таблицы. В нашем случае таблица ProductCategories содержит названия категорий продуктов, которые потребуется добавить в таблицу DimProduct, когда вы построите иерархию, которая включает сведения о категориях.
Все строки вычисляемого столбца будут заполнены значениями. При прокрутке таблицы вниз будет видно, что в каждой строке содержится имя категории продукта.
= RELATED(DimProductSubcategory[ProductSubcategoryName])
Создание иерархииБольшинство моделей содержат данные, являющиеся по своей природе иерархическими. Распространенные примеры: данные календаря, географические данные и категории продуктов. Создание иерархий полезно тем, что позволяет перетаскивать элемент (иерархию) в отчет, а не собирать и упорядочивать одни и те же поля каждый раз заново.
Теперь, когда вы знаете несколько способов создания иерархии, воспользуемся ими в сводной таблице.
Теперь при просмотре данных легко заметны преимущества иерархий. Вы можете независимо разворачивать и закрывать различные области сводной таблицы, что обеспечивает более полный контроль над использованием доступного места. Кроме того, добавление единой иерархии для областей "Строки" и "Столбцы" обеспечивает возможность мгновенной детализации без необходимости нагромождать несколько полей для получения аналогичного эффекта. Скрытие столбцовПосле создания иерархии Product Categories и ее размещения в DimProductDimProductCategory или DimProductSubcategory в списке полей сводной таблицы больше не нужны. В этой задаче вы узнаете, как скрыть лишние таблицы и столбцы, которые занимают место в списке полей сводной таблицы. Скрытие таблиц и столбцов позволяет оптимизировать работу с отчетами, не затрагивая модель, которая предоставляет связи и вычисления данных.
Можно скрыть как отдельные столбцы, так и их диапазон, а также всю таблицу. Имена столбцов и таблиц становятся неактивными, что отражает их скрытое состояние для клиентских средств подготовки отчетов, использующих модель. Скрытые столбцы отображаются в модели серым, но остаются видимыми в представлении данных, чтобы с ними можно было работать.
Перейдите обратно в Excel в список полей сводной таблицы на Листе1, чтобы увидеть различия. Количество таблиц сократится, и в DimProduct будут только те элементы, которые, скорее всего, пригодятся при анализе продаж. Создание отчета Power ViewОтчеты сводной таблицы - это не единственный тип отчетов, с которым удобно работать с помощью модели данных. Пользуясь только что построенной моделью, можно добавить лист Power View, чтобы испробовать некоторые из макетов, предоставляемых этим средством.
ПРИМЕЧАНИЕ. Если вы впервые используете Power View на этом компьютере, сначала отобразится запрос на включение надстройки и установку Silverlight.
Оптимизация для отчетов Power ViewЕсли вы внесете в свою модель несколько небольших изменений, отчет Power View получится более понятным. Выполняя эту задачу, вы добавите URL-адреса веб-сайтов нескольких производителей, а затем отнесете эти данные к категории "URL-адрес веб-сайта", чтобы они отображались в виде ссылок. Сперва добавьте в книгу URL-адреса.
Чтобы сравнить предыдущий вариант с результатом, создайте новый отчет Power View и добавьте туда поля SalesAmount из таблицы FactSales, Manufacturer из таблицы dimProduct и ManufacturerURL из таблицы URL. Обратите внимание, что URL-адреса отображаются как обычный текст. Чтобы URL-адреса отображались как активные гиперссылки, нужно отнести их к соответствующей категории. Используйте для этого Power Pivot.
К другим мерам по оптимизации Power View относятся определение набора полей по умолчанию для каждой таблицы и свойств параметров, определяющих способ обработки повторяющихся данных: статистическая или независимая обработка. Создание вычисляемых полейВ ходе второй задачи ("Просмотр данных в сводной таблице") вы выбрали поле SalesAmount из списка полей сводной таблицы. Поскольку SalesAmount является числовым столбцом, он был автоматически добавлен в область "Значения" сводной таблицы. На том этапе по столбцу SalesAmount можно было рассчитать суммы продаж, применяя любые фильтры. В этом случае фильтры сначала не применялись, но затем использовались CalendarYear, ProductSubcategoryName и BrandName. На самом деле на том этапе вы создали неявное вычисляемое поле, упростив анализ сумм продаж из таблицы FactSales относительно других полей, содержащих категории продуктов, регионы и даты. Неявные вычисляемые поля создаются в Excel, когда вы перетаскиваете поле в область "Значения" или когда выбираете числовое поле, как в случае с полем SalesAmount. Неявные вычисляемые поля - это формулы, которые используют такие стандартные статистические функции, как СУММ, СЧЁТ и СРЗНАЧ, и создаются для вас автоматически. Существуют и другие типы вычисляемых полей. В Power Pivot вы можете создавать явные вычисляемые поля. В отличие от неявных вычисляемых полей, которые можно использовать только в той сводной таблице, где они были созданы, явные вычисляемые поля можно использовать в любой сводной таблице в книге, а также в любом отчете, который использует в качестве источника данных модель данных. С помощью явных вычисляемых полей, созданных в Power Pivot, вы можете использовать автосуммирование, чтобы автоматически получать вычисляемые поля со стандартными агрегатными функциями или создавать собственные вычисляемые поля при помощи формул с выражениями анализа данных (DAX). Теперь вы понимаете, что, создавая вычисляемые поля, вы сможете анализировать данные бесчисленным количеством действенных способов. Давайте узнаем, как создавать эти поля. Создавать вычисляемые поля в Power Pivot легко, если воспользоваться функцией Автосумма.
Готово! Как видите, с помощью стандартных агрегатных функций мы всего за несколько минут создали в Power Pivot вычисляемое поле Sum of Profit и добавили его в сводную таблицу. Теперь можно быстро анализировать прибыль, применяя различные фильтры. В этом случае вы видите столбец Sum of Profit, значения которого отфильтрованы согласно иерархиям Product Category и Dates. Но что делать, если вам необходимо провести более углубленный анализ, например подсчитать продажи по определенному каналу, продукту или категории? Для этого вам нужно создать другое вычисляемое поле, которое вычисляет количество строк, по одной для каждой продажи из таблицы FactSales, в зависимости от используемых фильтров.
Обратите внимание, что в сводную таблицу был добавлен новый столбец Count, который отображает количество продаж в зависимости от применяемых фильтров. Как и в случае с вычисляемым столбцом Sum of Profit, вычисляемое поле Count отфильтровано согласно иерархиям Product Category и Dates. Давайте потренируемся еще. На этот раз вы создадите вычисляемое поле, которое вычисляет процент от суммы продаж в соответствии с конкретным контекстом или фильтром. Однако в отличие от предыдущих вычисляемых полей, которые вы создавали с помощью функции "Автосумма", на этот раз необходимо будет ввести формулу вручную.
Это новое вычисляемое поле вычисляет процент от суммы продаж для заданного контекста фильтра. В нашем случае фильтрами по-прежнему выступают иерархии Product Category и Dates. Среди прочего вы можете увидеть, что процент компьютеров от суммы продаж продуктов со временем увеличился. Для вас не составит труда создавать формулы для вычисляемых столбцов и полей, если вы знакомы с процедурой создания формул Excel. Но, независимо от того, знакомы вы с формулами Excel или нет, у вас есть отличная возможность изучить основные формулы DAX, пройдя уроки из электронной книги Краткое руководство: основы DAX за 30 минут. Сохранение работыСохраните книгу, чтобы можно было использовать ее с другими учебниками или для дальнейшего изучения. Следующие шагиХотя можно легко импортировать данные из Excel, часто быстрее и эффективнее оказывается импорт с помощью надстройки Power Pivot. Вы можете отфильтровать импортируемые данные, исключив ненужные столбцы. Вы также можете решить, будет ли выполняться извлечение данных с помощью построителя запросов или команды запроса. В качестве следующего шага изучите следующие альтернативные способы:Получение данных из веб-канала данных в Power Pivot и Импорт данных из служб Analysis Services или Power Pivot. Отчеты Power View предназначены для работы с моделями данных, аналогичными только что построенной вами. Дополнительные материалы о расширенном представлении, которое Power View обеспечивает в Excel:Включение Power View в приложении Excel 2013 и Power View: исследование, визуализация и представление данных. Попробуйте усовершенствовать свою модель данных, чтобы в дальнейшем создавать более наглядные отчеты Power View, изучив следующий Учебник. Оптимизация модели данных для отчетов Power View. Ссылки по теме
|
|