|
|
|||||||||||||||||||||||||||||
|
Использование компонентов Data Mining в продуктах Office 2007. Часть 2Источник: spellabs Максим Гончаров
Автоматическое заполнениеЭтот инструмент автоматически заполняет пропущенные в некоторых столбцах таблицы данные на основании типичных значений для строк со схожими значениями других столбцов. Для реализации этой задачи используется алгоритм Data Mining, выявляющий шаблоны во всей совокупности заполненных данных и использующий эти шаблоны для заполнения пропущенных значений. В дополнение к задаче заполнения пропущенных значений, инструмент автоматического заполнения также формирует отчет, в котором описываются найденные в данных шаблоны и используемые при заполнении пропущенных значений правила. Отчет отображается в форме, похожей на отчет об анализе ключевых факторов. ПрогнозированиеИнструмент прогнозирования позволяет осуществлять прогноз будущих значений временного ряда на основании его исторических данных с учетом обнаруженных моделью прогноза факторов и тенденций. Например, вы можете прогнозировать будущие значения продаж на следующие два месяца на основании продаж за прошлые два года. Инструмент добавляет значения прогноза в виде строк к вашим данным, а также формирует график, как показано ниже. Рисунок 5 Прогнозирование временного ряда.Выявление аномалийЭтот инструмент анализирует и выявляет строки данных, не соответствующие стохастическим шаблонам, обнаруженным в остальных данных таблицы. Эти исключения могут быть вызваны ошибками при вводе данных или могут быть правильными необычными значениями, требующими дальнейшего анализа. Выявление аномалий может быть очень полезно, так как они сильно искажают средние значения, тренды в данных и другие характеристики описательной статистики. Если аномалии вызваны ошибками при воде данных, вероятно, вы захотите исправить эти ошибки перед выполнением дальнейшего статистического анализа. Инструмент выявления аномалий не только выделяет строки, не вписывающиеся в общие характеристики данных, но также выделяет значения в колонках, которые вероятно являются источником ошибки. Вы можете поменять значение в колонке, после чего вся строка подвергается повторной оценке для определения, является ли она все еще исключением. Дополнительно, для управлением числом строк, помеченных как аномальные, отчет о найденных аномалиях можно настраивать. Настройка производится заданием граничного значения вероятности входных данных. Ниже приведен пример отчета, формируемого инструментом выявления аномалий. Отчет комбинирует исходные данные и отчет об аномалиях: Рисунок 6 Выявление аномалий. Анализ сценариевЭтот инструмент предназначен для моделирования двух типов сценариев и получать отчет о воздействии как на единственную строку, так и на всю таблицу исходных данных. Подбор параметровПодбор параметров - анализ и отчет о факторах, которые необходимо поменять для достижения указанного значения целевого параметра. Например, если компания хочет вырасти с десяти миллионов до пятидесяти миллионов долларов, этом инструмент сможет помочь определить как достигнуть этой цели, основываясь на факторах, присутствующих в анализируемых данных. Ниже приведен пример отчета для одной строки данных: Рисунок 7 Подбор параметров.
Анализ "что-если"Анализ "что-если" - анализ и формирование отчета о влиянии на выходной результат неких гипотетических изменений. Например, вы хотите увидеть эффект изменения в объемах продаж вашим клиентам если цена продукта будет увеличена. Анализ с использованием сценария "что-если" поможет вам определить, например, что увеличение цены не даст вам требуемый результат, но увеличение гарантийного срока вполне способно этот результат обеспечить. Ниже приведен пример отчета для одной строки данных: Рисунок 8 Анализ "что-если".
СоединениеКнопка "соединение" предназначена для создания и настройки соединения с базами данных Analysis Services. СправкаКнопка "Справка" предоставляет доступ к документации, а также к мастеру Getting Started, а также к сопутствующим интернет-ресурсам. Ссылки по теме
|
|