4. Содержание отчета
Отчет по лабораторной работе представляется в виде документа Word. В состав документа входят:
- Название работы
- Цель работы
- Копии экрана, иллюстрирующие выполнение задания лабораторной работы
- Выводы по работе
5. Контрольные вопросы
- Для чего предназначен мастер импорта программы Deductor Studio?
- Для чего предназначен мастер обработки программы Deductor Studio?
- Для чего предназначен мастер отображений программы Deductor Studio?
- Для чего следует проводить подготовку данных для анализа?
- Что такое шумы и аномалии в данных?
- Какими методами можно убрать шумы в системе Deductor?
- Какими методами можно убрать аномалии данных в системе Deductor?
- Для чего используется парциальная предобработка?
- Для чего используется спектральная обработка?
- Какие виды спектральной обработки имеются в системе Deductor?
6. Список рекомендуемой литературы
- Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. – Спб.: БХВ-Петербург, 2004. – 336 с.: ил
- Загоруйко Н.Г. Прикладные методы анализа данных и знаний. – Новосибирск: Изд-во Ин-та математики, 1999. – 270 с.
- Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере / Под ред. В. Э. Фигурнова – М.: ИНФРА-М, 1998. – 528 с., ил.
2. Теоретические сведения
Факторный анализ. Факторный анализ – группа методов многомерного статистического анализа, которые позволяют представить в компактной форме обобщенную информацию о структуре связей между наблюдаемыми признаками изучаемого объекта на основе выделения некоторых непосредственно не наблюдаемых факторов.Факторный анализ служит для понижения размерности пространства входных факторов. Обработку можно выполнять как в автоматическом режиме (с указанием порога значимости), так и самостоятельно (основываясь на значениях матрицы значимости). Первым этапом факторного анализа является выбор новых признаков, которые являются линейными комбинациями прежних и «вбирают» в себя большую часть общей изменчивости входных факторов. Поэтому они содержат большую часть информации, заключенной в первоначальных данных. В обработчике «Факторный анализ» это осуществляется с помощью метода главных компонент. Этот метод сводится к выбору новой ортогональной системы координат в пространстве наблюдений. В качестве первой главной компоненты избирают направление, вдоль которого массив данных имеет наибольший разброс. Выбор каждой последующей главной компоненты происходит так, чтобы разброс данных вдоль нее был максимальным и чтобы эта главная компонента была ортогональна другим главным компонентам, выбранным прежде. Корреляционный анализ. Корреляционный анализ- совокупность основанных на математической теории корреляции методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. Корреляционный анализ применяется для оценки зависимости выходных полей данных от входных факторов и устранения незначащих факторов. Принцип корреляционного анализа состоит в поиске таких значений, которые в наименьшей степени взаимосвязаны с выходным результатом. Такие факторы могут быть исключены из результирующего набора данных практически без потери полезной информации. Критерием принятия решения об исключении является порог значимости. Если степень взаимозависимости между входным и выходным факторами меньше порога значимости, то соответствующий фактор отбрасывается как незначащий.
Импорт данных из 1С с помощью мастера
Аналитическая платформа Deductor 5.3 позволяет импортировать в сценарий обработки данных из 1С все объекты, регистры, реквизиты. Обеспечивается импорт из любого прикладного решения, построенного на базе 1С:Предприятие.
В этом коротком деморолике наглядно показано, как в Deductor Studio 5.3:
- Настроить подключение к 1С.
- Импортировать данные из 1С, используя настроенное подключение.
Смотрите также:
-
Доступ к данным
- 1С:Предприятие 8.xДоступ к данным
- 1С:Предприятие 7.7Функционал
- Доступ к даннымБаза знаний
- Переменные: применение при импорте из 1С
Рассылка о платформе Loginom
Loginom Company (бывш. BaseGroup Labs) — профессиональный поставщик программных продуктов и решений в области бизнес-аналитики. Мы специализируемся на разработке систем для глубокого анализа данных, охватывающих вопросы сбора, интеграции, очистки данных, построения моделей и визуализации.
© 2023 Loginom Company
ООО «Аналитические технологии»
Пользовательское соглашение.
Создание сайта
- Кампус
Лабораторная работа 7 Аналитическая платформа Deductor: импорт и предобработка данных
Цель работы: познакомиться с системой Deductor Studio, получить навыки импорта данных, научиться осуществлять предобработку данных.
1. Импорт данных
Импорт данных является отправной точкой анализа данных. Импорт в Deductor может осуществляться из популярных форматов хранения данных, таких как Excel, Access, MS SQL, Oracle, Текстовый файл и прочих. Кроме того, имеется универсальный доступ к любому источнику данных посредством ADO или ODBC.
Рассмотрим пример импорта данных из текстового файла с разделителями, который будет необходим при апробировании технологий платформы Deductor на предлагаемых примерах.
Импорт осуществляется путем вызова мастера импорта на панели «Сценарии»
После запуска мастера импорта укажем тип импорта “Текстовый файл с разделителями” и перейдем к настройке импорта. Укажем имя файла, из которого необходимо получить данные (пример для парциальной обработки). В окне просмотра выбранного файла можно увидеть содержание данного файла.
Далее перейдем к настройке параметров импорта. На этой странице мастера предоставляется возможность указать, с какой строки следует начать импорт, указать, то, что первая строка является заголовком, возможность добавить первичный ключ. Указать, что является символом–разделителем столбцов, а также указать ограничитель строк, разделитель целой и дробной части вещественного числа, разделитель компонентов даты и ее формат.
В данном случае параметры по умолчанию на этой странице мастера установлены правильно, а именно: начать импорт с первой строки, первая строка является заголовком, разделителем между столбцами является знак табуляции, разделителем целой и дробной частей является запятая.
Далее перейдем к настройке свойств полей.
На этом шаге мастера предоставляется возможность настроить имя, название (метку), размер, тип данных, вид данных и назначение. Некоторые свойства (например, тип данных) можно задавать для выделенного набора столбцов. Вид данных определяет – конечный ли это набор (дискретные) или бесконечный (непрерывные). Назначение столбцов определяет характер их использования в алгоритмах обработки (при импорте можно оставить значение по умолчанию).
Для правильного импорта данных необходимо изменить тип данных у первых трех столбцов («АРГУМЕНТ», «СИНУС», «АНОМАЛИИ»). Тип данных по умолчанию неверный, поскольку программа определяет его, основываясь на значениях первой строки данных. В данном случае там находятся нули – целые числа. Поэтому программа определила, что столбец содержит целочисленные значения. Выделим их с помощью мыши и укажем им тип данных – «Вещественный». Далее осталось только выполнить импорт данных, нажав на кнопку «Пуск» на следующем шаге мастера импорта.
После импорта данных на следующем шаге мастера необходимо выбрать способ отображения данных. В данном случае самым информативным является диаграмма, выберем ее.
От того, какие способы отображения будут выбраны на этом этапе, зависят последующие шаги мастера. В данном случае необходимо настроить, какие столбцы диаграммы следует отображать и как именно.
Выберем для отображения поле «СИНУС» и тип диаграммы «Линии». На последнем шаге мастера необходимо указать название ветки в дереве сценариев. Напишем в поле заголовка окна «Импорт примера для демонстрации парциальной обработки» и нажмем «Готово». На этом работа мастера импорта заканчивается. Теперь в дереве сценариев появится новый узел с необходимыми данными. В главном окне программы представлены все выбранные отображения данных этого узла. В данном случае только диаграмма.
При подготовке материала использовались источники:
https://studfile.net/preview/3875492/page:4/
https://basegroup.ru/deductor/video/1s-data-import
https://studfile.net/preview/3356938/