Quantcast
Channel: SQL.ru: OLAP и DWH
Viewing all 1167 articles
Browse latest View live

AdventureWorks

$
0
0
коллеги, забанили в гугле, кто подскажет ссылку на бэкап куба велозавода?
везде лежат толькко скрипты, но мне надо просто кубик развернуть, без базы данных

Oracle BI: В фильтре приглашения отображаются не все данные, что есть на самом деле.

$
0
0
Добрый день!
Приглашение, где отображается список выбора год-месяц.
При открытии списка выбора стали отображаться не все месяца, при этом если выбрать "Дополнительно/поиск" - там можно найти не достающие месяца, к примеру Май.

Что я пробовал сделать:
1) Поменял "значение в списке выбора" со значения "Значения во всех столбцах" на значение "Результат запроса sql" - выдало запрос
"
SELECT "Время"."Месяц" FROM "Форма 4" FETCH FIRST 65001 ROWS ONLY
" - в выпадающем списке появились все месяца, но не отсортированные.
2) В выданном запросе добавил group by:
"
SELECT "Время"."Месяц" FROM "Форма 4" FETCH FIRST 65001 ROWS ONLY
group by "Время"."Месяц
" - данные отсортировались, но снова пропали некоторые месяца...

Что можно ещё попробовать?

Oracle Data Visualisation Desktop. Форматирование чисел и дат в потоках данных

$
0
0
Здравствуйте, коллеги!

Использую Oracle Data Visualisation Desktop 12с.

Есть ли возможность выполнить нужное мне форматирование чисел и дат в потоках данных?

В наборах данных с этим проблем нет - всё хорошо форматируется,
а вот при работе с потоками данных я не нашел, как это можно сделать.

Помогите, пожалуйста, разобраться.

Data Impact, Lineage, Mappings, DataFlow

$
0
0
Добрый день Всем!

Поделитесь, пожалуйста, в каких системах ведете мэппинги данных для DWH & BI ?

Excel - и практически всё вручную
SAP PowerDesigner Data Movement Model
Informatica

более экзотические для РФ не перечисляю в списке.



Интересует полная картина:
DataSources, причем несколько источников могут сводиться в 1 Target в DWH --> Stage --> DWH(ODS) --> DWH(Analyst) --> OLAP/Reporting

отслеживаемость потоков данных, преобразований данных, включая динамический SQL, SQL-процедуры, .Net/Java сборки

каталоги данных,
ответственные,
технические учетки,
матрицы (правила) разграничения доступа,
профили данных (статистика)

SSAS 2012 + ORACLE

$
0
0
Коллеги,
может кто сталкивался, почему в DSV оракловые вьюхи c полями типа NUMBER любой размерности автоматически определяются с типом double, если заменить представление на именованный запрос с SELECT to_number(MyField) - тогда определяется как INT64, в реале данные там от 1 до 5, что соответствует Byte или TinyInt. Кто-нибудь может сказать как с этим жить, на сколько критично, имеет ли смысл переписывать в коде DSV все на соответствующие типы. Я этим занимаюсь, но во-первых- не понятно возымеет ли эффект, во вторых - неудобно и долго выискивать соответствующие тэги и менять в них тип с double на long/int/short/unsignedByte.
Заранее благодарю за ответы.

P.S.
Провайдер используется для подключения не майкрософтовский, а оракловый oraoledb.oracle.1

SSAS 2012 переключение с MOLAP на ROLAP

$
0
0
Коллеги,
ради эксперимента переключил одну секцию в из режима хранения MOLAP в ROLAP, сразу потерял значения для пустых элементов.

Полез в инет смотреть причину и наткнулся на это:

"При использовании режима ROLAP службы Службы Analysis Services могут вернуть неправильные данные, связанные с неизвестным элементом, если соединение комбинируется предложением GROUP BY. Службы Службы Analysis Services исключают ошибки реляционной целостности вместо того, чтобы возвращать неизвестные значения элементов."

Есть ли способ обойти данную особенность?

Спасибо.

P.S. В источнике партиции запрос без GROUP BY

Source->ETL->DWH->Stage->DWH(ODS)->DWH(Analyst)->OLAP/Reporting->PBI->Excel.. кто длиннее?

$
0
0
Коллеги, день добрый.

Александр расписал в соседней ветке указанную цепочку, и она нередко встречается.
Пожалуйста, объясните мне сакральную сущность данных преобразований.

Что мешает ее сократить? Например:
Call-center
CRM \ (розница)
CRM \\ (корпораты)
ABS -> ETL -> DWH -> ADWH -> визуализатор?
CRM // (брокеры)
Back /
...

Просто чем больше систем, тем:
* Сложнее понять откуда берутся данные - отсюда интерес к Data Governance
* Усложняется получение отчетности
* Удлиняется цикл получения отчетности
* Растут требования к аппаратному обеспечению
* Повышается сложность сопровождения
* Увеличивается кол-во сотрудников в отделах разработки и сопровождения систем отчетности
* Сильно возрастает % возникновения ошибки:

Если допустить, что % внесения ошибки - порядка 2% на каждом этапе, то в итоге получим
->ETL->DWH->Stage->DWH(ODS)->DWH(Analyst)->OLAP/Reporting
0,98 х 0,98 х 0,98 х 0,98 х 0,98 х 0,98 = 0,868.. то есть 13% - кстати, это один из аргументов 6 сигм.

Ладно, согласен с DWH - хранить исторические данные из разных систем, обеспечивать взаимодействие нескольких информационных систем, ок. А дальше-то зачем?

Что мешает использовать связку DWH - Vertica - Tableau (как Авито сделали) или еще проще Source -> Teradata -> Tableau?
Ну или сразу в тот же Qlik запихать - а так и приходится делать, когда перед руководством встает вопрос о быстром получении достоверной отчетности?

И не говорите про "большие объемы данных" - в Магните / Х5 / ГПН / Сбербанке / Росгострахе / Ростелекоме и т.д. их не меньше.

Нет, конечно, если хочется быть начальником 40 человек, и чтоб сервачков было побольше утилизировано, или чтоб считать себя важным незаменимы человеком, чтоб на поклон ходили и по 2 месяца отчет ждали - то ок, это понятно, дай Бог каждому Пока бизнес платит, чего бы и нет - я бы и больше систем насовал, тот же Data Governance, или DL стал рисовать какой-нибудь, было бы финансирование.

Но в целом, объясните кто-нибудь, зачем такая цепочка и что получается результате каждого преобразования?
Source->ETL->DWH : ?
DWH->Stage : ?
Stage->DWH(ODS) : ?
DWH(ODS)->DWH(Analyst) : ?
DWH(Analyst)->OLAP/Reporting : чистые подготовленные данные для получения отчетности.

Не троллинг - задачи и подходы разные бывают, так что буду признателен.

С Уважением,
Георгий

Лечение ошибки подключения к Analysis Services из Excel

$
0
0
Если в Excel Вы получаете сообщение (см. скриншот), то
для начала надо убедиться возможности подключиться к Analasys Services через SQL Server Management Studio, т.е. наличие прав доступа к OLAP-кубу.

Проблема может быть локальная, сбой в работе Excel на персональной машине.
Лечится перерегистрацией Analysis Services MOLAP DLL

Broccoli - MDM с открытым исходным кодом.

$
0
0
Приветствую, коллеги.
Недавно я начал самостоятельно разрабатывать MDM, проект называется Broccoli MDM, на данным момент система позволяет управлять ручными справочниками, имеет REST API и имеет примитивным контроль доступа.
Бэкенд на Python и фронт JavaScript.

В планах:
0. Закончить сайт, он пока в разработке.
1. Реализация процессов согласования новых записей и изменений таблиц.
2. Историзация и реализация SCD непосредственно в MDM
3. Backup-менеджмент
4. Реализция бизнес процессов например дедубликация и т.д.

Делаю систему максимально простой. без хитромудрого кода, реактивного фронта и функциональщины, по этому в ней разберется любой, буду рад если вы попробуете систему и захотите присоединиться к проекту.
Было бы очень хорошо найти проект для которого данная система подойдет.

Проект хостится на github и даже есть демоверсия без необходимости установки, все написано в README.
https://github.com/TimBogevich/Broccoli-MDM

SSAS 2016 (13.0.5026.0) нехватка памяти при процессинге

$
0
0
Добрый день, подскажите пожалуйста куда посмотреть.
Частенько по утрам куб (достаточно большой) не может обновиться, пишет:
"Операция отменена, поскольку нехватает доступной памяти для приложения. Если используется 32-разрядная версия продута, рекомендуется перейти к 64-разрядной версии или увелисить объем доступной памяти на компьютере."

Если позже запустить вручную джобу с этим же SSIS пакетом, то куб нормально обрабатывается.

Подключение Oracle BI 11 к Microsoft Active Directory

$
0
0
Добрый день, коллеги!
Подскажите пожалуйста, кто-нибудь подключал Oracle BI11 (точнее Oracle Business Intelligence 11.1.1.7.181016) к Microsoft Active Directory?

Подскажите, с чего начать? Может какие то полезные статейки посоветуете по этому поводу?

Заранее, очень признателен

OBIEE 12c. Перенастройка бизнес-модели на другой физический источник.

$
0
0
Суть проблемы.
При первом импорте таблиц из одной схемы БД на физический уровень была создана БД с пулом соединений и схемой (Схема1) внутри себя. На этих таблицах была построена успешно работающая модель.
При следующем импорте объектов из другой схемы они(объекты) вместе со схемой были добавлены в эту же БД на перезентационном уровне. Затем были настроены бизнес и презентационный уровень для новой модели. В Answers запросы ко второй выполнялись с ошибками, т.к. Connection Pool настроен на соединение с другой схемой.
Возможно как-то создать другую БД на презентационном уровне и перенести физические объекты, чтобы не поломать бизнес модель?
При Cut-е связи теряются. Маппинг отдельных(всех по отдельности) полей тоже не очень интересен.

Суррогатные ключи в MS SQL Server

$
0
0
Добрый день.

В нашем текущем проекте первичные ключи генерируется как суррогатные, средствами MS SQL Server.

При переходе из системы разработки в систему тестирования выяснилось, что ключи сгенерировались в разных системах разные, хотя источник данных использовался оин и тот же. А уже куча фильтраций наделано на основе этих ключей, то есть есть проблемы. Разработчики ETL утверждают, что нельзя никак обеспечить идентичность ключей в разных системах.

Так ли это?

DataStage и Global temporary tables

$
0
0
Вопрос - можно ли как-то заставить DS в ODBC конекторе(и в нативных тоже) использовать для основного запроса и для before/after одну сессию? По умолчанию он создает разные и убивает их сразу после использования.
Если в before секции создать временную таблицу то в основной он ее уже не видит, потому что сессия в которой ее создали уже прикрыта.
А запихнуть в основную секцию несколько SQL выражений нельзя.

С тем что параметры #...# в секции before не работают я уже смирился.

Струкртура мер в DWH

$
0
0
Есть факты приходящие с суммой за произвольный период. Анализ пока не понятно но видимо будет впоследствии по дням.
Т.е. я так понимаю я должен разделить суммы фактов пропоруионально по дням и столько строк сколько дней записать в таблицу фактов? Или есть простые методы анализа периодов в хранилище? Скорее всего визуализация будет какая-то очень простая без средств дополнительной обработки

PowerBI Server. Два одинаковых селекта при обновлении.

$
0
0
Добрый день. Построил отчет путем импорта MDX.
После публикации на сервере обновляю источник данных, наблюдаю в SQL Server Profiler что на сервер отправляются последовательно 2 одинаковых запроса. Кто знает зачем и можно ли сделать чтобы летел только один запрос?

Standalone SSRS в IIS зарегистрировать - возможно?

$
0
0
Привет!

появилась задача автоматический редирект HTTP-to-HTTPS для SSRS сконфигурировать.
В IISе без проблем, но ...
Но выяснилось, что SSRS приложение IIS-у не знакомо, т.к. он как самостоятельный процесс (ReportingServiceServices.EXE) бегает.
Т.е. при инсталяции был выбран вариант Standalone.

Как быть?

Динамическое измерение (?) в кубе MS AS

$
0
0
Всем привет!

Не знаю, понятно ли я задаю вопрос, но я попробую)

Есть таблицы:

+
1. Есть таблица товаров:
IDНаименование
1Товар 1
2Товар 2
3Товар 3
4Товар 4
5Товар 5
6Товар 6


2. Есть таблица продаж:
IDID_ТовараКоличество
1110
2220
3430
4340
5650


3. Также есть таблица свойств товаров:
IDНаименование
1Длина
2Ширина
3Высота


4. Есть таблица значений свойств товара:
IDID_ТовараID_СвойстваЗначение
111100
21220
32310
441120
54280
661200



Собственно вопросы:

1. Как сделать так, чтобы наименования свойств из таблицы 3 стали атрибутами измерения "Товар", не добавляя в таблицу товаров колонку для каждого свойства? То есть я хочу чтобы Продажи можно было смотреть в разрезе значений свойств Длина, Ширина, Высота.
2. Можно ли так сделать, и будут ли новые добавляемые в таблицу свойств свойства появляться при этом в атрибутах измерения "Товар"?

Power BI - лицензирование

$
0
0
Доброго времени!

Дано: Power BI Server, несколько дашбордов нем опубликованные от пользователя с лицензией Pro
Вопрос к знатокам: могут ли пользователи с бесплатной лицензией ими пользоваться (при условии предоставления всех доступов) ?
Или же для каждого пользователя требует такая же Pro-лицензия ?
Данные от вендора - что будет работать, но есть сомнения.

Спасибо!

При установке сообщение - "роль содержит не существующую учетную запись домена"

$
0
0
Как одним ударом очистить все роли доступа в проекте куба от несуществующих учетных записей домена? А то достало уже - пытаюсь развернуть куб, а мне в ответ "Роль такая-то содержит несуществующую учетную запись домена" и вылетает с ошибкой.

Вопрос два - как в развернутом кубе очистить все роли доступа от несуществующих учетных записей домена, чтобы потом в TFS синхронизировать куб и проект?
Viewing all 1167 articles
Browse latest View live