за съхранение на данни (за съхранение на данни) - база данни RDBMS - dpgrup компанията

за съхранение на данни (Data Warehouse) - голям обектно-ориентиран корпоративната информационна база данни, специално проектирани и предназначени за изготвянето на доклади, анализ на бизнес процеси за подпомагане на организацията на вземане на решения. Построен на базата на клиент-сървър архитектура. релационна система за управление на бази данни и инструменти за подпомагане вземането на решения. Данни, предоставени в хранилището на данни са само за четене. Данните от OLTP-промишлена система се копират в хранилището на данни, така че изграждането на доклади и OLAP анализ не използва ресурсите на промишлената система и не нарушава неговата стабилност. Данните се зарежда в хранилището с определена честота, така че релевантността на данни малко зад OLTP-система.







Принципи на организация на съхранение

Проектиране на Data Warehouse

Има два архитектурни области - нормализирани и размерите за съхранение на данни хранилището.

Нормализирана съхранение, данни пребивава в обектно-ориентирани трети нормални табличен вид - витрини данни. Стандартизирани съхранение са описани толкова лесно да създавате и управлявате, недостатъците на стандартизирано съхранение - висок излишък на информация, с интегрирането на тези въпроси от няколко маси едновременно.

Dimension хранилище с помощта на "звезда" или "снежинка". В центъра на звездата са данни (Всъщност таблицата) и измерение на лъчите имиджа на звездата. Различни факти маси споделят размери маси, което значително улеснява работата на данните, които съчетават няколко предмет факти маси (пример - факти за продажба и доставка на стоки). маси от данни и съответните размери за формиране на архитектурата на "BUS". Размери често се създават в трета нормална форма (бавно променящи се размери), за да влезете на промените в размерите. Основното предимство на размерите съхранение е простота и яснота за разработчици и потребители, както и поради по-ефективно съхранение на данни и формализирани размери, по-лесно и по-бързо достъп до данни, особено за сложни анализи. Основният недостатък е по-сложна процедура за получаване и зареждане на данни, както и за контрол и промяна на размерите на данни.







процеси за обработка на данни

Източниците на данни включват:

  1. Традиционните операции системата за регистрация (DB)
  2. отделни документи
  3. набори от данни

Източници на данни се класифицират:

  1. Териториално и административно споразумение.
  2. Степента на надеждност.
  3. Честота на renewability.
  4. съхранение и управление на данни.

операции с информация:

  1. Екстракт - преместване на информация от източници на данни в единна база данни, с доставянето им до общ формат.
  2. Преобразуване - Подгответе информация за съхранение по оптимален начин за изпълнение на заявката е необходимо за вземане на решения.
  3. Изтегляне - въвеждане на данни в хранилището се извършва с атомна, чрез добавяне на нови факти или адаптиране на съществуващите такива.
  4. Анализ - OLAP, Data Mining, отчитане и т.н.
  5. Представяне на резултатите от анализа.

Цялата тази информация се използва в речника метаданните. Речникът на метаданни автоматично включени източници на данни речници. Тук формати за данни за последващото им координация, честотата на попълване на данните времето.

лексика метаданни задача е да освободи разработчикът от необходимостта за стандартизиране на източници на данни.

складиране на данни, не трябва да противоречат на съществуващите системи за събиране и обработка на информация.

Специални компоненти речници следва да гарантират навременното добива на речниците и да се осигури преминаване към общ формат на базата на речника метаданни.

Логически хранилище за данни се различава от структурата на данните на структурата на данните на източниците на данни.

С цел да се разработи ефективна процес на трансформация изисква добре проектиран модел корпоративни данни и модела на технологията на вземане на решения.

Данните за потребителя удобно представени в многомерна база данни, където размерите могат да служат време, цена или географско местоположение.

Освен изтеглите данни от базата данни, процесът на вземане на решения е важно извличане на знания, в съответствие с информацията на нуждите на потребителите.

От гледна точка на потребителя на в процеса на извличане на знания от данни трябва да бъде адресирано песен. конверсия: Data -> Информация -> знания -> получените разтвори.