за съхранение на данни (за съхранение на данни) - база данни RDBMS - dpgrup компанията
за съхранение на данни (Data Warehouse) - голям обектно-ориентиран корпоративната информационна база данни, специално проектирани и предназначени за изготвянето на доклади, анализ на бизнес процеси за подпомагане на организацията на вземане на решения. Построен на базата на клиент-сървър архитектура. релационна система за управление на бази данни и инструменти за подпомагане вземането на решения. Данни, предоставени в хранилището на данни са само за четене. Данните от OLTP-промишлена система се копират в хранилището на данни, така че изграждането на доклади и OLAP анализ не използва ресурсите на промишлената система и не нарушава неговата стабилност. Данните се зарежда в хранилището с определена честота, така че релевантността на данни малко зад OLTP-система.
Принципи на организация на съхранение
Проектиране на Data Warehouse
Има два архитектурни области - нормализирани и размерите за съхранение на данни хранилището.
Нормализирана съхранение, данни пребивава в обектно-ориентирани трети нормални табличен вид - витрини данни. Стандартизирани съхранение са описани толкова лесно да създавате и управлявате, недостатъците на стандартизирано съхранение - висок излишък на информация, с интегрирането на тези въпроси от няколко маси едновременно.
Dimension хранилище с помощта на "звезда" или "снежинка". В центъра на звездата са данни (Всъщност таблицата) и измерение на лъчите имиджа на звездата. Различни факти маси споделят размери маси, което значително улеснява работата на данните, които съчетават няколко предмет факти маси (пример - факти за продажба и доставка на стоки). маси от данни и съответните размери за формиране на архитектурата на "BUS". Размери често се създават в трета нормална форма (бавно променящи се размери), за да влезете на промените в размерите. Основното предимство на размерите съхранение е простота и яснота за разработчици и потребители, както и поради по-ефективно съхранение на данни и формализирани размери, по-лесно и по-бързо достъп до данни, особено за сложни анализи. Основният недостатък е по-сложна процедура за получаване и зареждане на данни, както и за контрол и промяна на размерите на данни.
процеси за обработка на данни
Източниците на данни включват:
- Традиционните операции системата за регистрация (DB)
- отделни документи
- набори от данни
Източници на данни се класифицират:
- Териториално и административно споразумение.
- Степента на надеждност.
- Честота на renewability.
- съхранение и управление на данни.
операции с информация:
- Екстракт - преместване на информация от източници на данни в единна база данни, с доставянето им до общ формат.
- Преобразуване - Подгответе информация за съхранение по оптимален начин за изпълнение на заявката е необходимо за вземане на решения.
- Изтегляне - въвеждане на данни в хранилището се извършва с атомна, чрез добавяне на нови факти или адаптиране на съществуващите такива.
- Анализ - OLAP, Data Mining, отчитане и т.н.
- Представяне на резултатите от анализа.
Цялата тази информация се използва в речника метаданните. Речникът на метаданни автоматично включени източници на данни речници. Тук формати за данни за последващото им координация, честотата на попълване на данните времето.
лексика метаданни задача е да освободи разработчикът от необходимостта за стандартизиране на източници на данни.
складиране на данни, не трябва да противоречат на съществуващите системи за събиране и обработка на информация.
Специални компоненти речници следва да гарантират навременното добива на речниците и да се осигури преминаване към общ формат на базата на речника метаданни.
Логически хранилище за данни се различава от структурата на данните на структурата на данните на източниците на данни.
С цел да се разработи ефективна процес на трансформация изисква добре проектиран модел корпоративни данни и модела на технологията на вземане на решения.
Данните за потребителя удобно представени в многомерна база данни, където размерите могат да служат време, цена или географско местоположение.
Освен изтеглите данни от базата данни, процесът на вземане на решения е важно извличане на знания, в съответствие с информацията на нуждите на потребителите.
От гледна точка на потребителя на в процеса на извличане на знания от данни трябва да бъде адресирано песен. конверсия: Data -> Информация -> знания -> получените разтвори.