Od 2003 roku zajmujemy się controllingiem, w tym Business Intelligence, od strony doradczej i informatycznej, bo dziś wsparcie technologiczne jest niezbędne w każdym obszarze organizacji. Przez te lata zauważyliśmy, że powstało wiele nowych rozwiązań, które są różnie nazywane i klasyfikowane. Dlatego w kolejnej pozycji naszego bloga zamieszczamy tekst Grzegorza Rawicza, który porządkuje dla Państwa obszar Business Intelligence.
Dynamiczny rozwój oraz coraz większa popularność rozwiązań analityki biznesowej nie tylko w wielkich organizacjach, ale także w MŚP doprowadziły do rozpowszechnienia się bogatej i niejednorodnej terminologii. W efekcie różnych pojęć używają finansiści, controllerzy, analitycy i specjaliści IT. Zakładamy, że wzajemnie się rozumiemy, ale czy tak rzeczywiście jest?
Spis treści
Geneza problemu
Przykłady spotykanych pojęć
BI a Big Data
Skąd takie zamieszanie wokół pojęcia Business Intelligence?
Zróżnicowanie pojęciowe wokół Business Intelligence wynika z kilku faktów:
- pojęcia tworzone i promowane są przez różne środowiska (dostawcy rozwiązań, ośrodki akademickie i naukowe, użytkownicy, analitycy rynku),
- funkcjonalność zmienia się bardzo szybko,
- na te same funkcjonalności spogląda inaczej biznes (menedżerowie różnych działów), a inaczej ,,informatyka” w firmie.
Dostawcy rozwiązań
Dostawcy rozwiązań – zwłaszcza ci globalni – starają się wyeksponować silne strony swoich rozwiązań. Jeden dostawca będzie więc podkreślał w stosowanej terminologii określenia nawiązujące do analityki, bo w tym widzi swoją przewagę. Inny może ciągnąć w stronę wizualizacji, a jeszcze inny w stronę raportowania. Czasem jest to jakiś charakterystyczny termin kojarzący się z danym produktem lub firmą. Gdy zadomowił się termin Business Intelligence, dwie globalne firmy SAS i Teradata lansowały rozszerzenie tej terminologii o określenia Customer Intelligence, Risk Intelligence i inne pokrewne.
Ośrodki naukowe
Ośrodki naukowe natomiast są zwykle mniej odporne na zmiany. Terminy opracowane przez jakiegoś profesora żyją przez lata, choć rzeczywistość się zmienia, a w tym obszarze szczególnie szybko. Pewne terminy pochodzą nawet nie od samych dostawców, ale od użytkowników. Zdarza się, że oni wyprzedzają tych pierwszych. Rolę porządkującą powinny zatem przejąć firmy analizujące rynek, ale one także muszą się wyróżnić, podkreślić swoją odrębność. Przez lata więc IDC lansowało raczej określenie Business Analytics, Gartner analizował platformy Business Intelligence, a Forrester platformy Enterprise Business Intelligence.
Przykłady spotykanych obecnie pojęć w Business Intelligence
- BI (Business Intelligence) – Termin pierwszy raz użyty w 1865 r. przez Richards M. Devensa w Cyclopaedia of Commercial and Business Anecdotes do opisania jak pewien bankier zyskał dzięki otrzymaniu i wykorzystaniu informacji o środowisku zewnętrznym wcześniej niż jego konkurenci. W 1958 r. Hans P. Luhn z IBM użyl terminu Business Intelligence do określenia zdolności wykorzystania posiadanych informacji i ich wzajemnych zależności w celu podjęcia działań skierowanych na realizację celu. Dzisiejszy termin BI zaproponowany został przez Howarda Dresnera (późniejszego analityka Gartner) w 1989 r., jako łączący metody i koncepcje usprawniające proces podejmowania decyzji poprzez wykorzystanie systemów wspierających opartych na faktach. Termin ten zaczął być popularny pod koniec lat 90.
- CPM – Corporate Performance Management – zarządzanie wydajnością firmy, to termin bardzo pojemny, obejmujący wszystkie technologie, narzędzia, praktyki, metodyki i miary służące do zbierania i zatwierdzania informacji. Może on zatem zawierać planowanie / budżetowanie, prognozowanie czy kluczowe wskaźniki efektywności (KPI) albo wizualnie przedstawione Zrównoważone Karty Wyników (BSC) poprzez kokpity menedżerskie. Czasem stosowana jest nazwa EPM – Enterprise Performance Management.
- Business Analytics – analityka biznesowa, termin promowany przez IDC, często stosowany zamiennie z Business Intelligence. Niektórzy jednak podkreślają, że analityka biznesowa w większym zakresie wykorzystuje metody statystyczne (także analitykę zaawansowaną) i nie ogranicza się do spójnego zestawu wskaźników służących do pomiaru wyników, ale stara się rozwijać analizy i poszukiwać coraz pełniejszego zrozumienia tych wyników. Podkreślają oni więc, że BI poprzez zapytania, raportowanie, przetwarzanie analityczne OLAP i alerty odpowiada na pytania: co się wydarzyło, jak często, ile, gdzie jest problem i jakie są potrzebne działania? Natomiast analityka biznesowa, sięgając głębiej i wykorzystując kolejne narzędzia i techniki, może odpowiedzieć na pytania, dlaczego tak się stało i co zrobić, jeśli tendencje się utrzymują. Przewiduje także, co następnie się wydarzy i co mogłoby wydarzyć się najlepszego (optymalizacja). Inaczej BI jest niezbędny do prowadzenia biznesu, a BA do wprowadzania w nim zmian.
- Advanced Analytics – analityka zaawansowana to analizowanie danych przy wykorzystaniu zaawansowanych technik i narzędzi, które nie występują w typowych rozwiązaniach BI. Dotyczy to m.in. zastosowania w biznesie takich technik, jak analityka predykcyjna, data / tehurxt mining, sieci neuronowe, analiza skupień czy zaawansowane analizy statystyczne.
- DW (Data Warehouse) – już w latach 70. Bill Inmon, uznawany za „ojca hurtowni danych”, wprowadził to pojęcie. Koncepcja hurtowni danych pochodzi z końca lat 80., gdy 2 naukowców IBM stworzyło „hurtownię danych biznesowych”. Celem było dostarczenie modelu architektury przepływu dużych ilości danych oraz rozwiązanie związanych z tym problemów: wysokich kosztów przetwarzania i braku możliwości wyciągania wniosków. Chodziło o ułatwienie i zoptymalizowanie procesu oraz uproszczenie działania na danych historycznych.
- Data Mart – zawężona, tematyczna hurtowania danych, np. do jakiejś części organizacji (np. HR) lub jakiejś funkcjonalności. Może to być, np. Data Mart budżetowy, czyli minihurtownia danych gromadząca jedynie dane wykorzystywane w procesie planowania / budżetowania. Taki Data Mart (minihurtowania) może być elementem hurtowni danych lub stanowić oddzielną jednostkę.
- Składnica danych – pojęcie to jest najczęściej stosowane jako polskojęzyczny odpowiednik Data Mart lub ODS (Operational Data Store), jako operacyjna składnica danych. Dziś pojęcie coraz rzadziej stosowane.
- DSS (Decision Support System) – systemy wspierające podejmowanie decyzji, których początki sięgają lat 60., a rozwijane były w połowie lat 80. Z założenia były to modele wspierane komputerowo do podejmowania decyzji i planowania. Dzisiejszy BI pochodzi bezpośrednio z DSS.
- MIS/EIS – Management/Executive Information System – określenia powszechnie używane w dużych przedsiębiorstwach, w których istniał dział zbierający i analizujący dane z różnych jednostek organizacji, a następnie dostarczający raporty dla zarządu. Terminy te odnoszą się zatem do BI zwłaszcza w okresie, gdy rozwiązania BI były drogie i skomplikowane, i jedynie wyspecjalizowana jednostka zajmowała się generowaniem raportów dla zarządu. W niektórych organizacjach były działy o nazwie MIS oraz odpowiednie stanowiska.
- BICC – Business Intelligence Competency Center – termin odnoszący się do zespołu osób, które związane są w danej organizacji z BI zarówno od strony technologicznej, jak i merytorycznej. Zespół ten odpowiedzialny jest za rozwój, strategię wykorzystania oraz priorytety BI, a także określa wymagania, np. w zakresie jakości danych czy dostępu do nich oraz promuje BI i jego wykorzystanie w organizacji.
- Big Data – termin przez niektórych stosowany jako współczesny, a więc bardziej nowoczesny BI. W rzeczywistości odnosi się on do przetwarzania i analizowania dużych, zmiennych i różnorodnych zbiorów danych. Takie analizy umożliwia jedynie współczesna zaawansowana technologia. Chodzi tutaj nie tylko o dane ustrukturyzowane, ale także nieustrukturyzowane, np. głos czy obraz. Nie chodzi więc o proste analizy i stosowanie tego terminu zamiennie z BI, choć często jest to błędne. Granica nie jest jednak wyraźna, bo jak duże muszą być dane billingowe w telekomunikacji, aby był to już Big Data, a nie BI? Firma analityczna META Group (przejęta przez Gartner) w 2001 r. w swoim raporcie zaproponowała model 3V – VOLUME (duża ilość danych), VELOCITY (duża zmienność danych) oraz VARIETY (duża różnorodność danych). Gartner dodał do tego jeszcze VALUE, rozszerzając model do 4V i podkreślając potrzebę weryfikacji przyjętych hipotez.
- Data Science – wraz z pojawieniem się Big Data i coraz bardziej zaawansowanych analiz pojawił się termin Data Science oraz Data Scientist określający zawód osoby zajmującej się analizą danych, zwłaszcza danych nieustrukturyzowanych czy Big Data. Termin ten został spopularyzowany przez Harvard Business Review w 2012 r. Właściwie chodzi o współczesnego analityka danych w świecie Big Data.
- Data Mining – termin określający techniki i metody służące eksploracji danych, wywodzące się zwłaszcza z badań nad sztuczną inteligencją. Niektóre to metody statystyczne, inne to sieci neuronowe, metody uczenia maszynowego, logika rozmyta czy zbiory przybliżone. Termin Data Mining bez wielkiego powodzenia starano się zastąpić polskimi terminami, takimi jak drążenie danych, wydobywanie danych czy ekstrakcja danych.
- ETL/ELT (od Extract – Transform – Load) – skrót ETL pochodzi od angielskich słów wydobycie (pozyskanie), przekształcenie i załadowanie, w odniesieniu do danych znajdujących się w systemach ewidencyjnych (ERP, bazy danych, CRM itd.), przygotowywanych do załadowania w hurtowni danych do dalszej analizy. Można spotkać wersje ETL oraz ELT w zależności od tego, czy przekształcenie danych odbywa się przed czy po ich załadowaniu. Czasem stosuje się także określenie ETLQ, gdzie Q oznacza jakość danych, a więc proces czyszczenia danych.
- OLAP (On-Line Analytical Processing) – pojęcie OLAP powstało przez modyfikację pojęcia OLTP (Online Transaction Processing). Systemy OLTP charakteryzują się dużą ilością prostych transakcji zapisu i odczytu, a nacisk położony jest na zachowanie integralności danych w środowisku wielodostępowym oraz efektywność, jako liczbę transakcji w jednostce czasu. Systemy transakcyjne – zwane także ewidencyjnymi – dostarczają danych do hurtowni danych. Systemy analityczne (OLAP) charakteryzują się stosunkowo nielicznymi, ale złożonymi transakcjami odczytu. Tutaj miarą efektywności jest czas odpowiedzi. Z pojęciem OLAP związane są kostki OLAP (OLAP cube), a więc struktura danych, pozwalająca na szybką analizę danych. Dane przechowywane w kostkach pokonują ograniczenia relacyjnych (transakcyjnych) baz danych, a same kostki są rozszerzeniem dwuwymiarowej płaskiej tabeli o inne zdefiniowane wymiary.
- Data Discovery – to jeden z najdynamiczniej rosnących segmentów BI (Tableau, Qlik, Sisense itd.). To narzędzia łatwe w obsłudze, które służą nie tyle do tworzenia raportów i kokpitów oraz udostępnianiu ich zgodnie z uprawnieniami, co „przyglądaniu się” danym bez z góry założonej tezy i poszukiwaniu w wizualizacjach interesujących odchyleń. Służą one dużym organizacjom do szybkich analiz, czasem danych znajdujących się bezpośrednio w systemach ewidencyjnych, a nie w hurtowni danych. Dla mniejszych organizacji, które jeszcze nie dojrzały do pełnych rozwiązań BI, służą one jako podstawowe narzędzie do analiz.
Może zainteresuje Cię:
Jakie są różnice pomiędzy systemami Business Intelligence a hurtownią danych?
Czym różni się Business Intelligence (BI) od Performance Management (PM)?
Business Intelligence a Big Data
Krytycy uważają, że Business Intelligence to po prostu rozszerzenie raportowania biznesowego, które rozwinęło się, gdy pojawiły się coraz łatwiejsze w użyciu narzędzia do analizowania danych. Gdy narzędzia umożliwiły analizowanie większych, bardziej złożonych zbiorów danych, a także danych nieustrukturyzowanych, pojawiło się kolejne określenie – Big Data. Uważają więc oni, że zarówno BI, jak i Big Data to jedynie marketingowe buzzword, a nie nowe koncepcje.
Czego można się więc spodziewać w zakresie rozwoju zagmatwania pojęciowego towarzyszącego rozwojowi narzędzi? Pewne pojęcia zapewne odejdą do historii i zostaną wyparte z wykorzystywanej terminologii. Można się spodziewać uproszczenia terminologii, bo sama technologia podlega takiemu uproszczeniu. Użytkownicy rozwiązań analityki biznesowej to coraz częściej menadżerowie różnych działów, którzy bardziej zainteresowani są wartością, jakie przynosi im narzędzie, a nie tym, jak nazywają się poszczególne funkcjonalności czy komponenty rozwiązania. Nie należy jednak wykluczać tego, że pojawi się nowa technologia, łatwiejsza, prostsza i usuwająca w cień to, co dziś wydaje się standardem.
Dr Grzegorz Rawicz-Mańkowski
Business Development Manager w firmie Controlling Systems. Od ponad 20 lat związany z rynkiem Business Intelligence. Wykładowca m.in. na Akademii Leona Koźmińskiego i Estonian Business School.