Od kilku lat głośno jest o wykorzystaniu technologii big data. Specjaliści od analityki przekonują nas, jak istotne są wnioski płynące z obróbki ogromnej ilości danych, jak wiele dzięki temu można poprawić w działaniu biznesu czy ogólnie społeczeństwa. Szczególnie w globalnych firmach informacje statystyczne i nie tylko mogą usprawnić funkcjonowanie, ale również dostarczyć cennej wiedzy o klientach i ich zachowaniach. Co więcej, umożliwiają również przewidywanie wyborów i preferencji, między innymi dzięki graficznemu przedstawieniu danych. Czy tak jest naprawdę? Czy może to kolejna wydmuszka, którą mamią nas specjaliści od marketingu. Sprawdźmy dla kogo jest big data.
Dla niewtajemniczonych: Technologia big data opiera się na analizie ogromnych baz danych, łączeniu w jeszcze większe zbiory i wyciąganiu na ich podstawie wniosków. Tak w wielkim skrócie. Oczywiście nie mówimy o bazie danych liczącej 2000 rekordów. To zdecydowanie za mało! W przypadku big data, analiza dotyczy najczęściej setek milionów wpisów – i to w jednej bazie danych. Tylko na takiej próbie jest sens korzystania z tej technologii. Jeśli zatem prowadzimy osiedlowy sklep, wdrożenie zastosowanie dla nas big data będzie miało mały sens biznesowy. Jednak wystarczy, że zasięg naszego działania rozszerza się na całe województwo, a danych z różnych źródeł mamy sporo, wtedy warto zaprząc big data do poznania relacji zachodzących między różnymi osobami czy wydarzeniami..
Co nam może dać? Tu wachlarz jest bardzo szeroki. Choćby prowadząc średniej wielkości sklep internetowy, możemy dowiedzieć się kiedy mamy najwięcej klientów i skąd do nas przychodzą i co o jakiej porze kupują. Dzięki temu możemy przewidzieć na jaką sprzedaż możemy liczyć w najbliższym czasie, jak lepiej zorganizować logistykę i wysyłkę – to najprostszy przykład zastosowania.
Dobre wdrożenie w nasz biznes Big Data, o ile oczywiście dysponujemy przekrojowymi danymi, przede wszystkim daje nam szansę na dostrzeżenie korelacji pomiędzy poszczególnymi wydarzeniami i możliwość poprawienia istniejących schematów lub wdrożenia nowych. Rzecz jasna dane te muszą pochodzić z legalnych źródeł, ale to temat na zupełnie inny artykuł.
Nie dowiemy się z big data zbyt wiele o pojedynczych osobach – nie do tego stworzono tę technologię, jednakże analiza dużych zbiorowości, choćby wszystkich naszych klientów, mówi nam dużo więcej – działamy przecież jako jednostki dość schematycznie. Szczególnie, gdy nasz biznes swoim zasięgiem wychodzi ponad lokalny rynek big data okazuje się przydatnym narzędziem – dużo lepszym niż tradycyjne badania statystyczne.
Właśnie, w czym technologia big data jest lepsza od standardowych badań statystycznych? Przede wszystkim skalą i szybkością obliczeń. Podczas, gdy próby statystyczne sięgają zaczynają się już od kilkudziesięciu osób, a w porywach osiągają kilka tysięcy, w big data zaczynamy od kilkudziesięciu tysięcy. W pierwszym modelu jesteśmy jednak w stanie przeprowadzić głębsze badanie potrzeb czy zachowań – w drugim analizujemy zdarzenia, zapisy wykonanych czynności: zakup konkretnego towaru, opuszczenie koszyka czy wpisywane słowa do paska wyszukiwania.
Bez big data ciężko byłoby badać te zależności, ponieważ ich liczba jest zbyt duża i zbyt często podlegają one fluktuacją. Odpowiednie ich zwizualizowanie, choćby w systemie Google Data Studio, o którym pisaliśmy tutaj, pomaga tak zestawić i przedstawić dane, by były jak najbardziej pomocne podczas budowania strategii firmy lub na poziomie operacyjnym.
– Firmy same nie wiedzą jaki skarb, w postaci danych drzemie na ich serwerach – przekonuje Tomasz Andrzejewski z Greenlogic, który prowadzi wdrożenia technologii big data w biznesie. – Nie potrzeba być ogromną korporacją, by stosować big data, choć pewien wolumen danych oczywiście jest potrzebny, by pomagało to w budowaniu przewagi nad konkurencją. – dodaje.
Skalowalność systemów big data umożliwia również rozszerzenie ich o nowy rodzaj danych, dodatkową bazę, czy też nowe węzły danych, analizowanych w czasie rzeczywistym. W razie potrzeby można zaprząc do działania skrypty językowe, mosty selekcjonujące dane i obliczenia w chmurze. Właśnie dzięki serverless computing, o którym pisaliśmy tutaj, technologia big data może jednocześnie porównywać miliardy zapisów w bazach danych, pochodzących z różnych zakątków świata.
Porównywanie danych to również dobra zabawa. Dowodzi tego choćby serwis tylervigen.com, w którym znajdziemy wykresy korelacji pomiędzy zgoła odmiennymi aspektami ludzkiej działalności, jak choćby konsumpcji sera i zgonów w wyniku zaplątania się w pościeli lub ilości spożycia margaryny i rozwodów w stanie Maine. Oczywiście pożytek z takiej analizy jest nikły, choć zabawa przednia.
Jeśli jednak chcemy wykorzystać big data do rozwijania swojego biznesu, czy choćby dużych badań społecznych, warto skonsultować wdrożenie ze specjalistami, by nie utonąć w morzu danych. Jak zaznacza Tomasz Andrzejewski: – Zastosowanie big data do analizy za każdym razem przebiega inaczej. Nie spotkaliśmy się w Greenlogic z dwiema identycznymi bazami i takimi samymi potrzebami dwóch różnych klientów, więc zanim uruchomimy skrypty analityczne na serwerach czy w AWS Lambda, warto głęboko zastanowić się jakie dane chcemy porównywać i do czego je potem wykorzystać.