
AWS Lambda – aby pobrać zamówienie
5 lipca 2019
JAVA 12: New Java and its new features.
12 lipca 2019
Od kilku lat wykorzystanie technologii big data jest na porządku dziennym. Analitycy przekonują nas o tym, jak ważne są wnioski z przetwarzania ogromnej ilości danych, jak wiele można poprawić w funkcjonowaniu biznesu czy ogólnie społeczeństwa. Zwłaszcza w globalnych firmach informacje statystyczne i inne typy big data mogą poprawić funkcjonowanie, ale także dostarczyć cennej wiedzy o klientach i ich zachowaniach. Co więcej, umożliwiają również przewidywanie wyborów i preferencji, wykorzystując jednocześnie graficzną reprezentację danych. Czy tak jest naprawdę? A może to tylko złoty róg, który chcą nam sprzedać specjaliści od marketingu. Sprawdźmy, dla kogo jest big data!
Słowo wstępu: Technologia Big Data opiera się na analizie ogromnych baz danych, łączeniu ich w jeszcze większe zbiory i wyciąganiu z nich wniosków. To tyle – w pigułce. Oczywiście nie mówimy o bazie danych z 2000 rekordami. Mamy na myśli coś większego, znacznie większego! W przypadku big data analiza dotyczy zazwyczaj setek milionów wpisów – w jednej tylko bazie danych. Tylko na takiej próbce istnieją powody do zastosowania tej technologii. Zatem jeśli prowadzimy mały sklep spożywczy, wdrożenie dla nas aplikacji big data będzie miało niewielką, jeśli w ogóle, wartość biznesową. Jeżeli jednak zakres naszych działań obejmuje całą prowincję, a zbieramy wiele danych z różnych źródeł, wtedy warto zastosować big data, aby poznać zależności i powiązania zachodzące między różnymi ludźmi czy zdarzeniami.
Dobre relacje z klientami
Co to może nam dać? Możliwości jest tak wiele. Jeśli prowadzisz średniej wielkości sklep internetowy, możesz dowiedzieć się, kiedy masz najwięcej klientów i skąd pochodzą oraz o której godzinie kupują. Pozwala to przewidzieć, na jaką sprzedaż możemy liczyć w najbliższej przyszłości, jak lepiej zorganizować logistykę i wysyłkę – to pierwszy przykład zastosowania.
Dobre wdrożenie Big Data w naszym biznesie, pod warunkiem oczywiście, że posiadamy dane przekrojowe, przede wszystkim daje nam możliwość dostrzeżenia korelacji między poszczególnymi zdarzeniami oraz szansę na udoskonalenie istniejących schematów lub wdrożenie nowych. Oczywiście dane te muszą pochodzić z legalnych źródeł, ale to temat na zupełnie inny artykuł.
Idziemy w masę
Z big data nie dowiemy się zbyt wiele o pojedynczych osobach – do tego ta technologia nie została stworzona, ale analiza dużych społeczności, nawet wszystkich naszych klientów naraz, mówi nam znacznie więcej – w końcu jako jednostki działamy dość schematycznie. Zwłaszcza gdy nasz biznes wykracza poza lokalny rynek – big data okazuje się być użytecznym narzędziem, znacznie lepszym niż tradycyjne badania statystyczne.
Dokładnie, w czym technologia big data jest lepsza od standardowych badań statystycznych? Przede wszystkim skala i szybkość obliczeń. Podczas gdy testy statystyczne zaczynają się od kilkudziesięciu osób i maksymalnie sięgają kilku tysięcy, w big data zaczynamy od dziesiątek tysięcy! W pierwszym modelu jesteśmy jednak w stanie przeprowadzić głębsze badanie potrzeb czy zachowań
– w drugim analizujemy zdarzenia, zapisy wykonanych działań: zakup konkretnego produktu, pozostawienie koszyka czy słowa wpisane w pasek wyszukiwania.
Skarb na serwerze
Bez big data trudno byłoby badać te zależności, ponieważ ich liczba jest zbyt duża i zbyt często podlegają one wahaniom. Odpowiednie ich wizualizowanie, na przykład w Google Data Studio, o którym pisaliśmy tutaj, pomaga kompilować i prezentować dane w taki sposób, aby były jak najbardziej pomocne przy budowaniu strategii firmy lub na poziomie operacyjnym.
– Firmy same nie wiedzą, jaki skarb w postaci danych kryje się na ich serwerach – przekonuje Tomasz Andrzejewski z Greenlogic, który prowadzi wdrożenia technologii big data w biznesie. – Nie trzeba być ogromną korporacją, żeby korzystać z big data, choć pewna ilość danych jest oczywiście niezbędna, żeby pomagała budować przewagę konkurencyjną – dodaje.
Skalowalność systemów big data pozwala również na rozszerzanie ich o nowy typ danych, dodatkową bazę danych lub nowe węzły danych, analizowane w czasie rzeczywistym. W razie potrzeby można używać skryptów językowych, mostów do selekcjonowania danych oraz chmury obliczeniowej. To dzięki obliczeniom bezserwerowym, o których pisaliśmy tutaj, technologia big data może jednocześnie porównywać miliardy rekordów w bazach danych z całego świata.
Wesoło i poważnie
Porównywanie danych to też zabawa. Świadczy o tym strona tylervigen.com, gdzie znajdziemy wykresy korelacji między zupełnie różnymi aspektami ludzkiej aktywności, takimi jak spożycie sera i zgony z powodu zaplątania się w pościel, czy spożycie margaryny i liczba rozwodów w stanie Maine, USA. Oczywiście zastosowanie takiej analizy jest niewielkie, ale to jest zabawne.
Jeżeli jednak chcemy wykorzystać big data do rozwoju biznesu, bądź w dużych badaniach społecznych, warto skonsultować wdrożenie ze specjalistami, tak aby nie utonąć w morzu danych. Jak podkreśla Tomasz Andrzejewski: – Analityczne zastosowanie big data za każdym razem jest inne. W Greenlogic nie spotkaliśmy się z dwoma identycznymi bazami danych i identycznymi potrzebami dwóch różnych klientów. Warto więc, zanim uruchomimy skrypty analityczne na serwerach, czy w AWS Lambda, dobrze przemyśleć, jakie dane chcemy ze sobą porównywać i do czego chcemy je wykorzystać.


