Ile danych, tyle wartości

Published by Redakcja CIONET Polska
January 18, 2023 @ 8:30 AM

Podstawowa korzyść płynąca z analityki danych to wsparcie procesów decyzyjnych. Kierownicy projektów, menedżerowie, wreszcie zarząd – mogą na bazie sprawdzonych, wytrenowanych modeli analitycznych, precyzyjnie estymować realizację celów biznesowych a także na bieżąco modyfikować obrane wcześniej strategie. W praktyce ile organizacji – tyle zastosowań analityki i tyle metod uzyskania z niej wartości.

Opowiadali o tym prelegenci trzeciej sesji strategicznej programu Data Excellence, prowadzonego przez CIONET Polska. W wydarzeniu, zorganizowanym pod hasłem „Wartość danych i analityki dla organizacji”, wzięli udział eksperci z zakresu data science i inżynierii danych, reprezentujący czołowe przedsiębiorstwa w swoich branżach. 

Kamil Konikiewicz, Head of Data Science w Allegro, przedstawił doświadczenia ze skalowaniem obszaru data science u operatora tej platformy e-commerce. Michał Kot, Data Science and Consumer Insight Director w grupie Smyk, opisał sposoby na poprawę efektywności działań marketingowych z użyciem analityki danych w firmie sprzedającej zabawki i akcesoria dziecięce. 

Dariusz Szymański, Head of Transaction Monitoring Optimisation Analytics wraz z Łukaszem Kraińskim, Senior Data Scientist w ING Hubs Poland, opowiedzieli o zastosowaniach analityki i uczenia maszynowego w międzynarodowym banku. Z kolei Krzysztof Sienicki, Data Science Chapter Head i Paulina Święcicka, Data Engineering Head w firmie farmaceutycznej Roche wystąpili z prelekcją zatytułowaną „MLOps jako brakujący element rozwiązań AI”.

Analityka w firmie e-commerce
W Allegro analityka danych stosowana jest w wielu różnych obszarach, takich jak automatyzacja działań marketingowych (usprawnienie wszelkiego rodzaju bezpośrednich działań marketingowych wspierające sprzedaż czy lojalizację klientów poprzez różnego rodzaju kanały dotarcia) i logistyka dostaw. Z modeli predykcyjnych korzysta też kierownictwo spółki – w tym wypadku modele są przydatne m.in. w ewaluacji scenariuszy inwestycyjnych (rozwojowych) na potrzeby stymulacji sprzedaży.

Kamil Konikiewicz, Allegro

„Każdy z tych projektów jest kompletnie inny. Niektóre rzeczy są implementowane w formie mikrousługi, inne jako procesy batchowe. Część jest realizowana od początku do końca wyłącznie przez nas, inne we współpracy z innymi zespołami inżynierskimi. Niektóre są zupełnie nowe lub dotyczą nowej domeny, w której nie dysponujemy żadnymi reużywalnymi zasobami, inne są kontynuacją frameworku, który dobrze znamy” – wyjaśniał Kamil Konikiewicz.

Firma stara się, aby wszystkie projekty miały pewne porównywalne cechy czy metryki, pozwalające lepiej zarządzać priorytetami. Planowanie celów odbywa się dla wszystkich projektów jednocześnie i jest uzgadniane z liderami. Co ważne, każdorazowo przed wdrożeniem nowego projektu zbiera się, jak to określił Kamil Konikiewicz, „konsylium analityczne", w ramach którego omawiane są związane z nim pomysły i inicjatywy.

Gdy zaczynamy projekt z obszaru uczenia maszynowego, tworzymy coś w rodzaju karty projektu. Staramy się zawsze przeprowadzać staranne warsztaty, w ramach których określamy, co jest celem projektu, w jaki sposób zamierzamy mierzyć efekt i na jakichś przewidywalnych wartościach zrobić symulację, co by było po osiągnięciu danej skuteczności, przychodów i zaangażowania segmentu klientów – powiedział przedstawiciel Allegro.

Analityka a komunikacja marketingowa
W Grupie Smyk analityka danych została wykorzystana do poprawy skuteczności komunikacji marketingowej z klientami. 

Jak wskazywał Michał Kot, w pewnym momencie postanowiono zweryfikować w organizacji efektywność modeli analitycznych, a przez to, potencjalnie, podnieść wydajność działań mających na celu dotarcie do klienta z ofertą. Bo jeżeli wysyłka komunikatu marketingowego nie skłania klienta do zakupu, pod znakiem zapytania staje zasadność stosowania tradycyjnych modeli scoringowych.

Nasz problem polegał na tym, że osoby które kupują w Smyku, nie są użytkownikami naszych produktów. Bardzo mało kupuje dla siebie, większość – dla kogoś: w prezencie dla dzieci, wnuków… Decyzja o zakupie jest dyktowana nie tylko tym, kim klient jest, ale przede wszystkim tym, dla kogo kupuje – wyjaśniał przedstawiciel Smyka.

Zdecydowano się zastosować podejście przyczynowe oraz tzw. model uplift. Oceniono, że największe szanse powodzenia ma komunikat do tych klientów, którzy mogą zmienić swoją decyzję po otrzymaniu komunikatu marketingowego – czyli, na przykład, zamiast odmowy lub rezygnacji – zdecydować się na zakup. Dla odróżnienia, komunikacja z niektórymi grupami klientów mija się z celem, bo nie zmienią oni swojej decyzji niezależnie od tego, czy komunikat do nich dotrze, czy nie.

Michał Kot, Smyk

Dzięki modelom bazującym na przyczynowości firma jest w stanie przewidzieć zmiany zysku na danym kliencie, jak również prawdopodobieństwo kupna produktu przez niego. To sprawia, że metody bazujące na przyczynowości są dobrą alternatywą dla metod opartych o scoring. Stosowanie ich jest zawsze uwarunkowane danym case’m biznesowym, wymaga przygotowania i fazy pilotażowej oraz innych metod weryfikacji. Zdaniem Michała Kota metody upliftowe są najlepszym rozwiązaniem przy małych, „taktycznych” wysyłkach, gdzie budżet wysyłkowy jest ograniczony, a grupa docelowa – niewielka.

Analityka a monitoring transakcji bankowych
W ING analityka jest stosowana do monitorowania transakcji. Banki mają taki obowiązek w związku ze zwalczaniem procederu prania brudnych pieniędzy, finansowania terroryzmu, omijania sankcji czy unikania podatków, a wszelkie podejrzane przepływy finansowe w tym zakresie muszą raportować lokalnym organom nadzorczym.

Jak powiedział Łukasz Kraiński, zadaniem zespołu monitorującego transakcje, jest projektowanie i prototypowanie scenariuszy, segmentacja klientów czy uczenie nadzorowane np. scoring.

Chcemy wyłapywać podejrzane zachowania. Łączymy scenariusze i grupy klientów. Mamy na przykład scenariusz, w którym monitorujemy duże wypłaty gotówkowe, oddzielnie uruchamiany dla klientów indywidualnych i dla private banking. Tworzymy segmenty na bazie produktów, które oferuje bank – opisał.

„Chcemy wyłapywać podejrzane zachowania. Łączymy scenariusze i grupy klientów. Mamy na przykład scenariusz, w którym monitorujemy duże wypłaty gotówkowe, oddzielnie uruchamiany dla klientów indywidualnych i dla private banking. Tworzymy segmenty na bazie produktów, które oferuje bank” – opisał.

Wyzwaniem dla skutecznej analityki w tym zakresie może być skala. ING Hubs Poland dostarcza usługi IT i usługi operacyjne wszystkim spółkom ING. Tymczasem grupa prowadzi biznes w ponad 40 krajach i obsługuje 35 mln klientów. To daje liczbę ok. 2 mld transakcji miesięcznie do przetworzenia. Do tego dochodzi zmienność interesariuszy – trzeba współpracować z lokalnymi zespołami i regulatorami.

Łukasz Kraiński i Dariusz Szymański, ING Hubs Poland

Dodatkowym aspektem podlegającym analizie jest sieć powiązań między użytkownikami. Jak bowiem zwracał uwagę Łukasz Kraiński, typologie skupione na pojedynczych klientach nie zawsze są wystarczające; pranie pieniędzy odbywa się w zorganizowanych grupach przestępczych: siatkach osób połączonych tak, by nie dało się wykryć połączenia. Z pomocą przychodzą wówczas dane grafowe, umożliwiające stworzenie takich sieci powiązań.

Analityka a sztuczna inteligencja
Firma farmaceutyczna Roche postawiła na wprowadzenie programu MLOps – zestawu praktyk łączących uczenie maszynowe z DevOps i inżynierią danych, dążących do wdrożenia i utrzymania modeli uczenia maszynowego „na produkcji” w sposób niezawodny i efektywny. Zdecydowano się na to w celu usprawnienia prac zespołów naukowych i przyśpieszenia prac badawczych.

Produkcja leku – od pomysłu do komercjalizacji – trwa średnio ok. 10-15 lat. Naukowcy firmy analizują miliony molekuł i setki parametrów leków, aby ocenić, w jaki sposób te molekuły będą się zachowywać w lekach. Średni zmierzony czas oczekiwania na realizację predykcji wynosił 3 dni. „W pracy naukowca to czas kluczowy, który chcieliśmy zaoszczędzić” – powiedział Krzysztof Sienicki.

Paulina Święcicka i Krzysztof Sienicki, Roche

Wyzwaniem technologicznym było to, że w momencie wdrażania MLOps większość serwerów firmowych działała on-premise; organizacyjnym – rozsianie badaczy zarówno po różnych strukturach organizacji, jak i w różnych lokalizacjach globalnie.  Dodatkowo trzeba było wziąć pod uwagę kontekst kulturowy firmy – IT nie chciało autorytatywnie przedstawić nowego trybu współpracy; a zamiast tego zaprosić interesariuszy współpracy co zwiększyło ich zaangażowanie w standaryzowaniu pracy i stosu technologicznego.

Zespół MLOps, który zajmuje się rozwijaniem modeli uczenia maszynowego, sformowano z ekspertów z różnych dziedzin.

Strategicznie wybraliśmy obszary, z których przydzieliliśmy ekspertów do MLOps – pierwszym wyborem byli programiści algorytmów ML ale poszukiwania prowadziliśmy w różnych zespołach i krajach. Tym sposobem wybraliśmy osoby nie tylko z zapleczem w data science ale też z inżynierii danych, inżynierii oprogramowania i DevOps – wskazała Paulina Święcicka. 

Dodatkową zaletą projektu było stworzenie atrakcyjnej ścieżki rozwojowej dla doświadczonych pracowników.

Data Excellence – o programie
Data Excellence to całoroczny program skierowany do przedstawicieli świata technologii, analityki i biznesu, dotykający szerokiego spektrum zagadnień związanych z gromadzeniem i przetwarzaniem danych. Udział w programie umożliwia wymianę wiedzy i doświadczeń – w drodze uczestnictwa w organizowanych raz na kwartał sesjach strategicznych oraz warsztatach online, spotkaniach „inspiracyjno-praktycznych”, poświęconych narzędziom i procesom.

Uczestnicy 3. sesji strategicznej programu Data Excellence

Program został zainaugurowany w czerwcu 2022 r. Od tego czasu zgromadził społeczność liczącą ponad 200 osób, reprezentujących ponad 120 organizacji. Partnerami programu są firmy AWS, Deloitte, Hewlett Packard Enterprise i IBM.

Najbliższa, czwarta sesja strategiczna Data Excellence odbędzie się w marcu 2023 r. i będzie dotyczyć sposobów organizacji procesów Data Governance, zgodności i etycznego wykorzystania danych.

Więcej informacji na stronie programu: cionet.com/dataexcellence.

 

No Comments Yet

Let us know what you think

Subscribe by Email