{"id":2579,"date":"2012-02-15T11:12:33","date_gmt":"2012-02-15T10:12:33","guid":{"rendered":"http:\/\/touk.pl\/blog\/?p=2579"},"modified":"2023-03-22T14:29:25","modified_gmt":"2023-03-22T13:29:25","slug":"agile-bi","status":"publish","type":"post","link":"https:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/","title":{"rendered":"Agile BI"},"content":{"rendered":"<p><strong>&#8230; czyli decyzje, o kt\u00f3rych nie wiesz, \u017ce b\u0119dziesz musia\u0142 je podj\u0105\u0107, na podstawie du\u017cej ilo\u015bci danych, o kt\u00f3rych nie wiesz, \u017ce masz je zbiera\u0107.<\/strong><\/p>\n<address>\n  Poni\u017cszy artyku\u0142 odpowiada mniej wi\u0119cej prezentacji jak\u0105 mia\u0142em przyjemno\u015b\u0107 przedstawi\u0107 na konferencji <a href=\"http:\/\/www.multitrain.pl\/home\/archiwum\/bi-w-instytucjach-finansowych-2012.htm\">&#8220;Business Intelligence w instytucjach finansowych&#8221;<\/a>. W zwi\u0105zku z tym mog\u0105 w nim wyst\u0119powa\u0107 pewne problemy wynikaj\u0105ce z trudno\u015bci prze\u0142o\u017cenia tekstu m\u00f3wionego na pisany.<br \/>\n<\/address>\n<address>\n  \u00a0<br \/>\n<\/address>\n<figure style=\"width: 128px\" class=\"wp-caption alignleft\">\n<p><a href=\"http:\/\/www.bttfmovie.com\/\"><img loading=\"lazy\" decoding=\"async\" class=\" \" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/en\/a\/a9\/Backfu2.jpg\" alt=\"\" width=\"128\" height=\"192\" \/><\/a><figcaption class=\"wp-caption-text\">Perfect BI<\/figcaption><\/figure> W filmie \u201ePowr\u00f3t do przysz\u0142o\u015bci 2\u201d jeden z bohater\u00f3w przemyca z przysz\u0142o\u015bci w przesz\u0142o\u015b almanach sportowy zawieraj\u0105cy rezultaty wydarze\u0144 sportowych. Dokumentu tego u\u017cywa w przesz\u0142o\u015bci. Jest to przyk\u0142ad idealnego, nieomylnego raportu BI, dzi\u0119ki kt\u00f3remu (w wyniku hazardu) bohater staje si\u0119 bogatym cz\u0142owiekiem. Niestety nie dysponujemy obecnie takimi mo\u017cliwo\u015bciami technicznymi.<\/p>\n<p>Jednak w wielu przypadkach sami zaw\u0119\u017camy swoje mo\u017cliwo\u015bci. Du\u017co wcze\u015bniej od zebrania danych czynimy co do nich zaawansowane za\u0142o\u017cenia. Dopiero z tak zebranych (wed\u0142ug uprzednich za\u0142o\u017ce\u0144) danych staramy si\u0119 wyci\u0105ga\u0107 informacje o obecnym stanie przedsi\u0119biorstwa. Tej niedogodno\u015bci mo\u017cna unikn\u0105\u0107 przez zwinne podej\u015bcie do Business Intelligence. <figure style=\"width: 128px\" class=\"wp-caption alignright\">\n<p><a href=\"http:\/\/www.robert-bresson.com\/\"><img loading=\"lazy\" decoding=\"async\" class=\" \" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/ru\/e\/ef\/%D0%9F%D0%BE%D1%81%D1%82%D0%B5%D1%80_%D1%84%D0%B8%D0%BB%D1%8C%D0%BC%D0%B0_%C2%AB%D0%9A%D0%B0%D1%80%D0%BC%D0%B0%D0%BD%D0%BD%D0%B8%D0%BA%C2%BB_%28%D0%A4%D1%80%D0%B0%D0%BD%D1%86%D0%B8%D1%8F%2C_1959%29.jpg\" alt=\"\" width=\"128\" height=\"171\" \/><\/a><figcaption class=\"wp-caption-text\">Agile?<\/figcaption><\/figure> S\u0142owo \u201eagile\u201d (\u201ezwinny\u201d), dzi\u0119ki zastosowaniu do okre\u015blenia tendencji w tworzeniu oprogramowania komputerowego, sta\u0142o si\u0119 bardzo popularne. Aby przenie\u015b\u0107 je na inny grunt ni\u017c metodyki tworzenia oprogramowania, warto zastanowi\u0107 si\u0119 nad jego znaczeniem w tym kontek\u015bcie. Zwinny mo\u017ce by\u0107 kieszonkowiec. Nie o takie znaczenie chyba nam chodzi. Mo\u017ce si\u0119 jednak zdarzy\u0107, \u017ce kto\u015b pos\u0142uguj\u0105c si\u0119 s\u0142owem \u201eagile\u201d po prostu wyci\u0105gnie od nas pieni\u0105dze. <figure style=\"width: 128px\" class=\"wp-caption alignleft\">\n<p><a href=\"http:\/\/www.youtube.com\/user\/MontyPython\"><img loading=\"lazy\" decoding=\"async\" class=\" \" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/en\/9\/91\/Meaningoflife.jpg\" alt=\"\" width=\"128\" height=\"195\" \/><\/a><figcaption class=\"wp-caption-text\">Dave Snowden's Cynefin<\/figcaption><\/figure> Zazwyczaj gdy zadajemy sobie pytanie w rodzaju &#8220;czym jest&#8230;?&#8221; czy &#8220;co oznacza&#8230;?&#8221; wchodzimy w obszar zwany filozofi\u0105. Si\u0119gnijmy wi\u0119c do wiedzy brytyjskiego filozofa w s\u0142u\u017cbie nauki. <a href=\"http:\/\/www.youtube.com\/watch?v=Miwb92eZaJg\">Dave Snowden<\/a>, bo o nim mowa, jest autorem modelu nazwanego walijskim s\u0142owem <a href=\"http:\/\/alumni.media.mit.edu\/~brooks\/storybiz\/kurtz.pdf\">Cynefin<\/a> (\/\u02c8k\u028cn\u0268v\u026an\/), s\u0142u\u017c\u0105cemu (w skr\u00f3cie) do opisywania czy okre\u015blania sytuacji w jakich przychodzi podejmowa\u0107 nam decyzje.<\/p>\n<p>Wed\u0142ug tego modelu sytuacje dzielimy na proste, trudne, z\u0142o\u017cone i chaotyczne. Ka\u017cda sytuacja ma inn\u0105 charakterystyk\u0119 i w ka\u017cdej nasze post\u0119powanie powinno by\u0107 inne.<\/p>\n<p><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/cynefin_ordered\/\" rel=\"attachment wp-att-2604\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2604\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/cynefin_ordered.png\" alt=\"\" width=\"196\" height=\"146\" \/><\/a>Sytuacje proste i trudne nale\u017c\u0105 do dziedziny uporz\u0105dkowanej, co oznacza, \u017ce istnieje \u015bcis\u0142a zale\u017cno\u015b\u0107 przyczynowo skutkowa, kt\u00f3r\u0105 mo\u017cna przewidzie\u0107. W przypadkach prostych taka zale\u017cno\u015b\u0107 jest dostrzegalna dla ka\u017cdej rozs\u0105dnej osoby, a nasze post\u0119powanie sprowadza si\u0119 do rozeznania, sklasyfikowania okoliczno\u015bci i podj\u0119cia w\u0142a\u015bciwej decyzji. Poniewa\u017c mamy pe\u0142n\u0105 wiedz\u0119 na temat sytuacji po prostu bazujemy na najlepszych praktykach, dzia\u0142amy wed\u0142ug regu\u0142. Przyk\u0142ad? No income, no job or assets &#8211; wniosek &#8211; nie udzielamy kredytu. Oczywi\u015bcie\u00a0 w tym miejscu, ze wzgl\u0119du na nik\u0142\u0105 wiedz\u0119 z zakresu finans\u00f3w mog\u0119 pope\u0142nia\u0107 b\u0142\u0105d traktuj\u0105c jako prost\u0105 sytuacj\u0119 w rzeczywisto\u015bci z\u0142o\u017con\u0105.<\/p>\n<p>Sytuacj\u0119 trudn\u0105 (skomplikowan\u0105) od prostej odr\u00f3\u017cnia to, \u017ce o ile wiemy, \u017ce istnieje zale\u017cno\u015b\u0107 przyczynowo-skutkowa, to mo\u017ce by\u0107 ona niedostrzegalna na pierwszy rzut oka. Po rozeznaniu jeste\u015bmy jednak pewni, \u017ce wykonuj\u0105c analiz\u0119 jeste\u015bmy w stanie t\u0119 zale\u017cno\u015b\u0107 odkry\u0107 i na tej podstawie podj\u0105\u0107 decyzj\u0119. Autor modelu przywo\u0142uje tutaj przyk\u0142ad zepsutego samochodu. Jego naprawa wymaga od nas, a w zasadzie od mechnika, czyli eksperta w dziedzinie, zbadania sprawy. Bez wykonania analizy nie mo\u017cemy powiedzie\u0107, co nale\u017cy zrobi\u0107, by samoch\u00f3d naprawi\u0107. Jest te\u017c tak, \u017ce do w\u0142a\u015bciwej diagnozy ka\u017cdy mechnik mo\u017ce doj\u015b\u0107, wykonuj\u0105c inne czynno\u015bci (czy cho\u0107by w innej kolejno\u015bci). Mamy wi\u0119c wiele dobrych praktych i nie mo\u017cna powiedzie\u0107, \u017ce kt\u00f3ra\u015b z nich jest lepsza.<\/p>\n<p>Przyjmuj\u0105c, \u017ce Business Intelligence to wspracie dla podejmowania decyzji biznesowych, sytuacje okre\u015blane jako trudne (skomplikowane) to doskona\u0142e miejsce dla tradycyjnych system\u00f3w BI. Przypomnijmy, co si\u0119 mniej wi\u0119cej na nie sk\u0142ada.<\/p>\n<p><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/traditional_bi_tools\/\" rel=\"attachment wp-att-2609\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft  wp-image-2609\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/traditional_bi_tools.png\" alt=\"\" width=\"196\" height=\"147\" \/><\/a>Dane \u017cr\u00f3d\u0142owe czy to z dziedzinowych baz danych czy cho\u0107by z plik\u00f3w w procesach ETL (extract-transform-load) trafiaj\u0105 do operacyjnego sk\u0142adu danych (Operational Data Store), gdzie s\u0105 integrowane i porz\u0105dkowane tematycznie (subject-oriented), b\u0105d\u017a bezpo\u015brednio do hurtowni danych (Data WareHouse), gdzie ich struktura jest optymalizowana pod k\u0105tem p\u00f3\u017aniejszego przeszukiwania. Z tak przygotowanych danych korzystaj\u0105 narz\u0119dzia analityczne. Budowanie rozwi\u0105zania wed\u0142ug takiej architektury jest oczywi\u015bcie dobr\u0105 praktyk\u0105. Ma jednak pewne u\u0142omno\u015bci.<\/p>\n<p>Jak sama nazwa wskazuje w procesie ETL wybieramy jedynie pewne dane z system\u00f3w \u017ar\u00f3d\u0142owych a nast\u0119pnie je przekszta\u0142camy. Zak\u0142adamy pewn\u0105 interpretacj\u0119 danych przed ich zebraniem. <strong>Tracimy<\/strong> w ten spos\u00f3b <strong>szczeg\u00f3\u0142y<\/strong>, i je\u017celi hurtownia danych jest jedynym miejscem przechowywania informacji historycznych, nie ma mo\u017cliwo\u015bci ich odzyskania.<\/p>\n<p>Na diagramie powy\u017cej hurtownia danych oznaczona zosta\u0142a podw\u00f3jnym symbolem. Ma to obrazowa\u0107 wi\u0119ksz\u0105 ilo\u015b\u0107 danych, kt\u00f3ra jest w nich przechowywana. Jednak\u017ce klasyczne hurtownie danych z trudem skaluj\u0105 si\u0119 wszerz (scale out) tzn. na wiele fizycznych komputer\u00f3w. Og\u00f3lnie w przypadku relacyjnych baz danych preferowane jest skalowanie wzwy\u017c (scale up), czyli przez zwi\u0119kszanie mo\u017cliwo\u015bci jednej maszyny. Mimo ci\u0105g\u0142ego zwi\u0119kszania mo\u017cliwo\u015bci technicznych sprz\u0119tu komputerowego, jest to <strong>ograniczanie zakresu<\/strong> przechowywanych danych.<\/p>\n<p><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/table\/\" rel=\"attachment wp-att-2622\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft  wp-image-2622\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/table.png\" alt=\"\" width=\"96\" height=\"98\" \/><\/a>W ogromnej wi\u0119kszo\u015bci przypadk\u00f3w pod has\u0142em hurtownia czy ODS danych kryje si\u0119 rozwi\u0105zanie oparte na relacyjnej bazie danych. Model relacyjny wymaga, aby przed zebraniem danych nada\u0107, <strong>narzuci\u0107<\/strong> na te dane <strong>korelacje<\/strong>. <a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/text\/\" rel=\"attachment wp-att-2678\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2678\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/text.png\" alt=\"\" width=\"96\" height=\"78\" \/><\/a><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/graph\/\" rel=\"attachment wp-att-2689\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2689\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/graph.png\" alt=\"\" width=\"96\" height=\"62\" \/><\/a>Ponadto tworzenie hurtowni w oparciu o relacyjny model danych <strong>ogranicza wydajno\u015b\u0107<\/strong> w niekt\u00f3rych klasach problem\u00f3w jak przeszukiwanie danych tekstowych czy przechodzenie graf\u00f3w (Jakiej grupie klient\u00f3w promocyjnie sprzeda\u0107 produkt, by &#8220;moda&#8221; na niego najszybciej si\u0119 rozprzestrzeni\u0142a?).<\/p>\n<p>Zastan\u00f3wmy si\u0119 jak w czasie wygl\u0105da podejmowanie decyzji w oparciu o analiz\u0119 z takiego tradycyjnego systemu BI. Wi\u0119kszo\u015b\u0107 dostawc\u00f3w takich rozwi\u0105za\u0144 chwali si\u0119 szybk\u0105 dost\u0119pno\u015bci\u0105 analiz od chwili zebrania danych. Jest to prawda i wielka zaleta tych rozwi\u0105za\u0144. Pomija si\u0119 jednak dwa istotne aspekty. Jeden &#8211; wspomniany wy\u017cej &#8211; \u017ce ca\u0142e &#8220;czyszczenie&#8221; i porz\u0105dkowanie danych, kt\u00f3re ma taki pozytywny wp\u0142yw na wydajno\u015b\u0107 takiego systemu, sprawia, \u017ce nie mo\u017cemy danych tych nazwa\u0107 pe\u0142nymi. <a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/timeline1\/\" rel=\"attachment wp-att-2700\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-2700 alignleft\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/timeline1.png\" alt=\"\" width=\"196\" height=\"146\" \/><\/a>Drugi problem to czas jaki mija od momentu poczynienia za\u0142o\u017ce\u0144 (jakie dane zbieramy, co z nich wybieramy, jak je porz\u0105dkujemy) do chwili, kiedy zaczynamy gromadzi\u0107 dane (w hurtowni), czyli\u00a0 de facto czas wdro\u017cenia tradycyjnego rozwi\u0105zania BI. W 2010 roku firma Pentaho og\u0142osi\u0142a konkurs na swojej witrynie internetowej na najlepsz\u0105 odpowied\u017a na pytanie &#8220;Co to jest Zwinne BI?&#8221;. Ju\u017c po zako\u0144czeniu konkursu jeden z pracownik\u00f3w tej firmy <a href=\"http:\/\/jamesdixon.wordpress.com\/2010\/05\/19\/what-agile-bi-is-not\/\">napisa\u0142 na swoim blogu<\/a>, \u017ce ma sp\u00f3\u017anione zg\u0142oszenie do konkursu. Stwierdzi\u0142, \u017ce Agile BI, to wszystko, co jest nie tak w informacji (rzeczywistej informacji prasowej) <em>&#8220;Firma Bxxx Hxxx wdro\u017cy\u0142a system BxxxOxxx firmy SXX <strong>w mniej ni\u017c rok<\/strong>&#8220;<\/em>. Upraszczaj\u0105c kilkumiesi\u0119czny okres pomi\u0119dzy poczynieniem za\u0142o\u017ce\u0144 a rozpocz\u0119ciem zbierania danych to sukces. Prawdopodobnie jest to sukces. Jednak\u017ce mamy w takim wypadku bardzo dobre rozwi\u0105zanie, ale wdra\u017caj\u0105ce co najwy\u017cej uprzednio znane dobre praktyki, czyli w\u0142a\u015bciwe do zastosowania w sytuacjach trudnych (skomplikowanych).<\/p>\n<p>Jednak nie wszystkie sytuacje s\u0105 proste b\u0105d\u017a trudne. Dochodzimy do kolejnego kontekstu, w kt\u00f3rych przychodzi nam podejmowa\u0107 decyzje, kt\u00f3ry model Cynefin okre\u015bla jako z\u0142o\u017cony. <a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/cynefin_complex\/\" rel=\"attachment wp-att-2721\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2721\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/cynefin_complex.png\" alt=\"\" width=\"196\" height=\"146\" \/><\/a>Tutaj zale\u017cno\u015bci przyczynowo skutkowej nie mo\u017cna przewidzie\u0107. Mo\u017ce by\u0107 dostrze\u017cona jedynie patrz\u0105c wstecz, z czego jednak nie wynika, \u017ce ten sam ci\u0105g zdarze\u0144 w przysz\u0142o\u015bci doprowadzi do takiego samego efektu. W\u015br\u00f3d student\u00f3w informatyki jednym z popularniejszych temat\u00f3w prac magisterskich w pewnym czasie by\u0142o (wci\u0105\u017c jest?) stworzenie oprogramowania, kt\u00f3re na podstawie informacji gie\u0142dowych z przesz\u0142o\u015bci pozwoli\u0142oby na przewidywanie kszta\u0142towania kurs\u00f3w sp\u00f3\u0142ek. Jak \u0142atwo si\u0119 domy\u015bli\u0107, \u017caden z tych projekt\u00f3w nie doprowadzi\u0142 autora do wielkiego maj\u0105tku.<\/p>\n<p>W sytuacjach z\u0142o\u017conych tryb post\u0119powania opiera si\u0119 na eksperymentowaniu. Pr\u00f3bujemy pewne rozwi\u0105zania, sondujemy mo\u017cliwo\u015bci. Dopiero potem rozeznajemy problem i odpowiednio reagujemy.<\/p>\n<p>Wspomniane rynki finasowe s\u0105 dobrym przyk\u0142adem systemu z\u0142o\u017conego. Patrz\u0105c wstecz mo\u017cemy m\u00f3wi\u0107 o przyczynach i skutkach. Mo\u017cemy dostrzega\u0107 pewne wzorce zachowa\u0144, kt\u00f3re mog\u0105 wy\u0142oni\u0107 si\u0119 pewne w miar\u0119 skuteczne praktyki. Z ca\u0142\u0105 pewno\u015bci\u0105 nie istnieje jednak zbi\u00f3r dobrych praktyk, o kt\u00f3rym wiemy, \u017ce doprowadzi nas do sukcesu. Tradycyjne rozwi\u0105zania BI daj\u0105ce nam pewien zestaw narz\u0119dzi nie s\u0105 w tym przypadku bardzo pomocne.<\/p>\n<p><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/timeline2\/\" rel=\"attachment wp-att-2732\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft  wp-image-2732\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/timeline2.png\" alt=\"\" width=\"196\" height=\"147\" \/><\/a>Wracaj\u0105c do osi czasu, aby eksperymentowa\u0107 potrzebujemy takiego rozwi\u0105zania, kt\u00f3re pozwoli zbiera\u0107 maksymalnie du\u017co danych bez uprzednich za\u0142o\u017ce\u0144 do nich. Maj\u0105c te dane mo\u017cemy czyni\u0107 za\u0142o\u017cenia do analiz a nawet pr\u00f3buj\u0105c w kr\u00f3tkim\u00a0 okresie, jak eksperymentalne zmiany (np. oferty) wp\u0142ywaj\u0105 na te dane. Dopiero to pozwala na podj\u0119cie w\u0142a\u015bciwych decyzji. <figure style=\"width: 128px\" class=\"wp-caption alignright\">\n<p><a href=\"http:\/\/www.newline.com\/properties\/butterflyeffectthe.html\"><img loading=\"lazy\" decoding=\"async\" class=\" \" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/en\/4\/43\/Butterflyeffect_poster.jpg\" alt=\"\" width=\"128\" height=\"188\" \/><\/a><figcaption class=\"wp-caption-text\">Zwinny = sprawny w z\u0142o\u017cono\u015bci<\/figcaption><\/figure> W tym momencie dochodzimy do odpowiedzi na postawione wcze\u015bniej pytanie co to znaczy &#8220;agile&#8221;. <a href=\"http:\/\/www.cognitive-edge.com\/ceresources\/articles\/110510_On_Understanding_Software_Agility.pdf\"><strong>Zwinny to sprawny w z\u0142o\u017conym kontek\u015bcie<\/strong>.<\/a> Daj\u0105cych przewag\u0119 w sytuacjach tak nieprzewidywalnych jak cho\u0107by pogoda, gdzie ruch skrzyd\u0142a motyla w Ameryce Po\u0142udniowej mo\u017ce spowodowa\u0107 arktyczne mrozy nad Europ\u0105. <figure style=\"width: 128px\" class=\"wp-caption alignleft\">\n<p><a href=\"http:\/\/www.socialnetworkmovie.com\/\"><img loading=\"lazy\" decoding=\"async\" class=\" \" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/en\/7\/7a\/Social_network_film_poster.jpg\" alt=\"\" width=\"128\" height=\"201\" \/><\/a><figcaption class=\"wp-caption-text\">Zbieraj\u0105 dane<\/figcaption><\/figure> A jak to wygl\u0105da w praktyce? Sp\u00f3jrzmy na znane, du\u017ce firmy, kt\u00f3re w kr\u00f3tkim czasie zago\u015bci\u0142y w powszechnej \u015bwiadomo\u015bci. Co mo\u017cna dostrzec w dzia\u0142aniach takich firm jak Facebook, Twitter, Yahoo czy Amazon? Firmy te masowo <strong>zbieraj\u0105 dane<\/strong> i na tej podstawie buduj\u0105 swoj\u0105 przewage konkurencyjn\u0105. Nie gromadz\u0105 wy\u0142\u0105cznie danych, kt\u00f3re mo\u017cna za\u0142o\u017cy\u0107, \u017ce s\u0105 warto\u015bciowe, lecz gromadz\u0105 dane, kt\u00f3re w danej chwili posiadaj\u0105. Facebook nie by\u0142 pierwszym serwisem social networking. Jednak nawet powsta\u0142y ponad p\u00f3\u0142 roku wcze\u015bniej serwis <a href=\"http:\/\/www.forbes.com\/sites\/adamhartung\/2011\/01\/14\/why-facebook-beat-myspace\/\">Myspace, musia\u0142 uzna\u0107 wy\u017cszo\u015b\u0107 konkurenta.<\/a> W przeciwie\u0144stwie do Myspace, kt\u00f3ry by\u0142 budowany w celu wykorzystania potencja\u0142u sieci spo\u0142eczno\u015bciowych, Facebook ca\u0142y czas by\u0142 eksperymentem na u\u017cytkownikach rozwijanym w kierunkach na jaki wskazywa\u0142o jego wykorzystanie. R\u00f3wnie\u017c Amazon nieustannie sonduje popularno\u015b\u0107 nowych ofert na wybranych u\u017cytkownikach. Takie eksperymenty moga przynie\u015b\u0107 nieprzewidziane efekty i dlatego nie nale\u017cy ogranicza\u0107 si\u0119 w zbieraniu uprzednio wybranych informacji. Takich danych mo\u017ce by\u0107 du\u017co i st\u0105d nazwa dla trendu obecnego w przetwarzaniu danych &#8211; <em>Big Data<\/em>.<\/p>\n<p>Mo\u017cna zastanawia\u0107 si\u0119 jakiego rodzaju dane w instytucjach finansowych mog\u0142yby zas\u0142ugiwa\u0107 na miano <em>big data<\/em>. Z pewno\u015bci\u0105 kandydatem sa p\u0142atno\u015bci kartowe czy przelewy. Zawieraj\u0105 one wi\u0119cej informacji ni\u017c kwota. <a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/creditcard\/\" rel=\"attachment wp-att-2741\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2741\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/creditcard.png\" alt=\"\" width=\"97\" height=\"64\" \/><\/a>To miejsce do dyskusji ze specjalistami od marketingu w tych instytucjach. Mo\u017cna zada\u0107 pytanie, czy przyk\u0142adowo analitycy w banku maj\u0105 \u015bwiadomo\u015b\u0107 popularno\u015bci poszczeg\u00f3lnych element\u00f3w serwisu internetowego i czy przek\u0142ada si\u0119 to na indywidualnych klient\u00f3w oraz kierowane do nich oferty. Co ciekawe dzia\u0142y IT maj\u0105 wszystkie dane, by takie informacje przedstawi\u0107. <figure style=\"width: 128px\" class=\"wp-caption alignleft\">\n<p><a href=\"http:\/\/www.bluefly.com\/media\/promotions\/flash\/shopaholic\/main\/shopaholic.html\"><img loading=\"lazy\" decoding=\"async\" class=\" \" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/en\/1\/10\/Confessions_of_a_Shopaholic.jpg\" alt=\"\" width=\"128\" height=\"189\" \/><\/a><figcaption class=\"wp-caption-text\">W\u0142asne dane to za ma\u0142o<\/figcaption><\/figure> Zreszt\u0105 nie trzeba sie ogranicza\u0107 wy\u0142acznie do danych posiadanych przez konkretn\u0105 instytucj\u0119. Walmart, najwi\u0119ksza sie\u0107 handlowa na \u015bwiecie, opr\u00f3cz przetwarzania miliona transakcji na godzin\u0119, <a href=\"http:\/\/www.businessweek.com\/technology\/getting-a-handle-on-big-data-with-hadoop-09072011.html\">do kszta\u0142towania swojej oferty wykorzystuje &#8220;przeczesywanie&#8221; serwis\u00f3w spo\u0142eczno\u015bciowych<\/a>. Analiza w\u0142asnych danych to mo\u017ce by\u0107 za ma\u0142o by odnie\u015b\u0107 sukces rynkowy.<\/p>\n<p><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/racks\/\" rel=\"attachment wp-att-2751\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2751\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/racks.png\" alt=\"\" width=\"128\" height=\"120\" \/><\/a>Za tymi przyk\u0142adami firm stoi okre\u015blona technologia. Ze wzgl\u0119du na przedstawione wcze\u015bniej u\u0142omno\u015bci nie jest ona oparta na modelu relacyjnym. Wykorzystane jest <strong>rozproszone przetwarzanie<\/strong> danych. Dane nie s\u0105 przechowywane w jednej du\u017cej bazie danych, kt\u00f3ra zak\u0142ada podzia\u0142 danych na kolumny i wi\u0119zy integralno\u015bci mi\u0119dzy nimi. W celu wydobycia informacji nie korzysta si\u0119 te\u017c z zapyta\u0144 SQL. Zamiast tego tworzy si\u0119 implementacje algorytm\u00f3w pozwalaj\u0105cych na przetwarzanie danych na wielu komputerach w klastrze wykorzystuj\u0105c technologi\u0119 MapReduce. Ka\u017cda z maszyn w klastrze operuje na podzbiorze danych. Dystrybucj\u0119 danych (faza <em>map<\/em>) i zebranie danych (faza <strong>reduce<\/strong>) zapewnia technologia. Wszystkie wspomniane firmy korzystaj\u0105 z open source-owej implementacji &#8211; <a href=\"http:\/\/hadoop.apache.org\/\"><strong>Apache Hadoop<\/strong><\/a>.<\/p>\n<p><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/touk_cdr\/\" rel=\"attachment wp-att-2758\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft  wp-image-2758\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/touk_cdr.png\" alt=\"\" width=\"196\" height=\"146\" \/><\/a>TouK ma wiedz\u0119 i do\u015bwiadczenie w wykorzystaniu tego produktu. Realizujemy w oparciu o niego prace dla jednego z operator\u00f3w telefonii kom\u00f3rkowej. Wymogiem ustawowym operatorzy s\u0105 zobligowani do gromadzenia danych na temat aktywno\u015bci u\u017cytkownik\u00f3w sieci. Dane te pierwotnie przeznaczone na potrzeby organ\u00f3w bezpiecze\u0144stwa nios\u0105 za sob\u0105 r\u00f3wnie\u017c informacje biznesowe. W ramach projektu pewn\u0105 klas\u0119 takich informacji gromadzimy w klastrze, na kt\u00f3rym dzia\u0142a oprogramowanie Apache Hadoop, i udost\u0119pniamy do narz\u0119dzia analitycznego. Ju\u017c 4 maszyny zapewniaj\u0105 wydajno\u015b\u0107 rozwi\u0105zania identyczn\u0105 jak w przypadku hurtowni danych dzia\u0142aj\u0105cej na jednej maszynie dwukrotnie dro\u017cszej od kosztu calego klastra (nie licz\u0105c kosztu licencji relacyjnej bazy danych).<\/p>\n<p><a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/cynefin_chaotic\/\" rel=\"attachment wp-att-2765\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2765\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/cynefin_chaotic.png\" alt=\"\" width=\"196\" height=\"148\" \/><\/a>Dla porz\u0105dku nale\u017cy wspomnie\u0107 o ostatniej kategorii w modelu Cynefin &#8211; kontek\u015bcie chaotycznym. W takich sytuacjach nie ma zale\u017cno\u015bci przyczyna &#8211; skutek. Nie jest ona dostrzegalna r\u00f3wnie\u017c w retrospektywie. Podejmowanie decyzji w takich problemach polega na podj\u0119ciu dzia\u0142a\u0144 nawet przed g\u0142\u0119bszym rozeznaniem sytuacji. Przyk\u0142adem (w temacie finasowym) mo\u017ce tu by\u0107 reakcja gie\u0142dy nowojorskiej na zamachy 11 wrze\u015bnia 2001r. Pierwszym krokiem os\u00f3b odpowiedzialnych za t\u0119 instytucj\u0119 w sytuacji kryzysowej by\u0142o zamkni\u0119cie sesji na 4 dni. Dopiero potem by\u0142 czas na zastanowienie. <figure style=\"width: 128px\" class=\"wp-caption alignleft\">\n<p><a href=\"http:\/\/www.terminator2-film.com\/\"><img loading=\"lazy\" decoding=\"async\" class=\" \" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/en\/8\/85\/Terminator2poster.jpg\" alt=\"\" width=\"128\" height=\"186\" \/><\/a><figcaption class=\"wp-caption-text\">Oprogramowanie czasem przeszkadza<\/figcaption><\/figure> W takich sytuacjach nie ma mo\u017cliwo\u015bci post\u0119powania wed\u0142ug dobrych praktyk czy czasu na dostrze\u017cenie wzorc\u00f3w. Czasem efektem (przypadkowo) mo\u017ce by\u0107 jaka\u015b nowatorska praktyka. Jest to domena, w kt\u00f3rej nie ma oprogramowania, kt\u00f3re wspiera\u0142oby proces decyzyjny, a czasem mo\u017ce ono nawet przeszkadza\u0107.<\/p>\n<p>Podsumowuj\u0105c, tradycyjne rozwi\u0105zania BI doskonale sprawdzaj\u0105 si\u0119 w trudnych problemach. Ka\u017cdy mo\u017ce wybra\u0107 odpowadaj\u0105c\u0105 sobie dobr\u0105 praktyk\u0119. Natomiast w sytuacjach z\u0142o\u017conych, a sprawne radzenie sobie z nimi jest podstaw\u0105 budowy przewagi konkurencyjnej, potrzebujemy narz\u0119dzi, kt\u00f3re b\u0119d\u0105 wspiera\u0107 masowe gromadzenie danych bez czynienia za\u0142o\u017ce\u0144, co do spodziewanych wynik\u00f3w. Takiego oprogramowania nie mo\u017cna kupi\u0107 &#8220;z pude\u0142ka&#8221;. Jest ono wynikiem wsp\u00f3\u0142pracy pomi\u0119dzy klientem a firm\u0105 tworz\u0105c\u0105 oprogramowanie. Domena z\u0142o\u017cona, to miejsce gdzie taka firma jak TouK mo\u017ce pom\u00f3c.<br \/>\n<a href=\"http:\/\/touk.pl\/blog\/2012\/02\/15\/agile-bi\/touk_complex1\/\" rel=\"attachment wp-att-2780\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright  wp-image-2780\" src=\"http:\/\/touk.pl\/blog\/wp-content\/uploads\/2012\/02\/touk_complex1.png\" alt=\"\" width=\"256\" height=\"171\" \/><\/a><\/p>\n","protected":false},"excerpt":{"rendered":"Sztampowe podej\u015bcie do tematu Business Intelligence to zbudowanie hurtowni danych, stworzenie proces\u00f3w ETL i wdro\u017cenie narz\u0119dzia (interfejsu u\u017cytkownika) do raport\u00f3w i analiz. Jednak\u017ce oparta na relacyjnym modelu hurtownia danych nie radzi sobie ze wszystkimi klasami problem\u00f3w, z kt\u00f3rymi powinien poradzi\u0107 sobie system wspieraj\u0105cy podejmowanie decyzji biznesowych. Przyk\u0142adem mog\u0105 tu by\u0107 (na prawd\u0119) bardzo du\u017ce ilo\u015bci danych Tradycyjne rozwi\u0105zanie wymaga uprzedniego ustalenia jakiego rodzaju fakty b\u0119d\u0105 podlega\u0107 p\u00f3\u017aniejszej analizie. A przecie\u017c pomys\u0142 na wykorzystanie do budowania przewagi konkurencyjnej posiadanych (w pewnym momencie) informacji mo\u017ce przyj\u015b\u0107 nam do g\u0142owy p\u00f3\u017aniej. Czy gromadz\u0105c dane musimy jak\u0105\u015b cz\u0119\u015b\u0107 informacji traci\u0107? Czy mo\u017cemy zbiera\u0107 i szybko analizowa\u0107 dane, kt\u00f3re nie mieszcz\u0105 si\u0119 w naszej hurtowni?Sztampowe podej\u015bcie do tematu Business Intelligence to zbudowanie hurtowni danych, stworzenie proces\u00f3w ETL i wdro\u017cenie narz\u0119dzia (interfejsu u\u017cytkownika) do raport\u00f3w i analiz. Jednak\u017ce oparta na relacyjnym modelu hurtownia danych nie radzi sobie ze wszystkimi klasami problem\u00f3w, z kt\u00f3rymi powinien poradzi\u0107 sobie system wspieraj\u0105cy podejmowanie decyzji biznesowych. Przyk\u0142adem mog\u0105 tu by\u0107 (na prawd\u0119) bardzo du\u017ce ilo\u015bci danych Tradycyjne rozwi\u0105zanie wymaga uprzedniego ustalenia jakiego rodzaju fakty b\u0119d\u0105 podlega\u0107 p\u00f3\u017aniejszej analizie. A przecie\u017c pomys\u0142 na wykorzystanie do budowania przewagi konkurencyjnej posiadanych (w pewnym momencie) informacji mo\u017ce przyj\u015b\u0107 nam do g\u0142owy p\u00f3\u017aniej. Czy gromadz\u0105c dane musimy jak\u0105\u015b cz\u0119\u015b\u0107 informacji traci\u0107? Czy mo\u017cemy zbiera\u0107 i szybko analizowa\u0107 dane, kt\u00f3re nie mieszcz\u0105 si\u0119 w naszej hurtowni?\n","protected":false},"author":33,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[237],"tags":[252,213,21,59],"class_list":{"0":"post-2579","1":"post","2":"type-post","3":"status-publish","4":"format-standard","6":"category-processes-practices","7":"tag-big-data","8":"tag-business-intelligence","9":"tag-conference","10":"tag-project-management"},"_links":{"self":[{"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/posts\/2579","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/users\/33"}],"replies":[{"embeddable":true,"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/comments?post=2579"}],"version-history":[{"count":177,"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/posts\/2579\/revisions"}],"predecessor-version":[{"id":15492,"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/posts\/2579\/revisions\/15492"}],"wp:attachment":[{"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/media?parent=2579"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/categories?post=2579"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/touk.pl\/blog\/wp-json\/wp\/v2\/tags?post=2579"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}