Jedan od aktuelnih fenomena industrije informacionih tehnologija koji se u široj javnosti relativno retko pominje, pogotovo kod nas, a koji bi po svemu sudeći mogao da „oboji“ godinu pred nama je „big data“ (u slobodnom prevodu – ogromne količine podataka). Premda predstavlja samo jednu usku nišu za koju su uglavnom zainteresovane velike kompanije, akademske i državne institucije, big data ubrzano postaje značajna i zanimljiva pojava, odnosno izvor prilika, i za manje igrače i sve koji se trude da ponude sveže ideje i pokažu inovativnost.
O čemu se, zapravo, radi? Grubo rečeno, big data kao pojam opisuje skupove najrazličitijih podataka koji po količini prevazilaze standarne alate za prikupljanje, pohranjivanje, pretragu, deljenje, analizu i prezentovanje. Ako znamo da danas u našim računarima imamo gigabajte (jedan i 9 nula, odnosno 10 na 9), onda u domenu big data govorimo o petabajtima (10 na 15), a sve češće čak i zetabajtima (10 na 21). U modernoj informatičkoj eri nije teško sakupiti ovolike količine podataka na neku temu – zamislite samo, na primer, koliko informacija proizvedu dnevno meteorolozi širom sveta. Ono što što je ovde zanimljivo u stvari je način da se, recimo baš na našem primeru meteorologije, ti podaci iskoriste za bolje i preciznije predviđanje klimatskih promena, uticaja zagađenja na atmosferu, pojave kataklizmi kao što su uragani i cunami talasi i slično.
Zbog toga pod „big data“ podrazumevamo i alate, procese i procedure koji omogućuju prikupljanje, upravljanje i manipulisanje tolikim količinama podataka. Kao što sam rekao na početku, razvoj ovih alata postaje sve zanimljivija oblast IT industrije i sigurno će obeležiti 2012. godinu. Podaci dolaze sa svih strana, od klimatskih senzora i kamera za nadzor, preko poslovnih transakcija i informacija koje poseduju javne, zdravstvene i obrazovne institucije, do onoga što ljudi dele putem društvenih mreža. Teorija kaže da se big data proteže u tri dimenzije – raznovrsnost (struktuirani i nestruktuirani zapisi poput tekstova, video snimaka, fotografija, serverskih zapisa i slično), brzina (da bi imale vrednost informacije moraju da pristižu u realnom vremenu) i zapremina (količina podataka mora biti ogromna da bi mogli pravilno da se analiziraju). Ovako prikupljeni podaci koriste se u svim granama privrede, bankarstvu, zdravstvenom sistemu, državnoj upravi, maloprodaji, transportu, obrazovanju, nauci i tehnologiji, telekomunikacijama itd.
Ako ste čitali knjigu Otkačena ekonomija (u originalu Freakonomics) koju su napisali Steven Levitt i Stephen Dubner, ili barem gledali po njoj snimljeni istoimeni dokumentarni film (toplo preporučujem i jedno i drugo ostvarenje), onda znate da je za stvarno razumevanje pojava u savremenom svetu neophodna ozbiljna i nepristrasna analiza preciznih istorijskih podataka – u suprotnom postajemo žrtva predrasuda i paušalnih ocena. Što više podataka, to kvalitetnija analiza i pravilniji zaključci. Jednostavno, bez velikih količina podataka nema pravih informacija, a bez njih nije moguće doneti ispravne i pravovremene odluke. Donošenje dobrih odluka presudno je za svakog pojedinca, porodicu, kompaniju i državu, pogotovo u kriznim vremenima.
Zanimljivost: Samo u aprilu 2011. godine, biblioteka američkog kongresa prikupila je 235 terabajta podataka, dok na Facebooku ljudi dnevno podele 4 milijarde različitih sadržaja.
Ostavi komentar