Business data paradise - we visited Strata Data conference in London
Business data paradise - we visited Strata Data conference in London
Az adatközpontú technológiai tematika rengeteg érdeklődőt vonzott a rendezvényre. Minden data engineer és data science szakembernek, tudományos intézetnek és technológiai vállalatnak “kötelező programnak” minősül a világ számos nagyvárosában megrendezett Strata Data konferenciasorozat valamely állomása. Az O'Reilly Media és a Cloudera szervezésében zajlott konferencia előadásai és workshopjai a big data, felhőszolgáltatások és mesterséges intelligencia témái köré fonódtak, mely területek egymással egyre szorosabban összekapcsolódnak és alkotnak új szolgáltatási csomagokat.
Miként épül fel ugyanis napjaink üzleti adatelemzői szolgáltatása a gyakorlatban? A több forrásból származó, különböző felépítésű és strukturálatlan adatot (Big Data) olyan platformon szükséges tárolni (Cloud), mely képes kiszolgálni a dinamikusan növekvő adatmennyiséget és az ahhoz kapcsolódó valós idejű algoritmikus feldolgozásokat (mesterséges intelligencia). A három elem egységes rendszerré kapcsolódik össze, mely rendszer további kiegészítők (modulok) beépítését is lehetővé teszi.
A konferencián a legnagyobb érdeklődés a machine learninggel és deep learninggel kiegészült mesterséges intelligencia előadásoknál volt, ahol a legnevesebb vállalatok mutatták be legújabb fejlesztéseiket, AI eszközeiket, moduljaikat. A legfontosabb elvárás az ilyen megoldásokkal szemben, hogy megbízható, rugalmas, saját igényekhez igazítható építőkockaként illeszkedjenek a rendszerbe, és algoritmusok segítségével a lehető leggyorsabban dolgozzák fel a temérdek adatmennyiséget. A versenyben a legnépszerűbb keretrendszernek a Google TensorFlow-ja bizonyult, ugyanakkor a Microsoft, az Intel, a Dell és az Nvidia saját megoldásai is izgalmas lehetőségeket kínálnak. A konferencián lehetőségünk nyílt a gyakorlatban is kipróbálni a TensorFlow-t, melyről a későbbiek során egy külön blogbejegyzés formájában jelentkezünk a szakmai tapasztalatokkal.
A Google, az Amazon, a Microsoft és a Cloudera mint legnagyobb felhőszolgáltatók mutatták be legújabb megoldásaikat a konferencián, melyek a nagy mennyiségű adatok gyors kezelésével is megbirkóznak. Az adathalmazok nagyságát szemléltetve érdekességként elhangzott, hogy az Uber által fejlesztett okosautók esetében egy autó napi 1 TB mennyiségű adatot gyűjt össze, mely az autók növekedő számával elképesztő adatmennyiséget generál a jövőben. Ez az adatmennyiség pedig legtöbbször strukturálatlan, az automatikus feldolgozásra nem alkalmas. Az üzleti adatelemzés ezért szükségszerűen kiegészül az úgynevezett data wrangling tevékenységgel, melynek célja, hogy a Big Data folyamatosan frissülő, szinte követhetetlen mennyiségű adatából a rendszer által automatikusan értelmezhető, előfeldolgozott információk jöjjenek létre, melyek már a hibás vagy duplikált adatoktól is mentesek.
És hogy milyen üzleti lehetőségek rejlenek a Big Data, Cloud és AI hármasban? Az Uber például igyekszik minden területen kihasználni az adatelemzésben rejlő előnyöket: algoritmusainak segítségével predikcióra alapozva már azelőtt elindul egy autó az utashoz, mielőtt az megrendelné azt - mikor pedig megérkezett, az utas arcfelismerés segítségével győződhet meg arról, hogy megfelelő autóba száll be, növelve ezzel a biztonságot.
Az építőkockák tehát rendelkezésre állnak, kizárólag az alkotón múlik, hogy milyen sorrendben, milyen összefüggésben és milyen célra használja fel őket. Az adat jelentősége nyilvánvaló és megkerülhetetlen, így izgatottan várjuk, hogy saját fejlesztéseink során is alkalmazhassuk a konferencián megismert és kipróbált új eszközöket.