Crunch Conference 2018 – Mint szakmai tükör

Crunch Conference 2018 – Mint szakmai tükör

Különleges helyzetben van a Crunch konferencia, mivel az előadók szándékai eléggé tiszták: nem akarnak valami bonyolult dolgot elmagyarázni nekünk, mint egy tudományos konferencián, nem egy PR eseményen vagyunk, ahol mindennek a főszponzor megoldásszállító marketingüzenetét kell hordoznia, de nem is egy zárt szakmai közösség találkozóján, ahol mindenki az ügyfeleknek vagy a versenytársaiknak kommunikálva egyre nagyobbat mond.

A Crunch előadóin azt láttam, hogy van egy jó gondolatmenetük, egy elfogadható / fejlődő céges adatvezérelt rendszerük, amiről egyszerűen szívesen mesélnek. Az ebből fakadó őszinteség eredménye pedig az, hogy a konferencia egyfajta tükérként tud szolgálni a hallgatóságnak, amibe belenézve elég sokat megtudhatunk magunkról.

csapat_kicsinyitett_2.JPG Dmlab a Crunchonfon. 

Mivel 2018-ban lényegében mindenhonnan a big data, az AI, az ezekre épülő megoldások folynak, miközben a legtöbb hír, anyag, siker mögött elég kétes szándékok, ügyes marketingfogások, vagy újságírói nagyotmondás húzódik, ezért sokakban az lehet az érzés, hogy mindenhol máshol fantasztikus adatvezérelt folyamatokkal építik a jövő sikeres vállalkozásait, amitől egyfajta lemaradottság-érzés alakul ki bennünk.

Ezért is volt üdítő látni, hogy nagy, neves cégek adatelemző szakembereit hallgatva kiderült, hogy nagyon hasonló problémákkal, nagyon hasonló megoldási javaslatokkal dolgoznak a legnagyobbak is, mint amikkel idehaza is összefutunk. Izgalmas volt látni többek között a Runtastic, a Slack, a LinkedIn, az Uber adattudósait mesélni arról a felépített folyamatokról, rendszerekről, kihívásokról és a nehézségekről. 

Látva a nemzetközi szinten jelentős cégek működését, nekem az volt a Crunch fő tanulsága, hogy nemzetközi szinten is vállalhatók azok a dilemmák, problémák, nehézségek és az ezekre kiépülő megoldások, amikkel mi magunk is dolgozunk. Nem csak nekünk okoz nehézséget egy folyamatosan újra és újra épülő modell üzemeltetése, máshol is ugyanúgy fáj a fejük a heterogén környezetektől, ugyanúgy dilemma másnak is, mitől lesz valami egyszeri vagy ismétlődő elemzés. Nyilván a hazai adatos világ le van maradva a fejlett gazdaságoktól, de szakmai oldalról ez a lemaradás nem érzékelhető. Jó volt ezt látni a tükörben.

A Crunch mellett két másik konferenciára is bejárásunk volt ugyanazzal a belépővel: a UX témában futó Amuse és a product managment témában futó Impact egy konferenciahelyszínen volt velünk. Mindkettő egy-egy ígéretetes előadására átmentem, és az Impact - nevéhez híven - nagyon nagy hatással is volt rám. Az a bő egy óra, amit ott töltöttem, elementáris erővel hatott rám, beláttatta velem, hogy mennyire vakon próbálkoztunk eddig a Dmlab megoldásainak termékesítése során. Ha úgy vesszük, ez is egyfajta tükörként funkcionált nálam, csak itt az elégedett mosoly helyett az a döbbenet ült ki az arcomra, amit akkor látsz, ha egy féléves gyerek először döbben rá, hogy a tükörben mit is lát.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Crunch Conference 2018 – Mint szakmai tükör

Crunch Conference 2018 – Mint szakmai tükör

Különleges helyzetben van a Crunch konferencia, mivel az előadók szándékai eléggé tiszták: nem akarnak valami bonyolult dolgot elmagyarázni nekünk, mint egy tudományos konferencián, nem egy PR eseményen vagyunk, ahol mindennek a főszponzor megoldásszállító marketingüzenetét kell hordoznia, de nem is egy zárt szakmai közösség találkozóján, ahol mindenki az ügyfeleknek vagy a versenytársaiknak kommunikálva egyre nagyobbat mond.

A Crunch előadóin azt láttam, hogy van egy jó gondolatmenetük, egy elfogadható / fejlődő céges adatvezérelt rendszerük, amiről egyszerűen szívesen mesélnek. Az ebből fakadó őszinteség eredménye pedig az, hogy a konferencia egyfajta tükérként tud szolgálni a hallgatóságnak, amibe belenézve elég sokat megtudhatunk magunkról.

csapat_kicsinyitett_2.JPG Dmlab a Crunchonfon. 

Mivel 2018-ban lényegében mindenhonnan a big data, az AI, az ezekre épülő megoldások folynak, miközben a legtöbb hír, anyag, siker mögött elég kétes szándékok, ügyes marketingfogások, vagy újságírói nagyotmondás húzódik, ezért sokakban az lehet az érzés, hogy mindenhol máshol fantasztikus adatvezérelt folyamatokkal építik a jövő sikeres vállalkozásait, amitől egyfajta lemaradottság-érzés alakul ki bennünk.

Ezért is volt üdítő látni, hogy nagy, neves cégek adatelemző szakembereit hallgatva kiderült, hogy nagyon hasonló problémákkal, nagyon hasonló megoldási javaslatokkal dolgoznak a legnagyobbak is, mint amikkel idehaza is összefutunk. Izgalmas volt látni többek között a Runtastic, a Slack, a LinkedIn, az Uber adattudósait mesélni arról a felépített folyamatokról, rendszerekről, kihívásokról és a nehézségekről. 

Látva a nemzetközi szinten jelentős cégek működését, nekem az volt a Crunch fő tanulsága, hogy nemzetközi szinten is vállalhatók azok a dilemmák, problémák, nehézségek és az ezekre kiépülő megoldások, amikkel mi magunk is dolgozunk. Nem csak nekünk okoz nehézséget egy folyamatosan újra és újra épülő modell üzemeltetése, máshol is ugyanúgy fáj a fejük a heterogén környezetektől, ugyanúgy dilemma másnak is, mitől lesz valami egyszeri vagy ismétlődő elemzés. Nyilván a hazai adatos világ le van maradva a fejlett gazdaságoktól, de szakmai oldalról ez a lemaradás nem érzékelhető. Jó volt ezt látni a tükörben.

A Crunch mellett két másik konferenciára is bejárásunk volt ugyanazzal a belépővel: a UX témában futó Amuse és a product managment témában futó Impact egy konferenciahelyszínen volt velünk. Mindkettő egy-egy ígéretetes előadására átmentem, és az Impact - nevéhez híven - nagyon nagy hatással is volt rám. Az a bő egy óra, amit ott töltöttem, elementáris erővel hatott rám, beláttatta velem, hogy mennyire vakon próbálkoztunk eddig a Dmlab megoldásainak termékesítése során. Ha úgy vesszük, ez is egyfajta tükörként funkcionált nálam, csak itt az elégedett mosoly helyett az a döbbenet ült ki az arcomra, amit akkor látsz, ha egy féléves gyerek először döbben rá, hogy a tükörben mit is lát.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

11! – Mennyire volt elÅ‘relátható a big data jelenség?

11! – Mennyire volt elÅ‘relátható a big data jelenség?

Ma van a blogunk 11. születésnapja, én ilyenkor szeretek visszanézni az első blogbejegyzésünkre (Akiket le kell nyilazni...) , majd körülnézni mit is gondoltam a "détás" világról sok-sok évvel ezelőtt. Az idei visszatekintő olvasás során különösen érdekesnek találtam, hogy annak idején mennyire nem volt látható előre a big data jelenség berobbanása.

big_data_eredetmonda_gaspar_csaba_dmlab_1.png2013 végén már arról írunk, hogy mennyire mindent elsöpört abban az évben a big data (2013 - Ami tényleg történt - A nagy változás), hogyan hódította meg mainstream médiát is ez új szemlélet / divat / jelenség. Míg maga az egész folyamatot elindító Hadoop rendszer 2005-ben indult, nyolc év kellett ahhoz, hogy jelentős szerephez is jusson az adat feldolgozásával foglalkozó IT szegmensben. 

Nyolc év soknak tűnik elsőre, de a valóság az, hogy ennél sokkal rövidebb idő alatt robbant be a köztudatba. Hogy szemléltessem ezt megnéztem, hogy mikor írtuk ki a blogra először azt, hogy big data. 2011 májusában használtuk először ezt a szót a blogon (Adattárház Fórum 2011 - Beharangozó), ott is abban az összefüggésben hogy a konferencián futó előadásom "Adatbányászat a BigData világában" címet viselte, amiben lényegében a Radoop megoldásunk alapötletéről, annak létjogosultságáról beszéltem. 

Annyira új dolog volt ez akkor, hogy még 2011 év elején több olyan cikket is írtunk a blogon, ami az eljövendő trendekről ír, és ezekben a Hadoopnak, big data világnak még nyoma sincs:

  • BI Évkönyv Konferencia - ÉlÅ‘ben (2011. március) - Ebben a posztban elég részletesen beszámolunk Arató Bence félnapos minikonfernciájáról, ahol az aktuális technológiai trendeket is összefoglalta. Big data szót én nem írtam le a beszámolóban, lehet hogy megemlítette Bence, de biztos hogy nem volt fajsúlyos gondolat. Az összefoglaló alapján akkor azt vártuk, hogy a mobil készülékeken futó BI, a gyors BI és a felhÅ‘ alapú BI megoldások fogják felforgatni a világot.
  • Dan Sommler - BI trendek a nagyvilágban (2011. április) - Ha valaki azt gondolja, hogy csak Magyarországon nem látszódott a jövÅ‘, azoknak jó példa lehet az ugyanabban az évben meghallgatott elÅ‘adás részletes beszámolója, ahol a Gartner nemzetközi BI trendekrÅ‘l alkotott elképzeléseirÅ‘l lehetett hallani. Itt még a nyílt forráskódú megoldások lassú erÅ‘södésérÅ‘l illetve arról lehetett hallani, hogy jön fel a felhÅ‘, a közösségi és a minta alapú BI - bármit is jelentsen ez az utóbbi fogalom. 

bi_trends_2010_dmlabbudapest_gasparpapanekcsaba.pngTrendek címkefelhőbe foglalva (2010. január) - Ez egy bő évvel korábbi anyag, amiben az előző évek BI trendelemzési cikkeinek tartalmát hasonlítottam össze, és jeleztem melyik kifejezés erősödik, melyik gyengül az adott években (átmásoltam ehhez a poszthoz a címkefelhőt (ez akkor még menő vizualizáció volt) - szavak mérete az előfordulással arányos, a piros szavak erősödtek, a kékek kikoptak az előző évek trendelemző cikkeinek szóhasználatához képest). Látható hogy a közösségi hálók, a performance management, az SaaS vonal erősödött. Ha nagyon bele akarja látni valaki a big data előképét, akkor a cloud és a real time kulcsszavak is megjelentek, de aki emlékszik arra, hogy akkor ez mit jelentett a BI-ban, az jól érzi, hogy valójában közük sem volt a big data-hoz.

 

A fenti, szó szerint historikus adatok alapján azt lehet mondani, hogy a hazai és nemzetközi "adatos" közösséget két év alatt tarolta le a big data láz. És ez nem csak a szavak szintjén értendő: az egész adatos ökoszisztéma, a piac, az adatokhoz való viszony, a témával foglalkozó szakemberek létszáma, köre, a használt technológiák mind-mind gyökeresen átalakultak azóta. Szinte már kínos olvasni, mennyire mást gondoltunk a BI jövőjéről a kétezer-tizes évek első éveiben, mint ami most az évtized végén megvalósult.

Tanulság számomra az, hogy ebben a forrongó, változó, zajos adatos környezetben méginkább felértékelődnek a veterán szakemberek tapasztalata. És őket is csak arról érdemes kérdezni, hogy hol vagyunk most - és kevésbé arról, hogy mit fog hozni a területen a következő 5 év.  

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Találós kérdés

Találós kérdés

c.pngImént egy régi Forbes magazin került a kezembe, amiben egy általam nagyra becsült emberrel készítettek interjút. Az utolsó kérdés-választ idézném itt a cikkből.  

- A világ jelentős része az ön útmutatása alapján keresi a boldogságot. Emlékszik, mi volt élete legboldogabb pillanata?


- Nem volt egyetlen kiemelkedő pillanat, a család és a munka tesz boldoggá. Mostanában annak örülök leginkább, ha valami érdekes és váratlan összefüggést találok az adatokban.

Találós kérdésem a következő: kivel készült az interjú?

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

A lendület megszerzése

A lendület megszerzése

Egy korábbi posztunkban 5 pontban foglaltuk össze, hogyan tudjuk a cégünket az adatokban rejlő lehetőségek kiaknázásában előremozdítani. Az első pont a lelkesedés és lendület megszerzése, posztunkban ezt a kérdést járjuk körül.

Egy cég, egy szervezet fejlődési ugrása során egy olyan akadályon kell átjutnia, ami erős változást és így bizonyos fajta ellenállást is tartalmaz. Mikor valaki az adatelemzés irányába akar nyitni, általában már rögzített, jól vagy kevésbé jól, de működő folyamatokat, szemléletet akar megváltoztatni. Ebből kifolyólag az első visszajelzések elutasítóak, gyakran negatívak, azaz a motivációnkat a jelenlegi környezetünkön kívülről kell szerezni (ha cégen belülről fakadna ez természetesen, akkor a cég magától már adatvezérelté vált volna). Ilyen motivációs erőt jelent, ha lelkesedést, valamifajta lendületet gyűjtünk a cégünk adatközpontúbbá tételéhez. Ezt két lépcsőben lehet tenni:

b_1.jpgLelkesítsd be magad! - Érdemes magunkkal, nyilván itt van a legnagyobb cselekvési lehetőségünk. Ekkor ne technológiákról, megoldásokról, adatelemzési módszertanokról olvassunk, hanem keressünk olyan videókat, írásokat, hanganyagokat, esetleg könyveket, melyek inspirálnak. Ezekben olyan történetekre érdemes vadászni, ahol valaki arról lelkendezik, hogyan változtatta meg a környezetét az adatelemzés. Itt direkt előny, ha nem a saját iparágunkhoz kötődik a sztori, akkor nem azon fog járni az agyunk, hogyan adaptálható az adott módszer nálunk. Ezek a legtöbb esetben profi médiatermékek, melyeket gyakran nem is adatelemzők írnak. Onnan tudod, hogy megfelelő anyag került a kezedbe, hogy mikor végeztél vele, akkor egyszerűen azt érzed, hogy tényleg változott a szemléleted, valamit nagyon szeretnél máshogy tenni, hogy valamit most nagyon kezdeni akarsz az adataiddal. 

Néhány ötlet ilyen anyagokra (ezek az én személyes kedvenceim):

  • Videó (18 perc) - Amy Webb: How I hacked online dating - Szórakoztató és fordulatokban gazdag történet arról, hogy adatelemzÅ‘s szemléletével mire jutott az elÅ‘adó az online randioldalakon.
  • Film (133 perc) - Moneyball / Pénzcsinálók - Igaz történetet feldolgozó film, amiben Brad Pitt egy kis költségvetésű baseball csapatot hihetetlenül sikeressé tesz azzal, hogy adatelemzéssel támogatva választja ki a megvásárolandó játékosokat. 
  • Könyv (260 oldal) - Numerátorok - Interjúkötet olyan emberekkel, akik a saját üzleti területüket alapvetÅ‘en felforgatták az adatelemzés segítségével. 
  • "Képeskönyv" (260 oldal) - Information is Beautiful - Infografikákat tartalmazó képeskönyv, amit újra és újra érdemes végiglapozni.  Mint egy felnÅ‘tteknek szóló Tesz-vesz város: akárhanyadik végiglapozás során is fogsz találni valami érdekeset. 

A big data jelenség közbeszédbe való 2014-es berobbanása óta ilyen lelkesítő anyagból rengeteg született, néhány egyszerű kereséssel könnyen találunk olyanokat, melyek a mesterséges intelligencia, az önvezető autók, a teljesen adatvezérelt cégek, az automatizálás irányából fogják meg a dolgot. Nézzünk meg, olvassunk el többet is, ne feltétlenül okosabbak, inkább elszántabbak, tettrekészekké kell válnunk tőlük. 

c.jpgLelkesítsük be a csapatod! - Nem hiába emelem ki ezt külön: teljesen más módszerek jönnek itt szóba a fentiekhez képest. Ha csak elkezded küldözgetni a kollégádnak vagy a főnöködnek a grandiózus cikkeket és videókat, inkább hátráltatni fogod a folyamatot, mint segíteni. Fontos itt kiemelni, hogy egy ilyen hordejerű változást az egész cégre vonatkoztatva akkor tudsz elérni, ha te vezeted a cégedet, vagy legalábbis benne vagy a vezetésben. Ezért érdemes inkább a saját embereidre, a közvetlen munkatársaidra, esetleg egy erre fogékony egyik vezetődre koncentrálni. 

Egy csapat belelkesítésére nem ismerek recepteket, de láttam jónéhány sikeres és sikertelen példát. A sikeresek kétfajta csoportba oszthatók:

  1. Az illető a saját lelkesedésétől fűtve összeszedett annyi kompetenciát, hogy egy kisebb adatalapú megoldást készített egy hagyományos feladatára. Néha ez egy megbolondított Excel, néha egy riportáló eszköz, de volt aki egy teljes funkcionalitással bíró analitikus CRM modult is összerakott. Mikor elkészült a megoldás, általában híre ment a cégen belül a dolognak, ami követ dobott az állóvízbe. Fontos ugyanakkor, hogy ezek a mini rendszerek általában gerilla IT megoldások, és emiatt hosszú távon csak kivételes esetben lesznek ezek a programok tényleges céges megoldások. Ez utóbbi jelenséget sokszor nagyon nehezen élik meg azok, akik adatelemzési szemléletét végül átveszi a cég, de másik IT megoldást kezd építeni a feladatra.
  2. A másik lehetőség, hogy a szervezetfejlesztési, képzési vonalba illesztenek be olyan elemeket, amik kapcsán a kollégák is betekintést nyernek a big data lehetőségeibe. Több cégnél is vannak fakultatívan látogatható ismeretbővítő előadássorozatok, gyakran ebbe integrálnak témába vágó inspirációs előadásokat. Mi évente hét-nyolc ilyet előadást tartunk különböző cégeknél. Ezekben a közös minta az, hogy a meghirdetett előadásra a cég központjának minden dolgozója a marketingestől kezdve a rendszergazdákon át egészen a HR-esekig. Ennek megfelelően itt egy olyan ívet rajzolunk fel, ami bemutatja miképpen szövi át a big data világa a hétköznapjainkat kezdve a nagyvállalati marketingtől, a Facebook hirdetéseink át egészen a telefonunkon levő játékokig. Egy ilyen alkalom után még sokszor ott maradok beszélgetni a leglelkesebb résztvevőkkel, a vezetők számára az ő nevük megjegyzése talán az egyik legértékesebb hozadéka egy ilyen alkalomnak. 

Ha egy vezetőben elég erős az elszántság, sokszor ki is hagyják a csoport belelkesítését. Egyszerűen átugranak a második lépcsőre, a kompetencia növelésre: workshopokat szerveznek a dolgozók adatelemzési ötleteinek becsatornázására, vagy adatelemzős céges belső kurzust szerveznek, ahova önkéntes alapon jelentkezhetnek az emberek. Gyakran ekkor derül ki, hogy bár a vezető csak mostanában kezdett az adatokban rejlő erő kiaknázásával foglalkozni, de az kollégái már régóta lelkesek és csak a megfelelő felhatalmazás és támogatás hiányzott eddig. 

A sorozatot folytatva később a következő lépéssel, a kompetencia növelés hogyanjával foglalkozunk.

 

Érdekes lenne a céged számára egy ilyen lelkesítő előadás megtartása? Beintegrálnál egy inspirációs workshopot az általad vezetett digitális transzformációs projektbe. Keress minket bátran:

Gáspár Csaba - +36-20-8234154  vagy info@dmlab.hu 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Versbe szedett szakma

Versbe szedett szakma

Varró Dani írt az NNG felkérésére néhány gyerekverset, amiben egy-egy mai szakmát népszerűsít a gyerekek számára. �gy lett versbe szedve az adattudós (data scientist) és a machine learning szakértő élete. A versek zseniálisak, engem a legjobban mindkét vers utolsó sora fogtak meg leginkább. A képek külön zseniálisak, azokat a könyvek stílusát idézik meg bennem, melyeket én magam forgattam tizenegy-néhány éves koromban, illetve azt is megérthetjük belőle, hogy miért pont a csivava és a muffin megkülönböztetésével foglalkozik egy "gépi tanuló tanítója".

Varró Dániel: Adattudós

 

a.jpgHa én úgynevezett adattudós volnék,
minden kis adatnak mélyére hatolnék.
Minden jelenségnek a mélyére ásnék,
big data scientist volna nevem másképp.

Az adattengerbe fejest ugranék én,
hajóroncsok közt a kincset keresgélném,
kutakodnék ott lent verejtékkel, könnyel,
s a felszínre úsznék egy kis igazgyönggyel.

Kifigyelnék mindent lopva, mint a kémek,
kik néznek a neten kínos-fókás mémet,
addig kutatnék, míg meglenne a jóslat:
néznek-e utána cicás videókat.

Sok tényt elemeznék ki az adatokból,
olyat is, mi meglep, olyat is, mi sokkol.
Egy nagy színes ábrán adnék róla képet,
akkor lennék boldog, ha megértenének.

Varró Dániel: Machine Learning szakértő

 

b.jpgRendőr, postás, pék is lennék,
kertésznek is vígan mennék,
de leginkább azért főleg
machine learning szakértőnek.

Nem törődnék semmi mással,
mint a gépi tanulással.
Megtanítanám a gépem,
hogy kell viselkedni szépen.

A férfiaktól a nőket
hogy különböztesse ő meg,
s mi egymástól nem áll távol:
a muffint a csivavától.

Ha ráunt a kiskutyákra,
emberekkel diskurálna,
ámuldozna ám a jónép,
milyen okos számítógép!

Tanítgatnám, nevelgetném,
adatokkal etetgetném,
s ha már kapott elég ételt,
ronggyá verné Lékó Pétert.

Én lennék a soselátott,
bablevesbe belemártott,
sakkozókat kiborító
számítógép idomító!

A verseket tartalmazó könyv ingyen elérhető az alábbi oldalon: Ha nagy leszek..

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Versbe szedett szakma

Versbe szedett szakma

Varró Dani írt az NNG felkérésére néhány gyerekverset, amiben egy-egy mai szakmát népszerűsít a gyerekek számára. �gy lett versbe szedve az adattudós (data scientist) és a machine learning szakértő élete. A versek zseniálisak, engem a legjobban mindkét vers utolsó sora fogtak meg leginkább. A képek külön zseniálisak, azokat a könyvek stílusát idézik meg bennem, melyeket én magam forgattam tizenegy-néhány éves koromban, illetve azt is megérthetjük belőle, hogy miért pont a csivava és a muffin megkülönböztetésével foglalkozik egy "gépi tanuló tanítója".

Varró Dániel: Adattudós

 

a.jpgHa én úgynevezett adattudós volnék,
minden kis adatnak mélyére hatolnék.
Minden jelenségnek a mélyére ásnék,
big data scientist volna nevem másképp.

Az adattengerbe fejest ugranék én,
hajóroncsok közt a kincset keresgélném,
kutakodnék ott lent verejtékkel, könnyel,
s a felszínre úsznék egy kis igazgyönggyel.

Kifigyelnék mindent lopva, mint a kémek,
kik néznek a neten kínos-fókás mémet,
addig kutatnék, míg meglenne a jóslat:
néznek-e utána cicás videókat.

Sok tényt elemeznék ki az adatokból,
olyat is, mi meglep, olyat is, mi sokkol.
Egy nagy színes ábrán adnék róla képet,
akkor lennék boldog, ha megértenének.

Varró Dániel: Machine Learning szakértő

 

b.jpgRendőr, postás, pék is lennék,
kertésznek is vígan mennék,
de leginkább azért főleg
machine learning szakértőnek.

Nem törődnék semmi mással,
mint a gépi tanulással.
Megtanítanám a gépem,
hogy kell viselkedni szépen.

A férfiaktól a nőket
hogy különböztesse ő meg,
s mi egymástól nem áll távol:
a muffint a csivavától.

Ha ráunt a kiskutyákra,
emberekkel diskurálna,
ámuldozna ám a jónép,
milyen okos számítógép!

Tanítgatnám, nevelgetném,
adatokkal etetgetném,
s ha már kapott elég ételt,
ronggyá verné Lékó Pétert.

Én lennék a soselátott,
bablevesbe belemártott,
sakkozókat kiborító
számítógép idomító!

A verseket tartalmazó könyv ingyen elérhető az alábbi oldalon: Ha nagy leszek..

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Milyen lépések mentén tudod bevezetni a céged a big data világába

Milyen lépések mentén tudod bevezetni a céged a big data világába

Egy szervezetfejlesztési workshop során össze kellett gyűjtenünk, hogy milyen módon közelednek a big data világához az általunk támogatott cégek. Egy izgalmas ív került felrajzolásra, ami különösen tanulságos azoknak, akik érzik, szeretnének 2018-ban előrébb lépni az adatok adta lehetőségek kihasználásában. 

a.jpeg

A folyamatot öt fő lépésre lehet bontani:

  1. Lendület és lelkesedés megszerzése - Első lépésben nyitottságra és lelkesedésre van szükség, hogy megmozduljon valami. Ez általában két lépésben történik, először a cég vagy szervezeti egység egyik meghatározó egyénisége rákap a big data ízére: olvas egy jó cikket a neten, egy lelkesítő előadást hall egy konferencián, vagy egyszerűen beleszeret a témába egy régen látott rokonnal beszélgetve. Ezt a lelkesedést általában érdemes kicsit átragasztani a többi szereplőre is, erre remek lehetőségeket adnak a különböző olyan belső workshopok, ahol egy általános big data előadással alapozzuk meg a kollégák pozitív hozzáállását az ügyhöz (ilyen előadásokat mi is szoktunk vállalni, de erről majd később). 
  2. Kompetencia gyűjtése - Kellő induló lendület után a big data világához kapcsolódó kompetenciák gyűjtése a cél. Ez lehet új munkatársak bevonása is, de akár belső adatelemzési kurzusok, vagy megfelelő külső partnerekkel való bizalmi kapcsolat kialakítása is ide kapcsolódik. 
  3. Validáció - A következő fázisban a kompetenciákra támaszkodva kiválasztásra kerül, hogy milyen fajta folyamatokat érdemes átalakítani adatvezérelté. Ez egy részben üzleti feladat, hiszen azt is vizsgálni kell, hogy elérhetőek-e azok az adatok már a cégen belül, amik kulcsszerepet kapnak a ebben a megközelítésben. Itt konkrét adatelemzési feladatok ritkán valósulnak meg, sokkal inkább az újszerű, innovatív adatfelhasználás létjogosultságát kell ellenőrizni.
  4. Proof-of-concept - Ha tudjuk, hol lenne érdemes a big data módszereket használni, nem egy rendszert kell egyből építeni: sokkal fontosabb, hogy ellenőrizzük, hogy megfelelő szinten megoldható-e az data science feladat, amit kitűztünk magunk elé. Ekkor tipikusan historikus adatokon bizonyítjuk, hogy egy jó adatelemzési módszerrel elérhető az üzleti értelemben vett előrelépés az adott módszerrel. Az data science feladatok megoldásán, a gépi tanulási eljárások futtatásán túl ekkor lehet pontosabb megtérülési számításokat is végezni.
  5. Rendszer építése - Ha bizonyításra került, hogy a gépi tanulási eljárásokkal korábban is tudtunk volna előnyöket elérni, akkor érdemes ezeket a jelenben és a jövőben meg is szerezni. Ehhez egy olyan rendszert kell építeni, ami a big data megoldást folyamatosan üzemelteti, időről-időről időre ellenőrzi működését, számszerűsíti az általa elért többletet. Sokan azt hiszeik, hogy ez már csak egy apró lépés az előző pont után, de a valóság az, hogy ami a már ismert múltbeli adatokon jól működött, az jelentős mennyiségű fejlesztést és integrációs feladatot követelhet, ha egy teljes rendszerbe kell azt integrálni. 

Látható, hogy az öt lépés során bárhol el tud akadni a folyamat. Vagy azért, mert a prioritások máshova viszik a fókuszt, és nem szerzi meg a cég a megfelelő kompetenciát, vagy mert a proof-of-concept megoldás eredménye nem jelzi egyértelműen, hogy érdemes egy új rendszert építeni.

Ugyanakkor a fenti modell abban tényleg nagyon sokat segít, hogy azonosítani lehessen, mire is van valakinek szüksége. Például, ha még csak lelkes vagy a big data világa iránt, nem feltétlenül kell még egy konkrét technológia, platform mellett elköteleződnöd, ráérsz ezt majd a 4. és 5. pont között megtenni - még akkor sem, ha úgy gondolod, hogy egyből olyan kompetenciákat akarsz megszerezni, ami a majdani technológiákhoz szervesen kapcsolódik. 

Ha te is éppen a big data világába szeretnéd jobban bevinni a céged, érdemes elgondolkodni, hogy hol is tartasz a fenti folyamatban, és arra fókuszálni, ahol ténylegesen vagy. Tapasztalataink szerint nem érdemes kihagyni egyetlen fejlődési fázist sem, később ez mindig megbosszulja magát. 

Szívesen írunk a fenti fázisokról még tapasztalatokat, áruld el nekünk, neked melyik fázis izgalmas éppen:

Melyik lépést fejtsük ki bővebben - Szavazás

(Kép forrása)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Milyen lépések mentén tudod bevezetni a céged a big data világába

Milyen lépések mentén tudod bevezetni a céged a big data világába

Egy szervezetfejlesztési workshop során össze kellett gyűjtenünk, hogy milyen módon közelednek a big data világához az általunk támogatott cégek. Egy izgalmas ív került felrajzolásra, ami különösen tanulságos azoknak, akik érzik, szeretnének 2018-ban előrébb lépni az adatok adta lehetőségek kihasználásában. 

a.jpeg

A folyamatot öt fő lépésre lehet bontani:

  1. Lendület és lelkesedés megszerzése - Első lépésben nyitottságra és lelkesedésre van szükség, hogy megmozduljon valami. Ez általában két lépésben történik, először a cég vagy szervezeti egység egyik meghatározó egyénisége rákap a big data ízére: olvas egy jó cikket a neten, egy lelkesítő előadást hall egy konferencián, vagy egyszerűen beleszeret a témába egy régen látott rokonnal beszélgetve. Ezt a lelkesedést általában érdemes kicsit átragasztani a többi szereplőre is, erre remek lehetőségeket adnak a különböző olyan belső workshopok, ahol egy általános big data előadással alapozzuk meg a kollégák pozitív hozzáállását az ügyhöz (ilyen előadásokat mi is szoktunk vállalni, de erről majd később). 
  2. Kompetencia gyűjtése - Kellő induló lendület után a big data világához kapcsolódó kompetenciák gyűjtése a cél. Ez lehet új munkatársak bevonása is, de akár belső adatelemzési kurzusok, vagy megfelelő külső partnerekkel való bizalmi kapcsolat kialakítása is ide kapcsolódik. 
  3. Validáció - A következő fázisban a kompetenciákra támaszkodva kiválasztásra kerül, hogy milyen fajta folyamatokat érdemes átalakítani adatvezérelté. Ez egy részben üzleti feladat, hiszen azt is vizsgálni kell, hogy elérhetőek-e azok az adatok már a cégen belül, amik kulcsszerepet kapnak a ebben a megközelítésben. Itt konkrét adatelemzési feladatok ritkán valósulnak meg, sokkal inkább az újszerű, innovatív adatfelhasználás létjogosultságát kell ellenőrizni.
  4. Proof-of-concept - Ha tudjuk, hol lenne érdemes a big data módszereket használni, nem egy rendszert kell egyből építeni: sokkal fontosabb, hogy ellenőrizzük, hogy megfelelő szinten megoldható-e az data science feladat, amit kitűztünk magunk elé. Ekkor tipikusan historikus adatokon bizonyítjuk, hogy egy jó adatelemzési módszerrel elérhető az üzleti értelemben vett előrelépés az adott módszerrel. Az data science feladatok megoldásán, a gépi tanulási eljárások futtatásán túl ekkor lehet pontosabb megtérülési számításokat is végezni.
  5. Rendszer építése - Ha bizonyításra került, hogy a gépi tanulási eljárásokkal korábban is tudtunk volna előnyöket elérni, akkor érdemes ezeket a jelenben és a jövőben meg is szerezni. Ehhez egy olyan rendszert kell építeni, ami a big data megoldást folyamatosan üzemelteti, időről-időről időre ellenőrzi működését, számszerűsíti az általa elért többletet. Sokan azt hiszeik, hogy ez már csak egy apró lépés az előző pont után, de a valóság az, hogy ami a már ismert múltbeli adatokon jól működött, az jelentős mennyiségű fejlesztést és integrációs feladatot követelhet, ha egy teljes rendszerbe kell azt integrálni. 

Látható, hogy az öt lépés során bárhol el tud akadni a folyamat. Vagy azért, mert a prioritások máshova viszik a fókuszt, és nem szerzi meg a cég a megfelelő kompetenciát, vagy mert a proof-of-concept megoldás eredménye nem jelzi egyértelműen, hogy érdemes egy új rendszert építeni.

Ugyanakkor a fenti modell abban tényleg nagyon sokat segít, hogy azonosítani lehessen, mire is van valakinek szüksége. Például, ha még csak lelkes vagy a big data világa iránt, nem feltétlenül kell még egy konkrét technológia, platform mellett elköteleződnöd, ráérsz ezt majd a 4. és 5. pont között megtenni - még akkor sem, ha úgy gondolod, hogy egyből olyan kompetenciákat akarsz megszerezni, ami a majdani technológiákhoz szervesen kapcsolódik. 

Ha te is éppen a big data világába szeretnéd jobban bevinni a céged, érdemes elgondolkodni, hogy hol is tartasz a fenti folyamatban, és arra fókuszálni, ahol ténylegesen vagy. Tapasztalataink szerint nem érdemes kihagyni egyetlen fejlődési fázist sem, később ez mindig megbosszulja magát. 

Szívesen írunk a fenti fázisokról még tapasztalatokat, áruld el nekünk, neked melyik fázis izgalmas éppen:

Melyik lépést fejtsük ki bővebben - Szavazás

(Kép forrása)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

(Hallgatóknak rövidítve:)

BME választható tárgyak hiteles előadóktól:

- Alkalmazott adatelemzés (K-Cs 12h) minden órán laptopoddal dolgozol, Python, R és SAS + data science és gépi tanulás alapjai
- 'Big Data' elemzési eszközök nyílt forráskódú platformokon (Sz 12h) Hadoop, Spark, teljes big data stack

Go to Neptun!

a.jpg

(Külsősöknek, részletek után érdeklődőknek)

Idén is meghirdetjük a BME-n tartott legfontosabb tárgyainkat külsősök számára is. Ez azt jelenti, hogy a műegyetemista hallgatókkal együtt szeptember elejétől 14 héten keresztül lehet a data science és a big data világába betekintést kapni. 

A kezdeményezés igen népszerű, de a helyek számát korlátozzák (1) a rendelkezésre álló termek méretei, illetve (2) az az elvünk, hogy nem engedünk be több külsős érdeklődőt a tárgyra, mint ahány egyetemi hallgató jelentkezett az órára.

 

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Az iteratív módon fejlesztett adatfeldolgozó eljárások vannak a középpontban, az adatelemzés programozási nyelveit tanítjuk nektek. A téma a data science alapfeladatainak megoldása abban az esetben, ha valamilyen programozási nyelven kell megoldani a problémát: SAS programozási nyelvet, Python és R programozást tanítunk úgy, hogy az órákon mindenki a saját gépén ugyanúgy készíti a programkódot, mint az előadó a kivetítőn. Igazi közös gondolkodás, szemléletátadás is így válik lehetségessé, hiszen itt tényleg bezavarnak a valós adatok sajátosságai, nem minden csodaszép, mint a machine learning könyvekben. 

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Szerda 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Itt a Dmlab big data szakemberei adnak betekintést a területen kialakult technológiai stack felépítésébe. A MapReduce, Hadoop alapoktól indulunk, és a legújabb technológiákig jutunk el. Nyilván mindben teljesen nem fogunk tudni elmélyedni, de aki ezt a kurzust végighallgatja, az könnyen fog tájékozódni a big data technológiák között. A félév végén egy ZH és egy házifeladat alapján kapnak jegyet a hallgatók, külön kérésre a külsős kollégák is megmérettethetik magukat ezeken a számonkéréseken.

Mindkét tárgyra itt tudtok külsősként jelentkezni: JELENTKEZÉS

A jelentkezés alapvetően jelentkezési sorrendben történik, várhatóan a hét végén fogunk eredményt hirdetni. A hírlevélre feliratkozók között már néhány nappal korábban már kiküldtük az információt. A részvételnek nincs külön feltétele, a kurzuson való részvétel ingyenes. Van lehetőség arra is, hogy hivatalosan beiratkozz néhány tízezer Forintért a BME-re erre a tárgyra, ebben az esetben hivatalosan le is vizsgáztatunk, és mint hallgató vehetsz részt a tárgyon. 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

(Hallgatóknak rövidítve:)

BME választható tárgyak hiteles előadóktól:

- Alkalmazott adatelemzés (K-Cs 12h) minden órán laptopoddal dolgozol, Python, R és SAS + data science és gépi tanulás alapjai
- 'Big Data' elemzési eszközök nyílt forráskódú platformokon (Sz 12h) Hadoop, Spark, teljes big data stack

Go to Neptun!

a.jpg

(Külsősöknek, részletek után érdeklődőknek)

Idén is meghirdetjük a BME-n tartott legfontosabb tárgyainkat külsősök számára is. Ez azt jelenti, hogy a műegyetemista hallgatókkal együtt szeptember elejétől 14 héten keresztül lehet a data science és a big data világába betekintést kapni. 

A kezdeményezés igen népszerű, de a helyek számát korlátozzák (1) a rendelkezésre álló termek méretei, illetve (2) az az elvünk, hogy nem engedünk be több külsős érdeklődőt a tárgyra, mint ahány egyetemi hallgató jelentkezett az órára.

 

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Az iteratív módon fejlesztett adatfeldolgozó eljárások vannak a középpontban, az adatelemzés programozási nyelveit tanítjuk nektek. A téma a data science alapfeladatainak megoldása abban az esetben, ha valamilyen programozási nyelven kell megoldani a problémát: SAS programozási nyelvet, Python és R programozást tanítunk úgy, hogy az órákon mindenki a saját gépén ugyanúgy készíti a programkódot, mint az előadó a kivetítőn. Igazi közös gondolkodás, szemléletátadás is így válik lehetségessé, hiszen itt tényleg bezavarnak a valós adatok sajátosságai, nem minden csodaszép, mint a machine learning könyvekben. 

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Szerda 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Itt a Dmlab big data szakemberei adnak betekintést a területen kialakult technológiai stack felépítésébe. A MapReduce, Hadoop alapoktól indulunk, és a legújabb technológiákig jutunk el. Nyilván mindben teljesen nem fogunk tudni elmélyedni, de aki ezt a kurzust végighallgatja, az könnyen fog tájékozódni a big data technológiák között. A félév végén egy ZH és egy házifeladat alapján kapnak jegyet a hallgatók, külön kérésre a külsős kollégák is megmérettethetik magukat ezeken a számonkéréseken.

Mindkét tárgyra itt tudtok külsősként jelentkezni: JELENTKEZÉS

A jelentkezés alapvetően jelentkezési sorrendben történik, várhatóan a hét végén fogunk eredményt hirdetni. A hírlevélre feliratkozók között már néhány nappal korábban már kiküldtük az információt. A részvételnek nincs külön feltétele, a kurzuson való részvétel ingyenes. Van lehetőség arra is, hogy hivatalosan beiratkozz néhány tízezer Forintért a BME-re erre a tárgyra, ebben az esetben hivatalosan le is vizsgáztatunk, és mint hallgató vehetsz részt a tárgyon. 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

10 éves a dmlab

10 éves a dmlab

Hálás vagyok. Ennek az egyszerű gondolatnak mindenféle variációja kavarog a fejemben, mikor arra gondolok, hogy ma 2017 május 10.-én ünnepeljük a dmlab alakulásának tizedik évfordulóját. Ahogy a tíz évnyi élményt átpörgetem a fejemen, valahogy azt érzem, hogy ez nagyon jó tíz év volt. Annyira pozitív bennem az összkép, hogy szinte hitetlenkedve szedem össze az agyam rejtet zugaiból a nehézségek, a kudarcok élményeit. És mikor ezeket is sorba veszem, méginkább kereknek és jónak látom ezt az időszakot. Hálás vagyok azért, hogy így tekinthetek vissza.


picture1.pngHálás vagyok azokért, akikkel ezt az egészet tíz éve elindítottuk. Ha dmlab indulására gondolok, egy rövid TED videó jut eszembe, ami egy rövid vicces videó elemzésén keresztül mutatja be, hogyan indul el egy mozgalom (link). Kiemeli, hogy egy új kezdeményezés indításánál nem az azt indító vezető személye a legfontosabb, hanem annak az első egy-két társnak a döntése, akik elsőként hozzá csatlakozva vezetővé teszik. Hálás vagyok ezért Nagy Istvánnak, Főző Csabának, majd Ivónak, Prekónak, Attilának, Petinek, majd Gergőnek, Csabinak, Simonnak, és sokáig sorolhatnám ki mindenkinek, akik hittek abban, hogy lehet és érdemes a dmlab kötelékében valami újat és nagyszerűt alkotni.

Hálás vagyok azért a bátorságért és azért vakságért, vakmerőségért, ami ezt a csapatot jellemezte. Bátrak voltunk, mikor új és járatlan, kockázatos utakon kezdtünk el járni, és olykor vakmerők voltunk, mikor nem is voltunk képesek felmérni, mekkora fába vágtuk a fejszénket - és néha milyen jól jött, hogy emiatt megijedni, visszarettenni sem volt lehetőségünk. Hálás vagyok azért, mert ez a kísérletező kedv, ez a szabályok és a berögződött reflexeket felülírni akaró szemlélet, ez a kreatív energia mind a mai napig áthatja a csapatot.

Hálás vagyok, hogy a tíz év során időről-időre feltettük a kérdést magunknak mit és hogyan akarunk elérni közösen. Hálás vagyok Törőért, mert segített nekünk rátalálni egy őszinte és előremutató vízióra, segített megérteni, hogy ahogy a cégnek ugyanúgy eredménye, terméke, hogy milyen munkahelyeket hoz létre, hogy milyen kollegiális viszonyban és hogyan dolgozunk együtt, tudatosodott bennünk, hogy milyen ügyeket, célokat és cégeket szolgálunk és segítünk.

Hálás vagyok a sok projektért, pilotért és oktatásért, hálás vagyok a dmlab-ból induló, “spin-off-oló� startupért és azok sikeréért. Büszkék vagyunk rátok.

Hálás vagyok a tíz évet folyton átszövő változásokért. Még úgy is, hogy tudom, hogy nem minden változás fejlődés, és nem minden fejlődés gyarapodás volt a dmlabban. De álltuk a sarat, megtaláltuk az új helyzetekben a lehetőséget, és szinte kivétel nélkül ki tudtuk használni azt. A napokban kezembe került a dmlab egy kilenc éve született stratégiai terve. Mellbevágó volt belenézni, és látni hogy mennyire keveset változtak a lényegi dolgok tíz év alatt, miközben mégis minden megváltozott: a szakma, a piac, és mi magunk is mennyit fejlődtünk.

Köszönjük.

“Ez jó mulatság, férfi munka volt!�

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

10 éves a dmlab

10 éves a dmlab

Hálás vagyok. Ennek az egyszerű gondolatnak mindenféle variációja kavarog a fejemben, mikor arra gondolok, hogy ma 2017 május 10.-én ünnepeljük a dmlab alakulásának tizedik évfordulóját. Ahogy a tíz évnyi élményt átpörgetem a fejemen, valahogy azt érzem, hogy ez nagyon jó tíz év volt. Annyira pozitív bennem az összkép, hogy szinte hitetlenkedve szedem össze az agyam rejtet zugaiból a nehézségek, a kudarcok élményeit. És mikor ezeket is sorba veszem, méginkább kereknek és jónak látom ezt az időszakot. Hálás vagyok azért, hogy így tekinthetek vissza.


picture1.pngHálás vagyok azokért, akikkel ezt az egészet tíz éve elindítottuk. Ha dmlab indulására gondolok, egy rövid TED videó jut eszembe, ami egy rövid vicces videó elemzésén keresztül mutatja be, hogyan indul el egy mozgalom (link). Kiemeli, hogy egy új kezdeményezés indításánál nem az azt indító vezető személye a legfontosabb, hanem annak az első egy-két társnak a döntése, akik elsőként hozzá csatlakozva vezetővé teszik. Hálás vagyok ezért Nagy Istvánnak, Főző Csabának, majd Ivónak, Prekónak, Attilának, Petinek, majd Gergőnek, Csabinak, Simonnak, és sokáig sorolhatnám ki mindenkinek, akik hittek abban, hogy lehet és érdemes a dmlab kötelékében valami újat és nagyszerűt alkotni.

Hálás vagyok azért a bátorságért és azért vakságért, vakmerőségért, ami ezt a csapatot jellemezte. Bátrak voltunk, mikor új és járatlan, kockázatos utakon kezdtünk el járni, és olykor vakmerők voltunk, mikor nem is voltunk képesek felmérni, mekkora fába vágtuk a fejszénket - és néha milyen jól jött, hogy emiatt megijedni, visszarettenni sem volt lehetőségünk. Hálás vagyok azért, mert ez a kísérletező kedv, ez a szabályok és a berögződött reflexeket felülírni akaró szemlélet, ez a kreatív energia mind a mai napig áthatja a csapatot.

Hálás vagyok, hogy a tíz év során időről-időre feltettük a kérdést magunknak mit és hogyan akarunk elérni közösen. Hálás vagyok Törőért, mert segített nekünk rátalálni egy őszinte és előremutató vízióra, segített megérteni, hogy ahogy a cégnek ugyanúgy eredménye, terméke, hogy milyen munkahelyeket hoz létre, hogy milyen kollegiális viszonyban és hogyan dolgozunk együtt, tudatosodott bennünk, hogy milyen ügyeket, célokat és cégeket szolgálunk és segítünk.

Hálás vagyok a sok projektért, pilotért és oktatásért, hálás vagyok a dmlab-ból induló, “spin-off-oló� startupért és azok sikeréért. Büszkék vagyunk rátok.

Hálás vagyok a tíz évet folyton átszövő változásokért. Még úgy is, hogy tudom, hogy nem minden változás fejlődés, és nem minden fejlődés gyarapodás volt a dmlabban. De álltuk a sarat, megtaláltuk az új helyzetekben a lehetőséget, és szinte kivétel nélkül ki tudtuk használni azt. A napokban kezembe került a dmlab egy kilenc éve született stratégiai terve. Mellbevágó volt belenézni, és látni hogy mennyire keveset változtak a lényegi dolgok tíz év alatt, miközben mégis minden megváltozott: a szakma, a piac, és mi magunk is mennyit fejlődtünk.

Köszönjük.

“Ez jó mulatság, férfi munka volt!�

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

[BreakingNews] A Kaggle-t felvásárolta a Google

[BreakingNews] A Kaggle-t felvásárolta a Google

Ma hajnalban ütött be a hír, hogy a Google felvásárolta a legnagyobb adatbányászati versenyeket szervező oldalt, a Kaggle.com site-ot (első hír itt, hivatalosabbak itt , de a Google a blogposzt írásának időpontjában még hivatalosan nem jelentette be a tranzakciót). A vételárról nincsenek hírek, a 2010-es alapítása óta eddig 12,5 millió dollár befektetést tudott bevonni a cég.


kaggle_vs_google.pngA hír váratlanul ért, de sok szempontból nem annyira meglepő: a Google számára sok dolog jól jöhet a Kaggle portfóliójából. Kaggle a data science közösség egyik központi oldala, saját álláskereső oldalával és a közel félmillió felhasználójával (! - én ezt nem is nagyon akarom elhinni) jó merítés a cégnek már csak toborzási szempontból is. Ezen túlmenően a Kernels nevű kezdeményezésével a Kaggle egy saját gépi tanulási platformot is létrehozott, ami jól fog virítani a Google Cloud embléma alatt is. Talán ez az a pont, ahol mint Kaggle felhasználók a legtöbbet nyerhetünk. Nem hiába, a Google olyan cég, aki hisz az adatok erejében, miért ne hinné el, hogy a data scientist-ek világának közepét is érdemes birtokolnia. 


Másfelöl a felvásárlás azt is bizonyítja számomra, hogy az adatokkal dolgozó cégek és szakemberek univerzumában a nagy techóriások egyfajta hatalmas gravitációjú csillagoknak tekinthetők: egyre gyorsabban szippantják be az ígéretes kezdeményezéseket, az igazán izgalmas dolgok körülöttük történnek. Az itt felhalmozódó hatalmas adat- és tudásvagyonnal egyre nehezebben fognak versenyezni azok a vállalatok, melyek homlokterében az adatokkal való munka egyfajta megtűrt hobby vagy kényszerű próbálkozás.

google_vs_kaggle_1.pngPéldául a napokban találkoztam olyan nagyvállalattal, ahol egyenesen az volt a vélemény, hogy félnek belső kompetenciát építeni, mert ha valaki megtanulná ezt a szakmát a cégen belül, azt biztos hamar lecsábítanák az ilyen emberekre vadászó más cégek. Pedig hosszú távon valójában fordított tendenciák várhatók: hosszú távon az adatvezérelt gondolkodás, az adatokkal való barátság inkább alapkövetelményként fog megjelenni, mint szelekciós szempontként. De a lemaradók megnyugtatására és az élenjárók szomorúsága végett le kell szögeznem: mint minden változás, aminek az emberi fejekben kell végbemennie, sokkal lassabban fog megvalósulni, mint amekkora tempót maga a technológia diktál. 

Gratulálunk a Kaggle csapatának!

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Big data nyugati és keleti szemléletben

Big data nyugati és keleti szemléletben

A Műegyetem büféjében egy közgazdász kolléganőnktől hallottam egy érdekes gondolatot (mémet), melyen az elmúlt hónapban sokat morfondíroztam. Zsuzsa meglátása szerint az európai kultúrában a gazdaságban megjelenő adatokhoz, az azokban megjelenő összefüggésekhez, a ma big data néven futó jelenséghez külön nyugati és keleti (bizánci) megközelítés tartozik. A nyugati gondolkodásmódban az adatokra támaszkodva növelhetjük a hatékonyságunkat, alkalmazkodhatunk a változó környezethez, versenyelőnyhöz juthatunk - így az adatelemzés célja tipikusan a profitnövelés irányába mutat. A keleti (bizánci) szemléletben az adatok gyűjtésének célja az ellenőrzés, az állami vagy egyéb hatalom felügyeleti tevékenységéhez tartozik - célunk az ellenőrzés, a kitűzött célok végrehajtásának ellenőrzése. 

east-vs-west.jpgValóban kézzelfoghatóan különválik ez a két szemlélet, még akkor is, ha egy-egy jól működő szervezeten belül mindkettőnek meg kell jelennie. Ha technológiai szemmel nézzük az gépi tanulási feladatok előrejelzéshez köthető részei inkább a profitmaximalizáló, hatékonyságnövelő szemlélethez köthető, míg az én látásmódomban kicsit a klaszterezés és nagy mértékben az anomália detekció a felügyelő / ellenőrző látásmódhoz köthető. Egy BI vagy riporting rendszer magában nem köthető egy-egy területhez, de a használatuk mögötti motiváció gyakran az egyik szemlélethez húz. 

Az elmúlt héten áttekintettem a fenti szempontból a 2016-os projektjeinket (jó lehetőséget adott erre, mikor az Éviránytű évértékelő munkafüzetét töltöttem ki), és egyértelműen szátváltak erre a két csoportra, még akkor is, ha egyes partnereknél végül mindkét irány megjelent. Az egyik legtipikusabb példa, mikor kamionsofőrök fogyasztási szokásainak elemzését végeztük: elsőként úgy volt megfogalmazva az üzleti kérdés, hogy találjuk meg, mi a különbség a jól fogyasztási adatokkal futó sofőrök és a több üzemanyagot használó kollégáik között. A projekt végkicsengésénél viszont megjelent az az igény, hogy mennyivel jobb lenne a sofőr szokásai, az útviszonyok, az időjárás és a rakomány figyelembevételével olyan útvonaltervezést megvalósítani, ahol a becsült üzemanyagköltséggel és a különböző útdíjakkal egyszerre tudnánk számolni.

Elgondolkodtam azon is, vajon milyen szemlélet jellemző hazai cégekre? Ez cégkultúrától függ, ami alakítható - így talán nem is ez a jó kérdés. Ha az egyének szintjén vizsgáljuk a kérdést, azt mondhatjuk, hogy a magyarok alap beállítottsága inkább a keleti szemlélethez húz. Jó példázza ezt nekem, hogy mikor egy társaságban elmesélem, hogy egy jó és egy rossz kamionsofőr között 3-4 liter fogyasztás-különbség is lehet 100 km-en, a legtöbben azt a zsigeri választ adják, hogy biztos lopják az üzemanyagot. Az adatokból látszik, hogy rengeteg oka lehet a különbségnek (például mennyit használja a tempomatot az vezető), de az alap asszociációnk oda mutat, az adatok valami kis stiklit, csalást, trükközést fognak felfedni.

Fontos kiemelni, hogy ez a kettősség nem a személyes adatokról vagy privacy védelméről szól - de mégis van ide vágó aspektusa. Képzeljük el, hogy a munkahelyünkön minden eddiginél pontosabb és jobb adatgyűjtést vezet be a főnökség, például pontosabb képet fognak kapni az egyes kollégák teljesítményéről. A változást lehet pozitívan látni ("végre látni fogják, milyen sokat tettem a cégért"), vagy negatív módon viszonyulni hozzá ("ki fogják szúrni, hogy pénteken hamarabb szoktam lelépni"), és utána ennek megfelelően lehet támogatni vagy szabotálni a bevezetést. Mindenkire rábízom, hogy mit tenne ő egy ilyen szituációban. 

Bármilyen is az alap beállítottságunk, erre rálátva tudatosan tudjuk integrálni a kétfajta szemlélet előnyeit. Izgalmasabb kérdés számomra, hogy mennyire más módon kell a különböző szemléletű cégeknél egy-egy megoldást bevezetni, mennyire más motivációk és félelmek uralják a gondolkodást a két esetben.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

A túlterhelt csomagküldÅ‘k esete – adatelemzÅ‘ szemmel

A túlterhelt csomagküldÅ‘k esete – adatelemzÅ‘ szemmel

Idén az adventi időszak kötelező feladatai közé bekerült a Posta illetve más csomagküldő szolgálatok szidása, miszerint miért nem készültek fel időben a karácsonyi dömpingre. Örök téma ez, bárkivel el lehet róla beszélgetni, mindenkit érint és mindenki ért hozzá - olyan mint az időjárás, a politika vagy a foci. A szállingózó történetek először idén is a Postáról szóltak, de az elmúlt hetekre végülis minden csomagküldőre kiterjedtek, végül nem egyetlen cég bénázásáról, hanem valami általánosabb jelenségről van szó.

Tudvalevő, hogy a karácsonyi webshop őrületre a csomagküldő szolgáltatók is készülnek. Ez a szektor az elmúlt évtized EU-s szabályozási változtatásai kapcsán egy fejlődő, sokszereplős és versenyezni képes iparággá nőtte ki magát, ahol a hétköznapi értelemben van innováció, a legtöbb cég vezetőit kőkemény üzleti racionalitás hatja át: a karácsony a legerősebb időszakuk, biztosan kalkuláltak a megnövekedett feladatokkal. Ahogy a hírekben hallható mentegetőzésből kijön, azt is tudták, hogy nemcsak több, hanem a tavalyinál jóval több csomagot kell elvinni majd. Több helyen is olvashatjuk, hogy a karácsonyi időszak csomagmennyisége évi 20%-kal növekedett az elmúlt években, így a legtöbb helyen erre a mennyiségre lőtték be a kapacitásaikat.

screen_shot_2016-12-22_at_23_44_33.pngÉs itt jön a fordulat - idén a 40%-kal több csomagot adtunk fel. Persze lehetne ezt a hazai webes áruküldés csodájaként is megélni, ünnepelhetnénk a hazai digitális fordulatot (mint ahogy sok más országban egy-egy black friday után a webes cégek azzal dicsekednek mennyivel dőltek meg az eddigi rekordok), ehelyett inkább azt hallhatjuk, hogy ez az óriási különbség mennyire váratlanul érte az előrejelzés szerint 20%-os emelkedésre számító szereplőket.

�BRA: Az eNet pont egy évvel ezelőtti infografikájából kivágott rész a hazai webes kereskedelem forgalmáról - Eredeti cikket is ajánlom figyelmetekbe: eNet: E-kereskedelmi körkép 2015

Adatelemzőként persze csak csóválom a fejem. Ha valami három éve 20%-ot nő, akkor a következő évre 20% növekedést prognosztizálni elsőre nem tűnik butaságnak. Csak akkor, ha valamit épp pont a web hajt. Hol hallottunk olyat egy webes trend kapcsán, hogy úgy örökké egyenletesen emelkedett? A weben a dolgok berobbanása vagy elhalása a gyakoribb. Mindemelett 40% növekedés nem berobbanás. És itt kezdek zavarba jönni adatok híján: vajon megvizsgálták a cégek, hogy a sok rendelés közül mely webáruházakra, mely termékcsoportokra volt jellemző a felfutás? Nagy összegekben mernék fogadni, hogy a többlet nem egyenletesen oszlik el. Vagy nem egyenletes vásárlói csoporton. A web világa csak eleinte "lassú víz partot mos" jellegű - később vagy nem lesz semmi, vagy jön a földcsuszamlás. Ez az óriási melléfogás bizony az előrejelzést végzők hibája - a csomagküldés piacát legjobban a webes kiskereskedelem hajtja, ennek elemzése nélkül nem lehet csak a görbére ránézni, és csak úgy továbbhúzni a vonalat.

Hallottam persze furfangos magyarázatokat is - szigorúan a felelősöket minél távolabb keresve. A kedvenc két témám a vasárnapi boltbezárás és a későn érkező hideggel magyarázza a dolgokat. Az első úgy jön a képbe, hogy a vasárnapi boltbezárás időszaka alatt a webáruházak jóval elfogadottabbak lettek az elmúlt években, ez a hatás "gyűrűzött" be most karácsonykor ennyire erősen. Egy másik elmélet azzal magyarázza a dolgokat, hogy későn jött be az igazán hideg hazákba, ami hatására mindig jobban felpörögnek az otthon melegéből rendelhető termékek forgalma. Egyik hatásra vonatkozó elemzéseket se ismerek, de mindkettő inkább műértő okoskodásnak tűnik elsőre.

Mit tegyenek a csomagküldők jövőre? Ezer ötletem van az adatelemzés területén kívülről is, kezdve a novemberben előre megvásárolható futárkapacitástól, a rendelés pillanatában előre kalkulált valós érkezési időpontig. Az adatok jobb kihasználása nem annyit tesz, hogy jövőre komolyabb aparátussal ki tudnak hozni 20+x százaléknyi várható forgalomnövekedést, és ezt higgye el mindenki. Itt folyamatokhoz kellene hozzányúlni, miközben extra nagy források a feladat megoldására nem állhat rendelkezésre.

Leginkább azokat az ajándékozni vágyókat sajnálom, akik félve figyelik a kaput, megjön-e még a csomagjuk karácsony este előtt. Drukkolunk nekik és bízunk hogy nem kuponok gyártásával telik majd a szombat délutánjuk.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Data science és big data képzések – ÉrdeklÅ‘dÅ‘k gyűjtése

Data science és big data képzések – ÉrdeklÅ‘dÅ‘k gyűjtése

A napokban sokan megkerestek milyen oktatásokat tartunk a közeljövőben, milyen BME-s előadásokat fogunk megnyitni a külsősök előtt, milyen cégre szabott oktatásokat lehet kérni tőlünk. Hogy ne csak azt mondhassuk, hogy a kövessétek a blogot, arra gondoltam jó ötlet gyűjteni az érdeklődők elérhetőségeti:

Ha szeretnél értesítést kapni előzetesen azokról a data science és big data oktatásokról, melyekben részt veszünk, regisztráld magadat az alábbi oldalon:

Érdeklődőként való regisztráció

proactive.pngA blogon továbbra is jelezni fogjuk az aktuális lehetőségeket, a blog hírlevelét (jelentkezés itt) most újítottuk meg, ott is megírjuk az információkat, ez a lista azonban nem hírlevél. Ha bejelölöd milyen típusú dolgok érdekelnek, és éppen indítunk valami ide vágó oktatást, akkor a regisztráltaknak proaktívan kiküldjük a rájuk vonatkozó információkat. 

Reméljük ez is segít majd azoknak, akik már most tervezik a jövő évi oktatási keretüket is. 

 

ideaw.gifHa nem tudtok várni arra, hogy megjelenjenek a meghirdetett oktatások, vagy egyedi igényetek van, keressetek meg bátran, a legtöbb oktatásunk cégre / személyre szabottan fut, keress meg minket, szívesen javaslunk tematikát és adunk ajánlatot.

Gáspár Csaba: gaspar.csaba@dmlab.hu  +36208234154

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Csavarjunk egyet az innovatív adatelemzési irányok keresésén

Csavarjunk egyet az innovatív adatelemzési irányok keresésén

crisp_dm.pngA Nagy Könyvben az áll, hogy egy valamirevaló adatbányászati / adatelemzési projektet a CRISP-DM (Cross Industry Standard Process for Data Mining) metodika szerint érdemes menedzselni. Eszerint egy projektnek hat fő fázisa van, (1) első lépésben megértjük az üzleti problémát, majd (2) a hozzá kapcsolódó adatokat, (3) adatátalakításokat végzünk, (4) gépi tanulási vagy statisztikai modelleket futtatunk, (5) kiértékeljük a kapott eredményeket üzleti szempontból, és persze ha minden klappol, akkor (6) hadrendbe állítjuk a megoldást. Nyilván ennél bonyolultabb a helyzet (a részletes leírást a metodikáról itt olvashatunk), szinte mindig van szükség iterációkra, mikor egy vagy több fázist is vissza kell ugranunk az aktuális lépés során tapasztaltak miatt. Érdekes látni, hogy ez iteratív fejlesztés mennyire jól illeszthető a ma egyre jobban terjedő agilis szemlélethez. 

De nem is a CRISP-DM metodikát akarom most kivesézni, felülbírálni - minden hibája ellenére igazán szeretem, gyakran mentett meg minket kényes helyzetekben. Inkább egy újfajta jelenségre szeretném felhívni a figyelmet: egyre többször van lehetőségünk olyan módon elkezdeni egy-egy projektet, hogy nem a legelső fázisnál, az üzleti feladat megértésénél indulunk - hanem a másodiknál, az adatok megismerésénél.

Arról van szó, hogy vannak vállalatok, akik nagyon vágynak arra, hogy valami igazán izgalmas, jelentős üzleti hatást felmutatni képes adatos projektet indítsanak, és a lehetséges partnereket állandóan szondázzák, mondjanak valami igazán ütős use-case-t. Gyakran egy-egy jó pozícióban levő tanácsadó cég is megkeres hasonló feladattal: "bent ülök az X cég big data board-jában, most dolgozzuk ki a stratégiát, ha van valami remek alkalmazási ötletetek, mondjátok el, ha elég jó, lehetne belőle jó üzletet csinálni". 

Nagyon nehéz ilyenkor valami jó javaslattal előállni, faramuci helyzet, hogy nem a megrendelő hozza az üzleti problémát, hanem mi. Ezért ezekben a helyzetekben gyakran azt javasoljuk, forduljunk az adatokhoz: néhány ilyen megkeresést át tudtunk alakítani egy adatvezéreltebb gondolkodás mentén működő projekté:

  • ElsÅ‘ként hozzáférést kaptunk az adatok egy részhez, és egyszerűen megértettük milyen típusú, mennyiségű és minÅ‘ségű adattal élnek együtt ezek a cégek. Tipikusan néhány érdekes adatkört adtak oda, ami szerintük is tartogat meglepetéseket.
  • Ezt követÅ‘en egyfajta data discovery fázisban kicsit megpiszkáltuk az adatokat, mit is rejtenek. Ezek az elemzések egyfajta ad-hoc riportoknak foghatók fel, segítenek abban, hogy ötleteket tudjunk adni arról, mire is használhatók ezek az adatok. Lényeg, hogy itt az adatok is súgnak nekünk.
  • Az adatok ismeretében készítettünk jó sok javaslatot, hogyan lehetne üzletileg kiaknázni az adatokat. Itt a friss, más nézÅ‘pontból érkezÅ‘ szemünk adata lehetÅ‘ségek (és korlátok) mentén leírtunk 10-20 use-case-t, esetenként néhány slide-nyi anyagot szedtünk össze. Egy-egy ilyen javaslatot gyakran néhány, a cégre vonatkozó adattal is megtámogatunk.
  • Ezeket vizsgálta meg a megrendelÅ‘ üzleti csapata, a use-case-ek jelentÅ‘s része nem érte el az ingerküszöbüket, de mindig akadt egy-kettÅ‘, ami érdekelte Å‘ket. Mivel láttak hozzá néhány releváns adatot, gyakran könnyebben meggyÅ‘zhetÅ‘ek ilyenkor, mintha külsÅ‘sként azt mondom, ez biztos megoldás után kiáltó gond nálatok.
  • Ezt követÅ‘en általában egy proof-of-concept fázis jön, mikor az adott use-case-re kidolgozzuk az elemzést a múltbeli adatokon, itt bizonyítjuk be, hogy érdemes ez az elemzést, adatbányászati modellezést folytatni.
  • Végül, ha ez utóbbi lépésben is meggyÅ‘zÅ‘k voltunk, akkor foglalkozunk a megoldás integrációjával, ekkor kerülnek fel az eredményeink a dashboard-okra, beépítjük a kalkulációkat a rendszerekbe, és itt dolgozzuk ki hosszú távon hogyan érdemes frissíteni az eredményeket.

gut.jpgLátható, hogy az iteratív, egyre komplexebb megoldásokat kihozó szemlélet itt is megmaradt, de az első pont az adatokról szól, és nem az üzletről. A döntések meghozatalánál persze az is sokat nyomott a latba, hogy így a költségek is fokozatosan jelennek meg. Az adatfeltárás + use-case készítés jóval kisebb feladat (8-21 nap), mint mondjuk a historikus adatokon már futó poof-of-concept megoldás kialakítása, de az igazán komoly befektetést igénylő integráció előtt van egy érvényes döntési pont, ahol múltbeli adatokra támaszkodva jól meg lehet becsülni az üzletre gyakorolt hatását az adott megoldásnak.

Én igazán szeretek így dolgozni, nagyon kreatív és sokkal üzletszagúbb megoldások tudnak így létrejönni. És attól a pillanattól fogva, hogy a partner saját adatain futó elemzésekkel támasztjuk alá a mondandónkat, sokkal érdekesebbek lesznek az elsőre akár túl egyszerű vagy sci-fi jellegű ötletek is.

ideaw.gifÉrdekes számodra ez a megközelítés, mert a Te cégednél is van egy állandó ötletvadászat az innovatív irányokat illetően, de valahogy mindig az az érzésed, hogy a bejövő ötletek valahogy nem hitelesek. �rj nekünk, és mi szívesen segítünk a fenti metodika szerint megtalálni azt, ami nálatok valóban érdemes bevezetni.

Gáspár Csaba: gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Adat-alapú vezetés meetup kedden

Adat-alapú vezetés meetup kedden

Az big data megoldásokban rejlő lehetőségek kihasználása nem tekinthető pusztán IT feladatnak. Erre a területre is igaz, hogy akkor tudják hatékonyabbá tenni egy-egy vállalat működését, ha az adatvezérelt gondolkodás vezetői szinten is gyökeret ver. A technológiai oldalról számtalan lehetőség van arra, hogy egy a data science vagy big data téma iránt érdeklődő szakember belekóstoljon ezekbe a témákba, csak gondoljunk arra a rengeteg technológiai meetupra, ami ma Budapesten elérhető a nagyközönség számára.

a_6.jpgA vezetői réteg lehetősége sokkal korlátozottabb, ezért is nagy öröm számomra, hogy következő kedden, 2016. október 11.-én tartja a Spark Institute az Adat-alapú vezetés című meetupját. A Spark Institute képzéseivel a vezetői réteget célozzák meg, a változó technológiai környezethez való alkalmazkodásra illetve a felforgató technológiák felhasználására kívánja felkészíteni a résztvevőket.

Ezen a vonalon kerül képbe az adatvezérelt gondolkodás, a big data világának üzleti vonatkozásai. A keddi meetup-on én tartom a felvezető előadást a big data technológiai és üzleti aspektusairól, majd Szukács István (StreamBright Data) fog beszélni az ajánlórendszerekben rejlő lehetőségekről, majd Vértes Balázs (Enbrite.ly) az online hirdetések minőségbiztosításáról.

2016. október 11. 19.00

Adat-alapú vezetés meetup - Spark Institute

Helyszín: LogMeIn - 1061 Budapest, Paulay Ede u 12.

Figyelem, a rendezvényt nem a meetup.com-on szervezik, a részvétel regisztrációhoz kötött,
a rendezvény holnapján erre van lehetőséged

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Tároljuk-e le ezt az adatot?

Tároljuk-e le ezt az adatot?

Egy data scientist a címben szereplő kérdésre egy automatikus igennel szokott válaszolni - ha van valami adatunk, tároljuk le, mi ezen a kérdés. És valóban, mi akadályoz meg minket ebben? Ha belegondolunk, mennyire olcsó ma már az adattárolás, a kérdés felmerülése elsőre furcsán is hathat. Többek előadásában láttam már visszaköszönni a mellékelt ábrát, és én is gyakran használom - azt mutatja meg, hogy az elmúlt 35 évben hogyan zuhant le egyetlen GB adattárolás éves költsége. A születésem környékén több mint egy millió dollárba került volna azt eltárolni, ami ma egy promóciós ajándéknak utánam dobott 8GB-os pendrive-on elfér. Bár sokat keresgéltem, de nem láttam 2015/2016-os adatokat, de az ábrán így is látszik, hogy az elmúlt években már bőven beestünk a 10 dollárcent alatti értékekhez, ennyibe kerül 1GB háttértár kapacitás manapság.

cost-per-gigabyte-large.pngMit is jelent ez? Azt, hogy ha az adatmennyiség nem extrém nagy, akkor egy átlagos nagyvállalatnál az adatok tárolásáról szóló meetinget résztvevő kollégák órabére valószínűleg jelentősen meghaladja a teljes tárolás költségét. 

Mégis meg kell védenem azokat a szervezeteket, ahol nem minden adatot tárolnak, amire valaha rátaláltak vagy valaha birtokoltak. Mert csak egy szempont az, hogy egy ilyen adatot el kell tárolni, de van itt néhány más szempont is:

  • Ha eltároltuk, akkor kinek lesz jogosultsága ezeket az adatokat olvasni? Egy nagyvállalati környezetben ennek eldöntése már nem annyira triviális, mint lementeni azt.
  • Felmerül a kérdés, hogy ha tároljuk az adatot, akkor azt mennyire biztonságosan kell tenni. Nincs-e benne valami olyan érzékeny adat, aminek védelme extra költséget igényel. 
  • Sokszor olyan ügyféladat is lehet az adathalmaz mélyén, amire törlési kényszer van törvényi kötelezettségek miatt. Ã�gy a felelÅ‘tlenül törölt adatok a végén akár több fejfájást is okozhatnak, mint eredetileg gondoltuk.

Jól látható tehát, hogy a "mindent tároljunk" szabály inkább kihívásokat hoz egy hagyományos óriáscég számára. Az elv bevezetését én csak olyan helyen láttam, ahol (1) az ügyfelekhez köthető személyes adatok kezelése egyszerűsítve volt, (2) ahol minden alkalmazott bátran hozzáférhet (pénzügyi adatok kivételével) minden adathoz, azaz nagyon egyszerű jogosultsági szabályok voltak adathozzáférés szempontjából, (3) és ahol tipikusan rugalmasan bővíthető adattárolási infrastruktúra (pl. AWS) állt rendelkezésre. Ha ezt a három szempontot összeadjuk, könnyű kitalálni, hogy az innovatív, startup világ felöl közelítő techcégek eshetnek bele csak ebbe a körbe.

Pedig valójában minden cégnél van létjogosultsága a "tároljunk mindent" elv feltételeit megteremteni. Ma egyre több iparágban az adatokban rejlő lehetőségek jelentik az egyik legfontosabb feltételét annak, hogy hosszú távon versenyképesek legyenek. Az adatok kiaknázásához pedig - nem meglepő módon - már eltárolt adatok is szükségesek szoktak lenni.

Adalék az árakhoz: Ha megnyitom a Google Drive fiókomat, akkor ott egyetlen gomb megnyomásával az elérhető tárkapacitásomat felnyomhatom 10TB (10*1000GB) területre. Ezért cserébe elég biztonságos hozzáférést, adatvesztés nélküli tárolást kapok úgy, hogy egyszerre 3 példányban tárolják az adataimat olyan adatközpontokban, amik legalább 300km távolságban vannak egymástól - így egy kisbolygó szerencsétlen érkezése sem nagyon veszélyeztetik a családi fotókat. Ezért összesen havi 100$ kérnének most tőlem.

Azaz évente 1GB tárolása 0,012$-ba (alig 35Ft-ba) kerülne.

aaa.jpgSok adat van nálatok is, már foglalkoztok a kiaknázásával, de jó lenne ha valaki friss szemmel is rá tudna nézni, elbeszélgetnél arról milyen módon lehetne még felhasználni azt? �rj bátran nekünk, szívesen gondolkodunk együtt olyanokkal, akiket érdekelnek az innovatív big data és data science megoldások. Cím: gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Mi maradt le a bevásárlólistáról? – Ma új hazai adatbányászati verseny indul

Mi maradt le a bevásárlólistáról? – Ma új hazai adatbányászati verseny indul

A data scientistté válás útjának egyik fontos állomása az adatbányászati versenyeken való indulás. A gépi tanulási eljárásokkal kapcsolatos tudásod, a helyes tesztelési és tanítási rendszer kialakításának a képessége, a jó visszamérési stratégiád ellenőrzésére nagyon alkalmas egy jó versenyen való részvétel. Ezért is népszerű a kaggle.com adatbányászati versenyeket szervező oldal, érdemes követni rajta az eseményeket akkor is, ha nincs időd bekapcsolódni a megmérettetésekbe.

a_5.jpgKülön örülök, ha hazai versenyek indulnak, hiszen ezen események egyfajta indikátorai annak, hogy a hazai adatos közösség hol is tart valójában. Ezért is szeretém külön felhívni a figyelmet a ma induló Cetli  ("Shopping List") Competition versenyre: a Nextent jóvoltából és az ő támogatásukkal induló megmérettetésen a Cetli nevű applikáció adatai felett dolgozhatunk. A versenyt a datapallet.io hosztolja. A verseny során az anonimizált felhasználók bevásárlólistáit láthatjuk, amik júliusi-augusztusi példányaiból találomra eltávolítottak egy-egy elemet. A versenyen résztvevőinek ezeket az eltávolított termékeket kell megbecsülni. 

Ha érdekel, nézz körül a verseny oldalán, majd regisztrálj versenyzőnek. 

Verseny hivatalos oldala 

A verseny indulásáról a ma esti Budapest.py Meetupon fognak bővebben beszélni a verseny szervezői. 

Ha úgy érzed, hogy neked is van olyan adathalmazod, ami kapcsán érdekes lehetne kiírni egy adatbányászati versenyt? Érdekelne, mi lenne az elérhető közel legjobb megoldás, vagy kíváncsi vagy rá, kik értenek igazán az adott fajta feladat megoldásához? Egyszerűen a beszállítóidat szeretnéd megversenyeztetni? Keress meg minket, és mi szívesen segítünk a verseny megfogalmazásában, kiírásában, akár a lebonyolításában.  - Gáspár Csaba gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Lakótársat keresünk – Inspiráló belvárosi iroda

Lakótársat keresünk – Inspiráló belvárosi iroda

Mindig meglep, mennyire sokat számít milyen környezetben dolgozik egy csapat. Először ezt akkor éreztem meg, mikor a Radoop és a Dmlab közösen bérelt irodát az Ipar utcában, mikor a szürke egyetemi közegből kiszabadultunk. A jó környezet egyszerűen húz előre, repülsz, nagyobb tempóra tudsz kapcsolni. Sokan félreértik ezt az állításomat, és azt gondolják hogy a design bútor, vicces grafikák és babzsákok háromszögébe kell zárni a kollégákat. De a környezet tágabb értelemben értelmezendő: sokat számít, hogy milyen emberek között ülsz, milyen más cégek azok akik körülötted vannak, kikkel találkozol a konyhában, ha kávézol, és milyen környezetben vagy, ha kilépsz az utcára, vagy ha elmész ebédelni.

moving.jpgEzért szeretem a mi irodánkat, a RED-et, amiben most üresedés van, és ahova új lakótársakat keresünk. Eddig a RapidMiner, az Enbrite.ly és a Dmlab uralta ezt a Madách térnél lévő 400 négyzetméteres teret. Lényegében a régi Kirowsky, majd régi Prezi.com iroda első emeleti szintjéről van szó a Károly körút 9. alatt. Biztos sokatok járt már itt korábban akár egy meetup kapcsán. Most az Enbrite.ly költözik tovább tőlünk a Mosaikba, az iroda közel harmada kiadó.

Ha érdekes lehet nektek, vagy ismersz valakit, akinek megmozgathatja a fantáziáját a dolog, akkor álljon itt néhány infó az irodáról (nyilván a teljesség igénye nélkül):

  • A belvárosban, a Deák tér tÅ‘szomszédságában, a Károly körút 9-ben vagyunk, ha valaha dolgoztál ennyire a város közepén, tudod mirÅ‘l beszélek.
  • Egy nagy közös térben van 10-14 szabad asztalunk, ami mellé jár két nagyobb tárgyaló használata, és egy hatalmas közös konyha. Ezen túlmenÅ‘en van két apróbb telefonálószoba, ahol egy-két fÅ‘s hívásokat lehet elintézni.
  • Magunk menedzseljük az irodát, a költségeken osztozunk, de a takarítást külsÅ‘ cég végzi.
  • A kényelmünket szolgáló dolgok: Illy kapszulás kávé, ballonos viz, hetente többször gyümölcs. 
  • A közeg fÅ‘leg adatos világban dolgozó, nyitott emberekbÅ‘l áll.
  • Négyzetméterárak szempontjából kedvezÅ‘ megállapodásunk van a tulajdonossal, a költségeket a csapatok lényegében szétdobják egymás között. Mivel közvetlenül velünk kell szerzÅ‘dnöd, így itt nem gond magában, ha nem tudsz több éves szerzÅ‘déseket aláírni.

Ha érdekes lehet neked vagy egy ismerősödnek a téma, írj nekünk egy emailt. Nagy-Rácz István: (nagyracz.istvan@dmlab.hu) vagy Gáspár Csaba (gaspar.csaba@dmlab.hu). 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Barabási új könyve – Leesett az állam

Barabási új könyve – Leesett az állam

Eddig is tudtuk, hogy Barabási Albert-László azon ritka kutatók egyike, akik a szélesebb közönség számára is élvezhető módon tudnak kommunikálni. A korábbi könyveit ismerők (Behálózva, Villanások) már bizonyára felkapták a fejüket az új könyv megjelenésének hírére. �k biztosan csalódottak lesznek, ha kezükbe veszik a "A hálózatok tudománya" című kiadványt, ugyanis ez nem ismeretterjesztő céllal, hanem mint egyetemi tankönyv jelent meg. A rengeteg képleten, levezetésen bizonyára csak nagyon kevesen fogják magukat végigrágni, főleg azok, akik kreditpontokat kapnak azért, ha levizsgáznak az adott anyagból.

a_halozatok_tudomanya_barabasi.JPGMindezek ellenére szenzációsnak tartom a könyv megjelenését, elég ehhez egy kicsit más szemmel lapozgatni az oldalakat. Ha egyetemi oktatóként nézek erre a kiadványra, hirtelen minden idegszálam felvillanyozódik, le vagyok nyűgözve - mint mikor az első valóban okostelefont tartottam a kezemben: sosem gondoltam, hogy szükség van ilyenre a világnak, de mikor megtapasztalom annak erejét, minden más mobiltelefon elveszti értelmét és szürke semmiséggé válik.

Ugyanez az érzés fogott el Barabási új könyve kapcsán is, azt hiszem ez az első igazi magyar nyelvű egyetemi tankönyv, amit a kezemben tartottam valaha. Nem egyszerűen szép és szemléletes, hanem magával ragadó ábrák, remek illusztrációk, színes érdekességek, háttérinformációk teszik kiemelkedővé a könyvet. Jól felépített fejezetek, a komolyabb levezetések külön kiszerkesztve, hogy olyan szakokon is lehessen belőle tanítani, ahol nincs meg minden tétel bizonyításához a megfelelő matematikai háttér. Gyakorlófeladatok, házifeladatok, ellenőrző kérdések. Mindezt keménykötéses, nagyméretű alakban, majdnem 500 oldalon keresztül élvezhetjük a legfinomabb papírra nyomtatva.

Mindenkinek javaslom, hogy ha könyvesboltban jár, keressen meg egy példányt, és csak játsszon el a gondolattal, hogy mi lett volna ha ilyen jellegű könyvekből kellett volna felkészülnie egyetemi évei alatt egy-egy tárgyból. Egy ilyen könyvet kézben tartva az kevésbé tűnik valószínűleg, hogy a közeljövőben az egyetemek helyett a fiatalok a Coursera kurzusaira járnak majd, hogy mindent a Youtube-on látható karizmatikus előadóktól érdemes csak tanulni.

Érdeklődő hallgatóknak

Biztos vagyok benne, hogy már szeptembertől lesznek olyan kurzusok a hazai felsőoktatásban, aminek alapját a könyvben leírtak adják. Ha hallgatóként mégis úgy érzed, hogy nem lesz elérhető számodra ilyen óra, szívesen megtanulnád ami a könyvben van, de félsz, hogy csak úgy önszorgalomból nem leszel elég kitartó, úgy van egy formabontó ajánlatunk:

  • Adunk neked ajándékba egy példányt a könyvbÅ‘l
  • Gyere el vizsgázni hozzánk a könyv anyagából 2016. október 1-ig, szívesen levizsgáztatunk belÅ‘le.
  • Ha nem sikerülne a vizsgád, vagy végül nem tudtál eljönni, akkor visszakérjük tÅ‘led a könyvet.

A részleteket úgyis megbeszéljük majd, a lényeg, hogy segítünk abban, hogy rávedd magad arra, hogy a könyvben foglaltakat megtanuld. A lehetőséget első körben a 3 leggyorsabban jelentkező hallgatónak adjuk meg. Jelentkezni: gaspar@tmit.bme.hu címen tudtok.

UPDATE: A blogposztunkra a könyvet kiadó Libri is reagált: támogatásként felajánlottak három példányt a könyvből. Hálás köszönet érte.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Privacy Policy

Copyright © 2018 BBBT - All Rights Reserved
Powered by WordPress & Atahualpa
X