Nyitott data science órák a Műegyetemen

Nyitott data science órák a Műegyetemen

Már hagyományosnak mondható módon idén is meghirdetjük a BME-s tárgyaink egy részét külsős hallgatók számára. Hiszünk benne, hogy sokaknak tud segíteni egy olyan program, amiben MSc informatikus hallgatókkal együtt kezdik el tanulni az adatelemzés alapjait. Az elmúlt években minden alkalommal sok-sok ember jelezte, hogy szívesen bejárna hozzánk, így aztán minden évben ugyanannyi külsős hallgató indult neki a félévnek, mint amennyien a műegyetemistaként órarendi keretek között elkezdik azt. 

a.jpgEbben a félévben az "Adatelemzési platformok" című tárgyunk indul, amiben egy alapszintű bevezetést tartunk a data science világába: megtanítjuk a Python nyelv alapjait, a RapidMiner adatelemzési szoftvert, bemutatjuk a legfontosabb gépi tanulási feladatok megoldását, illetve valós adathalmazok segítségével rávilágítunk mennyire izgalmas és szellemi kihívásokkal teli ez a szakma. Kevés az olyan rész, mikor valaki csak a táblánál előad, tipikusan egy-egy témát egyből közösen fel is dolgozunk, mindenki előtt ott van a saját laptopja az elmélet és a gyakorlat kéz a kézben jár. A tárgy részletes tematikáját itt találod: leírás.

Az órákat idén február 6-tól tartjuk hetente két alkalommal, szerdánként 8h30-10h csütörtökönként 10h15-12h a Műegyetem lágymányosi kampuszán (Magyar tudósok körútja 2. Q épület).

Ha részt szeretnél venni az órákon, két dologra kérünk:

  • Kérünk gondold át, tényleg lesz-e lehetÅ‘séged az órákon részt venni, illetve hogy tudod-e majd követni azt. A tárgy oktatásánál feltételezzük, hogy valaha már programoztál valamilyen programnyelven, nagyjából tudod milyen műveleteket lehet végrehajtani SQL nyelven, és az Excel különbözÅ‘ furfangjai sem hoznak zavarba. 
  • Nagyon sok külsÅ‘s szokott jelentkezni erre a felhívásunkra, de csak annyi jelentkezÅ‘t fogadunk be, hogy a hallgatók és a külsÅ‘sök száma közel megegyezzen. Ez idén körülbelül 20-25 embert jelent. A jelentkezést alapvetÅ‘en sorrend alapon bíráljuk el. Hagyományosan a blogunk hírlével feliratkozóinak kicsit korábban küldjük ki a jelentkezési linket, így Å‘k elÅ‘nyben vannak; ha ez az elÅ‘ny neked is fontos lehet késÅ‘bb, érdemes feljelentkezni a hírlevélre (jobb fent a blog oldalán).

A jelentkezéseket most a hétvégén el is bíráljuk, ehhez csatlakozási szándékod jelezd felénk az alábbi oldalon való regisztrációval.

JELENTKEZÉS 2019

Nemrég Nagy-Rácz István kollégám összeszedte egy blogposztban milyen adatos képzések érhetők el jelenleg Budapesten. Ha nem jutottál be a fenti képzésre, vagy neked kicsit másra lenne szükséged, itt találsz ötleteket.

Data science képzések - Hol tanítják a big data-t?

Mi a  dmlabbal a legtöbbet úgy oktatunk, hogy egy-egy konkrét csapatnak, cégnek tartunk egyedi képzést, ahol a Megrendelő igényeire szabjuk a tematikát, a használt technológiát, a képzés időpontját és hosszát. Ha ilyen képzési csomag után érdeklődsz, bátran keress meg engem, szívesen átbeszéljük veled mi lenne megfelelő:

Gáspár Csaba
gaspar.csaba@dmlab.hu
+36208234154

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

A képlet – ha egy könyvet olvasol el az ünnepek alatt, az ez legyen

A képlet – ha egy könyvet olvasol el az ünnepek alatt, az ez legyen

Barabási “A képlet� című könyve első ránézésre üzletembereknek, mérnököknek, tanároknak, művészeknek, startuppereknek, marketingeseknek, műértőknek, közgazdászoknak, szülőknek, divat szakembereknek, könyvszerkesztőknek, politikusoknak, zenészeknek, borászoknak, orvosoknak, IT szakembereknek szól. Valójában mindenkinek, aki szeretné megérteni, mitől lesz valami vagy valaki sikeresebb, mint mások.

48411822_2117576191597974_3982352565147795456_n.jpg

 

Akik számára pedig az adatokban rejlő lehetőségek érdekesek, azok egyenesen imádni fogják ezt a könyvet. Én teljesen le vagyok taglózva tőle. Olvastam és szerettem Barabási könyveit, de ez nagyságrendekkel jobban lenyűgözött. Ha nincs a kezemben a könyv, akkor is napjában többször belegondolok egy-egy állításába, és csodálom mennyire jól értelmezhető segítségével az, ami nap mint nap történik körülöttem. 

 A könyv fókuszában az áll, hogy mitől függ azon emberek sikere, akit a környezete sikeresnek tart. És bár ez alapján azt hihetnénk, hogy egy újabb sikerkalauz van a kezünkben, de itt nem remek életbölcseségeket olvashatunk, hanem adatokra támaszkodó kutatási eredményeket arról, hogy mitől függ a nyugati társadalomban egy-egy ember sikeressége. Mindezt úgy, hogy teljesen hétköznapi kérdésekre is megkapjuk a választ:

  • Melyik iskolába irassuk a gyerekünk?
  • Hogyan befolyásolja a tanár attitűdje a gyerekünk fejlÅ‘dését?
  • MitÅ‘l fut be egy Kickstarter kampány?
  • MitÅ‘l lesz díjnyertes egy jó bor?
  • MitÅ‘l lesz valami sláger, hogyan tud berobbanni egy ismeretlen zenekar?
  • Miért ér milliókat egy kép, amit akár mi is meg tudnánk rajzolni? Ha erre adnánk a fejünket, hogyan kezdjünk neki?
  • Számít-e a teljesítményünk, ha sikeresek akarunk lenni?
  • Hányadiknak érdemes bemenni egy állásinterjúra?
  • Mikor szólaljunk fel egy értekezleten?
  • Hogyan döntsön a céges csapatunk egy-egy kényesebb kérdésben?
  • Hogyan lehet megkülönböztetni a minÅ‘séget a népszerűségtÅ‘l?

Hogyan válassz ajándékot?

A könyvben olvasott törvényszerűségekre támaszkodva az alábbi ajándékozási tippeket tudom neked adni:

 

  1. Ha könyvet akarsz ajándékozni, és csak néhány perced marad a döntésre, akkor válassz egy aktuális slágerkönyvet, válassz egyet a top 10 eladottból (legtöbb könyvesboltban van ilyen polc).
  2. Ha van időd jó ajándékkönyv választásához, akkor viszont ne a ranglistákat nézzed, hanem azon emberek véleményét, akik olvasták már azt. Ne az csak első review-t olvasd el, hanem olvass bele későbbiekbe is.
  3. Ha egy kamasznak akarsz valamit adni, válasz olyat, ami egy népszerű márkához tartozik. Hiába találsz egy nagy presztizsű, de kevésbé ismert márkát, az nem lesz neki megfelelő. Ha valami a saját környezetében népszerű, abból szívesen birtokol maga is egyet.
  4. Ha bort akarsz venni valakinek, és nem értesz annyira hozzá, vagy ha nincs egy számodra ismerős, bevált évjárat, akkor érdemes egy olyat keresni, ami nyert valami díjat. De csak akkor, ha annyiba kerül mint a hasonló, nem díjnyertes borok.
  5. Ha élményajándékban gondolkodsz (főzőtanfolyam, jobb agyféltekés rajzolás, stb), akkor inkább arra koncentrálj, hogy a megajándékozottad érdeklődjön a téma iránt, mint arra, hogy a legjobb, legmenőbb helyre iratod be őt az adott területen.
  6. Ha egy most berobbanó, friss témát akarsz az ajándékozottadnak bemutatni, előnyös ha éppen most kapott az adott termék, az adott mű szerzője egy, a fiatal művészeknek járó díjat.
  7. Ne hagyd magadat az első benyomásokra épülő marketingnek bedőlni, inkább keress olyat, ami valamiben egyedi, meglepő, szokatlan, vagy innovatív - amiből nem tizenkettő egy tucat.

Ráadásul annyira jó “A Képlet� stílusa, annyira magával ragadó és érthető a gondolatmenete, hogy csak azért tettem le egyszer-egyszer a könyvet, hogy legyen időm belegondolni, mi mindent kell újraértékelnem a könyv hatására. Barabási vagy rettenetesen megtanult írni vagy a legprofibb segítséget kapta meg a könyv írásához. Bár a könyvet angolul, elsősorban az amerikai piacra készítette, de minimális számú az amerikai könyvekre jellemző repetatív, sulykoló ismétlés, ügyesen egyensúlyoz az közérthetőség és a tudományos szempontból is érvényes állítások között, képes a “képletről� úgy beszélni, hogy lényegében csak a szorzás műveletét kell ismernünk.

Barabási fejezetenként elővesz egy-két érdekes kutatási eredményt, ami a világ egy olyan szegletében mutatja be a siker kulcselemeit, ahol elég adat érhető el ahhoz, hogy általánosítható összefüggésekre lelhessünk. Majd ezt az eredményt általánosítja, helyezi be a könyvkorábbi fejezeteiben bemutatott gondolatmenetébe.

 

Miért ennyire gondolatformáló (mind-changing) a könyv?

Mert nem egy rendkívül sikeres ember vagy egy őt segítő couch személyes tapasztalatait olvasod, ami lehet hogy neki bejött, de nem biztos, hogy neked be fog. Igazi adatvezérelt szemlélettel dolgozik: azt vizsgálja, hogy mi különböztette meg a sikeres embereket a kevésbé sikeresektől akkor, mikor még nem voltak sikeresek. Más szóval, mik azok a tényezők amik hatására jó eséllyel megjósolható, hogy valaki sikeres lesz később. És ez sokszor nagyon más, mint amit a társadalmunk erről gondol. Máshogy tekintünk majd arra, hogy mennyi szerencse, mennyi kapcsolat, mennyi tehetség és mekkora teljesítmény kell ahhoz, hogy mi magunk sikeresek legyünk. Tökéletes olvasmány, ha Karácsony után a következő évre akarod magad felkészíteni gondolatban.

download.jpeg

Adatok erejéről olvasni más területen is lenyűgöző tud lenni: a másik személyes kedvencem John M. Gottman könyve, amiben egy párkapcsolati szakértő írja le, hogy milyen izgalmas eredményekre jutott, mikor adatelemzési módszerekkel kezdte vizsgálni mitől megy tönkre egy párkapcsolat. Több évtizedes utánkövetéses adatgyűjtés és adatelmezés után képes arra ha megfigyeli egy pár egy 15 perces összezördülését, vitáját, akkor 91%-os pontossággal meg tudja állapítani, hogy vajon együtt lesznek-e 10 év múlva. Gottman még arra is rádobott közel húsz évet, hogy kitalálja, kimérje és végül leírja, hogy mit és hogyan érdemes változtatni a viselkedésünkön, ha valaki nemcsak felismerni szeretné a kapcsolatát veszélyeztető bajokat.

John M. Gottman és Nan Silver: A jól működő házasság 7 alapelve (Hogy reflektáljak a fenti vásárlási tanácsokra, jó tudni, hogy a könyv a New York Times bestseller listáján is fent volt, a magyar kiadáshoz pedig Pál Feri írt ajánlást.)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Adatkezelési kultúrák

Adatkezelési kultúrák

Big data forradalom: adatkezelési erőviszonyok a „cég-állam-egyén szentháromságában�

 Komoly felelősség és páratlan üzleti potenciál. Valahogy így lehetne leírni azt a lehetőséget, amellyel a (személyes) adatok kezelése, birtoklása és az adatelemzés kecsegtet.

Big data forgatókönyvek

Az elmúlt hónapokban éjjel-nappal a GDPR-ról, a téma fontosságáról és az ezzel együtt járó kötelezettségekről lehetetett hallani. �m valóban „csak� arról van itt szó, hogy illetéktelenek kezébe kerülhetnek érzékeny adatok? Az adatgyűjtés és az adatfelhasználás lehetőségei valójában ennél sokkal színesebbek, és sokszor a leírt rémhíreknél barátságosabbak is lehetnek. Mi több, ha kicsit jobban elmélyedünk a témában, meglehet, hogy saját folyamataink hatékonyságán is dobhatunk egyet. Utánajártunk néhány érdekességnek és a világ ma fellelhető adatkezelési forgatókönyveinek.

 Egy 2007-es európai uniós nyilvános tanulmányban[1] számoltak be arról, hogy az IT, a telekommunikáció, a média és a szórakoztatóipar összefonódása és az üzleti intelligencia fejlődése miatt körülbelül 2015-re különleges jelentőséggel bírnak majd a személyes adatok, melyek birtokosa monopolhelyzetbe kerülhet. A szerzők háromféle adatkezelési forgatókönyvet vázoltak fel. Meglepően jól prognosztizáltak: ezek az adatelemzési, adattárolási gyakorlatok, vagy legalábbis ehhez nagyon hasonlók megjelennek a világ jelentős gazdasági övezeteiben:

  1. Cégközpontú szkenárió
  2. �llamközpontú szkenárió
  3. Egyénközpontú szkenárió

 A három nézőpont különböző aspektusokat és lehetőségeket kínál arra, amiért és ahogyan érdemes az adatokkal foglalkoznunk.

Cégközpontú big data forgatókönyv – Az egyesült kapitalista adatliberalizmus

A legjelentősebb adatbányászati nagyhatalmak hazája az Egyesült �llamok. Az IT-szektorban vezető helyen szerepel, vállalatai szárnyalnak, így nem meglepő, ha az adatok amerikai cégközpontú megközelítése sokakat csábít, mindenki erre a vonatra próbál felkapaszkodni.

A világ adatvagyonának legnagyobb birtokosait (például: a Google, a Facebook, az Apple, az Amazon, az eBay vagy a Twitter) az amerikai törvények sokszor előnyben részesítik: némi hozzájárulás után szinte szabaddá válik az adatfeldolgozás, sőt, Donald Trumph egyik első hivatali intézkedésével engedélyezte az amerikai internetszolgáltatóknak a rajtuk átfolyó ügyféladatok értékesítését. Hazai hasonlattal élve ez olyan lenne, mintha nálunk a Telekom eladásra kínálná számunkra a szomszédunk netforgalmát (kicsit abszurd, nem?). Néha Amerikában is kirobban egy-egy „adatbotrány�, ám ezek száma és jelentősége a birtokolt információhoz képest elenyésző. A netes óriáscégek a megszerzett, megvásárolt adatokra támaszkodva őrületes hatékonyságról tanúskodnak, ami sokakat félelemmel tölt el, míg másokat csábít és kapzsivá tesz ez a döntéstámogató rendszer. Ezt a létező szisztémát leginkább csak belülről lehetne megbolygatni, például trösztellenes törvényekkel. Sokszor felmerült már a Google, a Facebook vagy az Amazon feldarabolásának igénye, mint ahogyan az korábban az AT&T egyeduralkodó amerikai távközlési vállalattal is megtörtént.

Profitorientált vállalati döntéstámogató rendszerek

A módszer keltette érzések és személyes gondolatok lecsupaszítása után elmélyedhetünk a szkenárió lényegi megközelítésében is. Az elv az elérhető legnagyobb hatékonyság-növekedésen alapszik: központjában a folyamatok optimalizálása, az alsóbb döntéshozási pontok támogatása áll, az adatokra pedig a személyes vonal redukálása mellett objektív pénzteremtő erőként tekint. Ez az adatgyűjtési módszer költséget takarít meg és bevételt növel. A Dmlabnál számos referenciánk kapcsolódik ehhez az adatfeldolgozáshoz: részt vettünk már meghibásodások előrejelzésének kidolgozásában, üzemanyagfogyasztás optimalizálásában vagy például az ügyfeleknek kedvezőbb, ugyanakkor a vállalat számára is megfelelő ajánlatadási eljárás megtalálásában.

�llamközpontú big data diktatúra – A kínai falanszter informatikai alapjai

A jó öreg Kínát hozhatjuk fel itt legjobb példaként. A világ legősibb folyamatos civilizációja kiválóan kiaknázta az adatbányászat nyújtotta előnyöket is. Itt nem feltétlenül a titkosszolgálati és hírszerzési vonalra gondoltunk (szemben az amerikai NSA-botrányokkal), hanem sokkal inkább hétköznapokhoz köthető információk hasznosítására. Kínában jelenleg működik egy pontrendszer, amely az állampolgárokat minősíti az adatokra lefordítható aktivitása (például iskolázottság, munkahely, pénzügyi mozgás vagy társas kapcsolatok) alapján. Mindezt megspékelve egy hatalmas kiterjedésű állami internetes cenzúrával, amelyen közel kétmillió ember dolgozik. Félelmetes, ám hatékony és hatásos megvalósulása az adatok birtoklásának, amelyet másnéven bizánci információkezelési rendszernek is neveznek.

Csak egy példa a sok közül: Kínában rohamtempóban építik a köztéri kamerarendszert, kísérleti jelleggel már számos közintézményt és iskolát bekameráztak. Utóbbiban figyelemmel kísérik a diákok képességeit, tanulási szokásait és a fegyelmezettséget. Az így nyert adatok feltételezhetően bekerülnek majd az állami döntéstámogató pontrendszer indikátorai közé, és talán a közeljövőben ezen múlik majd, hogy egy állampolgár elegendő pontot „gyűjtött-e� a hitelképességhez, az útlevéligényléshez vagy akár egy közigazgatás álláshely sikeres megpályázásához.

Központosított adatbázis kezelés

Ellenőrzés és kontroll. Ez a két, időnként félelmetesnek ható kulcsszó ebben az államközpontú megközelítésben. Máshol a világon nem tapasztalható ez a merev és szigorú adatkezelési forgatókönyv, ám néhány vállalatnál fellelhető egy-két aspektus. Ezek főként olyan cégek, ahol az adatok szerepe kevésbé a hatékonyságnövelés, sokkal inkább a munkavállalók és a folyamatok kézbentartása, ellenőrzése. A szemlélet elterjedésének erős lökést adtak a különböző videó, képi vagy hanganyagok feldolgozására készített deep learning megoldások.

 A Dmlabnál is találkoztunk már olyan projekttel, amikor e forgatókönyv elveihez folyamodtunk: a Nemzeti Adó- és Vámhivatallal (NAV) közösen dolgoztunk egy hatékonyabb �FA-csalás elleni módszer megalkotásán, de említhetjük bármilyen fraud (csalás) ellen szóló megoldási javaslatunkat is.

Egyénközpontú big data – Megkérdőjelezhető európai bizalom és nagymértékű individualizmus az adatkezelésben

Nincs olyan állam (ma még), amelyre egyértelműen rá lehetne húzni ezt a forgatókönyvet, ám az új európai adatkezelési szabályok (GDPR) életbe lépésével kétségtelenül Európa lett a központja ennek a szemléletnek, azaz a személyes adatokkal történő önrendelkezés jogának. A kontinentális (elsősorban svéd) gyakorlatba beleillik a „privacy� védelmének a joga. Jó példa lehet erre a Linux operációs rendszer szellemisége, a PirateBay mögötti ideológia, vagy a hamarosan érvénybe lévő irányelv, miszerint a bankoknak az ügyfél kérésére ki kell adniuk a harmadik fél részére a pénzügyi adatokat. Azért tegyük hozzá, hogy a monopolhelyzetű adatokból élő cégek nem a kontinensről származnak, így egy európai vállalat laza tollvonással válhat az adatokkal kapcsolatos önrendelkezés harcosává.

A magánélet üzleti intelligencia megoldásai

Az európai gondolkodásban fontos szerep jut a magánélet és a különböző szabadságjogok védelmének, a szigorú adatvédelmi szabályoknak. E szerint a világkép szerint a privacy-nak, azaz a magánéletnek, az információnak, mint magántulajdonnak kellene a legnagyobb hangsúlyt kapnia a haszon és az ellenőrzés helyett. Az Európai Unió az egyik leglelkesebb képviselője ennek a felfogásnak, ám a kontinentális földrész jóval kisebb erőt tudhat magáénak, mint amekkora lendülettel az USA vagy Kína vetette bele magát a téma kiaknázásába. A helyzethátrány oka leginkább az, hogy az elképzelések motorja inkább az EU intézményrendszere, amelyhez (egyelőre) még nem párosul felhajtóerőként a felhasználók tudatossága. �rásunk mellé ajánlunk még egy (szerintünk jó) cikket az európai adatvédelemmel kapcsolatos dilemmákról.

 Szétnézve az üzleti folyamataink között ez a módszer egy kicsit kakukktojásnak tűnhet, de bármily meglepő, az adatokat a haszonszerzése igénye nélkül egyszerűen „wellbeing-re� is lehet használni, ha mondjuk arra törekszünk, hogy az ügyfeleinknek vagy a munkatársainknak jobb legyen. Ilyen lehet a working log rendszer alapján egy egyénre szabott szabadságajánló vezetői információs rendszer, valamilyen belső HR-analitikai megoldás vagy például a felhasználói adatok visszaszolgáltatása az ügyfelek számára.

Semmi sem fekete vagy fehér, és olykor a szürkét is nehéz meglátni

A világ társadalmai nem kategorizálhatók egyértelműen e három forgatókönyv mentén: általában e három big data forgatókönyv egyvelegével találkozhatunk egy-egy országban, ami a technológiai trendek fejlődésével gyorsan változik, egyre változatosabbak az adatfelhasználási lehetőségek, így érdemes figyelemmel kísérni a trendeket.

 A személyes és üzleti adatok védelme, ugyanakkor az információszabadság kettősége egy olyan erő, amellyel sokan (vissza)élnek. Az óvatosságon túllépve a lehetőséget kell meglátni ebben a száguldó vonatban, és lehetőleg minél előbb felülni rá.

 

[1] WORLD ECONOMIC FORUM (2007): Digital Ecosystem - Convergence between IT, Telecoms, Media and Entertainment: Scenarios to 2015. World Scenario Series, 2007

 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Crunch Conference 2018 – Mint szakmai tükör

Crunch Conference 2018 – Mint szakmai tükör

Különleges helyzetben van a Crunch konferencia, mivel az előadók szándékai eléggé tiszták: nem akarnak valami bonyolult dolgot elmagyarázni nekünk, mint egy tudományos konferencián, nem egy PR eseményen vagyunk, ahol mindennek a főszponzor megoldásszállító marketingüzenetét kell hordoznia, de nem is egy zárt szakmai közösség találkozóján, ahol mindenki az ügyfeleknek vagy a versenytársaiknak kommunikálva egyre nagyobbat mond.

A Crunch előadóin azt láttam, hogy van egy jó gondolatmenetük, egy elfogadható / fejlődő céges adatvezérelt rendszerük, amiről egyszerűen szívesen mesélnek. Az ebből fakadó őszinteség eredménye pedig az, hogy a konferencia egyfajta tükérként tud szolgálni a hallgatóságnak, amibe belenézve elég sokat megtudhatunk magunkról.

csapat_kicsinyitett_2.JPG Dmlab a Crunchonfon. 

Mivel 2018-ban lényegében mindenhonnan a big data, az AI, az ezekre épülő megoldások folynak, miközben a legtöbb hír, anyag, siker mögött elég kétes szándékok, ügyes marketingfogások, vagy újságírói nagyotmondás húzódik, ezért sokakban az lehet az érzés, hogy mindenhol máshol fantasztikus adatvezérelt folyamatokkal építik a jövő sikeres vállalkozásait, amitől egyfajta lemaradottság-érzés alakul ki bennünk.

Ezért is volt üdítő látni, hogy nagy, neves cégek adatelemző szakembereit hallgatva kiderült, hogy nagyon hasonló problémákkal, nagyon hasonló megoldási javaslatokkal dolgoznak a legnagyobbak is, mint amikkel idehaza is összefutunk. Izgalmas volt látni többek között a Runtastic, a Slack, a LinkedIn, az Uber adattudósait mesélni arról a felépített folyamatokról, rendszerekről, kihívásokról és a nehézségekről. 

Látva a nemzetközi szinten jelentős cégek működését, nekem az volt a Crunch fő tanulsága, hogy nemzetközi szinten is vállalhatók azok a dilemmák, problémák, nehézségek és az ezekre kiépülő megoldások, amikkel mi magunk is dolgozunk. Nem csak nekünk okoz nehézséget egy folyamatosan újra és újra épülő modell üzemeltetése, máshol is ugyanúgy fáj a fejük a heterogén környezetektől, ugyanúgy dilemma másnak is, mitől lesz valami egyszeri vagy ismétlődő elemzés. Nyilván a hazai adatos világ le van maradva a fejlett gazdaságoktól, de szakmai oldalról ez a lemaradás nem érzékelhető. Jó volt ezt látni a tükörben.

A Crunch mellett két másik konferenciára is bejárásunk volt ugyanazzal a belépővel: a UX témában futó Amuse és a product managment témában futó Impact egy konferenciahelyszínen volt velünk. Mindkettő egy-egy ígéretetes előadására átmentem, és az Impact - nevéhez híven - nagyon nagy hatással is volt rám. Az a bő egy óra, amit ott töltöttem, elementáris erővel hatott rám, beláttatta velem, hogy mennyire vakon próbálkoztunk eddig a Dmlab megoldásainak termékesítése során. Ha úgy vesszük, ez is egyfajta tükörként funkcionált nálam, csak itt az elégedett mosoly helyett az a döbbenet ült ki az arcomra, amit akkor látsz, ha egy féléves gyerek először döbben rá, hogy a tükörben mit is lát.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Crunch Conference 2018 – Mint szakmai tükör

Crunch Conference 2018 – Mint szakmai tükör

Különleges helyzetben van a Crunch konferencia, mivel az előadók szándékai eléggé tiszták: nem akarnak valami bonyolult dolgot elmagyarázni nekünk, mint egy tudományos konferencián, nem egy PR eseményen vagyunk, ahol mindennek a főszponzor megoldásszállító marketingüzenetét kell hordoznia, de nem is egy zárt szakmai közösség találkozóján, ahol mindenki az ügyfeleknek vagy a versenytársaiknak kommunikálva egyre nagyobbat mond.

A Crunch előadóin azt láttam, hogy van egy jó gondolatmenetük, egy elfogadható / fejlődő céges adatvezérelt rendszerük, amiről egyszerűen szívesen mesélnek. Az ebből fakadó őszinteség eredménye pedig az, hogy a konferencia egyfajta tükérként tud szolgálni a hallgatóságnak, amibe belenézve elég sokat megtudhatunk magunkról.

csapat_kicsinyitett_2.JPG Dmlab a Crunchonfon. 

Mivel 2018-ban lényegében mindenhonnan a big data, az AI, az ezekre épülő megoldások folynak, miközben a legtöbb hír, anyag, siker mögött elég kétes szándékok, ügyes marketingfogások, vagy újságírói nagyotmondás húzódik, ezért sokakban az lehet az érzés, hogy mindenhol máshol fantasztikus adatvezérelt folyamatokkal építik a jövő sikeres vállalkozásait, amitől egyfajta lemaradottság-érzés alakul ki bennünk.

Ezért is volt üdítő látni, hogy nagy, neves cégek adatelemző szakembereit hallgatva kiderült, hogy nagyon hasonló problémákkal, nagyon hasonló megoldási javaslatokkal dolgoznak a legnagyobbak is, mint amikkel idehaza is összefutunk. Izgalmas volt látni többek között a Runtastic, a Slack, a LinkedIn, az Uber adattudósait mesélni arról a felépített folyamatokról, rendszerekről, kihívásokról és a nehézségekről. 

Látva a nemzetközi szinten jelentős cégek működését, nekem az volt a Crunch fő tanulsága, hogy nemzetközi szinten is vállalhatók azok a dilemmák, problémák, nehézségek és az ezekre kiépülő megoldások, amikkel mi magunk is dolgozunk. Nem csak nekünk okoz nehézséget egy folyamatosan újra és újra épülő modell üzemeltetése, máshol is ugyanúgy fáj a fejük a heterogén környezetektől, ugyanúgy dilemma másnak is, mitől lesz valami egyszeri vagy ismétlődő elemzés. Nyilván a hazai adatos világ le van maradva a fejlett gazdaságoktól, de szakmai oldalról ez a lemaradás nem érzékelhető. Jó volt ezt látni a tükörben.

A Crunch mellett két másik konferenciára is bejárásunk volt ugyanazzal a belépővel: a UX témában futó Amuse és a product managment témában futó Impact egy konferenciahelyszínen volt velünk. Mindkettő egy-egy ígéretetes előadására átmentem, és az Impact - nevéhez híven - nagyon nagy hatással is volt rám. Az a bő egy óra, amit ott töltöttem, elementáris erővel hatott rám, beláttatta velem, hogy mennyire vakon próbálkoztunk eddig a Dmlab megoldásainak termékesítése során. Ha úgy vesszük, ez is egyfajta tükörként funkcionált nálam, csak itt az elégedett mosoly helyett az a döbbenet ült ki az arcomra, amit akkor látsz, ha egy féléves gyerek először döbben rá, hogy a tükörben mit is lát.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

11! – Mennyire volt elÅ‘relátható a big data jelenség?

11! – Mennyire volt elÅ‘relátható a big data jelenség?

Ma van a blogunk 11. születésnapja, én ilyenkor szeretek visszanézni az első blogbejegyzésünkre (Akiket le kell nyilazni...) , majd körülnézni mit is gondoltam a "détás" világról sok-sok évvel ezelőtt. Az idei visszatekintő olvasás során különösen érdekesnek találtam, hogy annak idején mennyire nem volt látható előre a big data jelenség berobbanása.

big_data_eredetmonda_gaspar_csaba_dmlab_1.png2013 végén már arról írunk, hogy mennyire mindent elsöpört abban az évben a big data (2013 - Ami tényleg történt - A nagy változás), hogyan hódította meg mainstream médiát is ez új szemlélet / divat / jelenség. Míg maga az egész folyamatot elindító Hadoop rendszer 2005-ben indult, nyolc év kellett ahhoz, hogy jelentős szerephez is jusson az adat feldolgozásával foglalkozó IT szegmensben. 

Nyolc év soknak tűnik elsőre, de a valóság az, hogy ennél sokkal rövidebb idő alatt robbant be a köztudatba. Hogy szemléltessem ezt megnéztem, hogy mikor írtuk ki a blogra először azt, hogy big data. 2011 májusában használtuk először ezt a szót a blogon (Adattárház Fórum 2011 - Beharangozó), ott is abban az összefüggésben hogy a konferencián futó előadásom "Adatbányászat a BigData világában" címet viselte, amiben lényegében a Radoop megoldásunk alapötletéről, annak létjogosultságáról beszéltem. 

Annyira új dolog volt ez akkor, hogy még 2011 év elején több olyan cikket is írtunk a blogon, ami az eljövendő trendekről ír, és ezekben a Hadoopnak, big data világnak még nyoma sincs:

  • BI Évkönyv Konferencia - ÉlÅ‘ben (2011. március) - Ebben a posztban elég részletesen beszámolunk Arató Bence félnapos minikonfernciájáról, ahol az aktuális technológiai trendeket is összefoglalta. Big data szót én nem írtam le a beszámolóban, lehet hogy megemlítette Bence, de biztos hogy nem volt fajsúlyos gondolat. Az összefoglaló alapján akkor azt vártuk, hogy a mobil készülékeken futó BI, a gyors BI és a felhÅ‘ alapú BI megoldások fogják felforgatni a világot.
  • Dan Sommler - BI trendek a nagyvilágban (2011. április) - Ha valaki azt gondolja, hogy csak Magyarországon nem látszódott a jövÅ‘, azoknak jó példa lehet az ugyanabban az évben meghallgatott elÅ‘adás részletes beszámolója, ahol a Gartner nemzetközi BI trendekrÅ‘l alkotott elképzeléseirÅ‘l lehetett hallani. Itt még a nyílt forráskódú megoldások lassú erÅ‘södésérÅ‘l illetve arról lehetett hallani, hogy jön fel a felhÅ‘, a közösségi és a minta alapú BI - bármit is jelentsen ez az utóbbi fogalom. 

bi_trends_2010_dmlabbudapest_gasparpapanekcsaba.pngTrendek címkefelhőbe foglalva (2010. január) - Ez egy bő évvel korábbi anyag, amiben az előző évek BI trendelemzési cikkeinek tartalmát hasonlítottam össze, és jeleztem melyik kifejezés erősödik, melyik gyengül az adott években (átmásoltam ehhez a poszthoz a címkefelhőt (ez akkor még menő vizualizáció volt) - szavak mérete az előfordulással arányos, a piros szavak erősödtek, a kékek kikoptak az előző évek trendelemző cikkeinek szóhasználatához képest). Látható hogy a közösségi hálók, a performance management, az SaaS vonal erősödött. Ha nagyon bele akarja látni valaki a big data előképét, akkor a cloud és a real time kulcsszavak is megjelentek, de aki emlékszik arra, hogy akkor ez mit jelentett a BI-ban, az jól érzi, hogy valójában közük sem volt a big data-hoz.

 

A fenti, szó szerint historikus adatok alapján azt lehet mondani, hogy a hazai és nemzetközi "adatos" közösséget két év alatt tarolta le a big data láz. És ez nem csak a szavak szintjén értendő: az egész adatos ökoszisztéma, a piac, az adatokhoz való viszony, a témával foglalkozó szakemberek létszáma, köre, a használt technológiák mind-mind gyökeresen átalakultak azóta. Szinte már kínos olvasni, mennyire mást gondoltunk a BI jövőjéről a kétezer-tizes évek első éveiben, mint ami most az évtized végén megvalósult.

Tanulság számomra az, hogy ebben a forrongó, változó, zajos adatos környezetben méginkább felértékelődnek a veterán szakemberek tapasztalata. És őket is csak arról érdemes kérdezni, hogy hol vagyunk most - és kevésbé arról, hogy mit fog hozni a területen a következő 5 év.  

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Találós kérdés

Találós kérdés

c.pngImént egy régi Forbes magazin került a kezembe, amiben egy általam nagyra becsült emberrel készítettek interjút. Az utolsó kérdés-választ idézném itt a cikkből.  

- A világ jelentős része az ön útmutatása alapján keresi a boldogságot. Emlékszik, mi volt élete legboldogabb pillanata?


- Nem volt egyetlen kiemelkedő pillanat, a család és a munka tesz boldoggá. Mostanában annak örülök leginkább, ha valami érdekes és váratlan összefüggést találok az adatokban.

Találós kérdésem a következő: kivel készült az interjú?

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

A lendület megszerzése

A lendület megszerzése

Egy korábbi posztunkban 5 pontban foglaltuk össze, hogyan tudjuk a cégünket az adatokban rejlő lehetőségek kiaknázásában előremozdítani. Az első pont a lelkesedés és lendület megszerzése, posztunkban ezt a kérdést járjuk körül.

Egy cég, egy szervezet fejlődési ugrása során egy olyan akadályon kell átjutnia, ami erős változást és így bizonyos fajta ellenállást is tartalmaz. Mikor valaki az adatelemzés irányába akar nyitni, általában már rögzített, jól vagy kevésbé jól, de működő folyamatokat, szemléletet akar megváltoztatni. Ebből kifolyólag az első visszajelzések elutasítóak, gyakran negatívak, azaz a motivációnkat a jelenlegi környezetünkön kívülről kell szerezni (ha cégen belülről fakadna ez természetesen, akkor a cég magától már adatvezérelté vált volna). Ilyen motivációs erőt jelent, ha lelkesedést, valamifajta lendületet gyűjtünk a cégünk adatközpontúbbá tételéhez. Ezt két lépcsőben lehet tenni:

b_1.jpgLelkesítsd be magad! - Érdemes magunkkal, nyilván itt van a legnagyobb cselekvési lehetőségünk. Ekkor ne technológiákról, megoldásokról, adatelemzési módszertanokról olvassunk, hanem keressünk olyan videókat, írásokat, hanganyagokat, esetleg könyveket, melyek inspirálnak. Ezekben olyan történetekre érdemes vadászni, ahol valaki arról lelkendezik, hogyan változtatta meg a környezetét az adatelemzés. Itt direkt előny, ha nem a saját iparágunkhoz kötődik a sztori, akkor nem azon fog járni az agyunk, hogyan adaptálható az adott módszer nálunk. Ezek a legtöbb esetben profi médiatermékek, melyeket gyakran nem is adatelemzők írnak. Onnan tudod, hogy megfelelő anyag került a kezedbe, hogy mikor végeztél vele, akkor egyszerűen azt érzed, hogy tényleg változott a szemléleted, valamit nagyon szeretnél máshogy tenni, hogy valamit most nagyon kezdeni akarsz az adataiddal. 

Néhány ötlet ilyen anyagokra (ezek az én személyes kedvenceim):

  • Videó (18 perc) - Amy Webb: How I hacked online dating - Szórakoztató és fordulatokban gazdag történet arról, hogy adatelemzÅ‘s szemléletével mire jutott az elÅ‘adó az online randioldalakon.
  • Film (133 perc) - Moneyball / Pénzcsinálók - Igaz történetet feldolgozó film, amiben Brad Pitt egy kis költségvetésű baseball csapatot hihetetlenül sikeressé tesz azzal, hogy adatelemzéssel támogatva választja ki a megvásárolandó játékosokat. 
  • Könyv (260 oldal) - Numerátorok - Interjúkötet olyan emberekkel, akik a saját üzleti területüket alapvetÅ‘en felforgatták az adatelemzés segítségével. 
  • "Képeskönyv" (260 oldal) - Information is Beautiful - Infografikákat tartalmazó képeskönyv, amit újra és újra érdemes végiglapozni.  Mint egy felnÅ‘tteknek szóló Tesz-vesz város: akárhanyadik végiglapozás során is fogsz találni valami érdekeset. 

A big data jelenség közbeszédbe való 2014-es berobbanása óta ilyen lelkesítő anyagból rengeteg született, néhány egyszerű kereséssel könnyen találunk olyanokat, melyek a mesterséges intelligencia, az önvezető autók, a teljesen adatvezérelt cégek, az automatizálás irányából fogják meg a dolgot. Nézzünk meg, olvassunk el többet is, ne feltétlenül okosabbak, inkább elszántabbak, tettrekészekké kell válnunk tőlük. 

c.jpgLelkesítsük be a csapatod! - Nem hiába emelem ki ezt külön: teljesen más módszerek jönnek itt szóba a fentiekhez képest. Ha csak elkezded küldözgetni a kollégádnak vagy a főnöködnek a grandiózus cikkeket és videókat, inkább hátráltatni fogod a folyamatot, mint segíteni. Fontos itt kiemelni, hogy egy ilyen hordejerű változást az egész cégre vonatkoztatva akkor tudsz elérni, ha te vezeted a cégedet, vagy legalábbis benne vagy a vezetésben. Ezért érdemes inkább a saját embereidre, a közvetlen munkatársaidra, esetleg egy erre fogékony egyik vezetődre koncentrálni. 

Egy csapat belelkesítésére nem ismerek recepteket, de láttam jónéhány sikeres és sikertelen példát. A sikeresek kétfajta csoportba oszthatók:

  1. Az illető a saját lelkesedésétől fűtve összeszedett annyi kompetenciát, hogy egy kisebb adatalapú megoldást készített egy hagyományos feladatára. Néha ez egy megbolondított Excel, néha egy riportáló eszköz, de volt aki egy teljes funkcionalitással bíró analitikus CRM modult is összerakott. Mikor elkészült a megoldás, általában híre ment a cégen belül a dolognak, ami követ dobott az állóvízbe. Fontos ugyanakkor, hogy ezek a mini rendszerek általában gerilla IT megoldások, és emiatt hosszú távon csak kivételes esetben lesznek ezek a programok tényleges céges megoldások. Ez utóbbi jelenséget sokszor nagyon nehezen élik meg azok, akik adatelemzési szemléletét végül átveszi a cég, de másik IT megoldást kezd építeni a feladatra.
  2. A másik lehetőség, hogy a szervezetfejlesztési, képzési vonalba illesztenek be olyan elemeket, amik kapcsán a kollégák is betekintést nyernek a big data lehetőségeibe. Több cégnél is vannak fakultatívan látogatható ismeretbővítő előadássorozatok, gyakran ebbe integrálnak témába vágó inspirációs előadásokat. Mi évente hét-nyolc ilyet előadást tartunk különböző cégeknél. Ezekben a közös minta az, hogy a meghirdetett előadásra a cég központjának minden dolgozója a marketingestől kezdve a rendszergazdákon át egészen a HR-esekig. Ennek megfelelően itt egy olyan ívet rajzolunk fel, ami bemutatja miképpen szövi át a big data világa a hétköznapjainkat kezdve a nagyvállalati marketingtől, a Facebook hirdetéseink át egészen a telefonunkon levő játékokig. Egy ilyen alkalom után még sokszor ott maradok beszélgetni a leglelkesebb résztvevőkkel, a vezetők számára az ő nevük megjegyzése talán az egyik legértékesebb hozadéka egy ilyen alkalomnak. 

Ha egy vezetőben elég erős az elszántság, sokszor ki is hagyják a csoport belelkesítését. Egyszerűen átugranak a második lépcsőre, a kompetencia növelésre: workshopokat szerveznek a dolgozók adatelemzési ötleteinek becsatornázására, vagy adatelemzős céges belső kurzust szerveznek, ahova önkéntes alapon jelentkezhetnek az emberek. Gyakran ekkor derül ki, hogy bár a vezető csak mostanában kezdett az adatokban rejlő erő kiaknázásával foglalkozni, de az kollégái már régóta lelkesek és csak a megfelelő felhatalmazás és támogatás hiányzott eddig. 

A sorozatot folytatva később a következő lépéssel, a kompetencia növelés hogyanjával foglalkozunk.

 

Érdekes lenne a céged számára egy ilyen lelkesítő előadás megtartása? Beintegrálnál egy inspirációs workshopot az általad vezetett digitális transzformációs projektbe. Keress minket bátran:

Gáspár Csaba - +36-20-8234154  vagy info@dmlab.hu 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Versbe szedett szakma

Versbe szedett szakma

Varró Dani írt az NNG felkérésére néhány gyerekverset, amiben egy-egy mai szakmát népszerűsít a gyerekek számára. �gy lett versbe szedve az adattudós (data scientist) és a machine learning szakértő élete. A versek zseniálisak, engem a legjobban mindkét vers utolsó sora fogtak meg leginkább. A képek külön zseniálisak, azokat a könyvek stílusát idézik meg bennem, melyeket én magam forgattam tizenegy-néhány éves koromban, illetve azt is megérthetjük belőle, hogy miért pont a csivava és a muffin megkülönböztetésével foglalkozik egy "gépi tanuló tanítója".

Varró Dániel: Adattudós

 

a.jpgHa én úgynevezett adattudós volnék,
minden kis adatnak mélyére hatolnék.
Minden jelenségnek a mélyére ásnék,
big data scientist volna nevem másképp.

Az adattengerbe fejest ugranék én,
hajóroncsok közt a kincset keresgélném,
kutakodnék ott lent verejtékkel, könnyel,
s a felszínre úsznék egy kis igazgyönggyel.

Kifigyelnék mindent lopva, mint a kémek,
kik néznek a neten kínos-fókás mémet,
addig kutatnék, míg meglenne a jóslat:
néznek-e utána cicás videókat.

Sok tényt elemeznék ki az adatokból,
olyat is, mi meglep, olyat is, mi sokkol.
Egy nagy színes ábrán adnék róla képet,
akkor lennék boldog, ha megértenének.

Varró Dániel: Machine Learning szakértő

 

b.jpgRendőr, postás, pék is lennék,
kertésznek is vígan mennék,
de leginkább azért főleg
machine learning szakértőnek.

Nem törődnék semmi mással,
mint a gépi tanulással.
Megtanítanám a gépem,
hogy kell viselkedni szépen.

A férfiaktól a nőket
hogy különböztesse ő meg,
s mi egymástól nem áll távol:
a muffint a csivavától.

Ha ráunt a kiskutyákra,
emberekkel diskurálna,
ámuldozna ám a jónép,
milyen okos számítógép!

Tanítgatnám, nevelgetném,
adatokkal etetgetném,
s ha már kapott elég ételt,
ronggyá verné Lékó Pétert.

Én lennék a soselátott,
bablevesbe belemártott,
sakkozókat kiborító
számítógép idomító!

A verseket tartalmazó könyv ingyen elérhető az alábbi oldalon: Ha nagy leszek..

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Versbe szedett szakma

Versbe szedett szakma

Varró Dani írt az NNG felkérésére néhány gyerekverset, amiben egy-egy mai szakmát népszerűsít a gyerekek számára. �gy lett versbe szedve az adattudós (data scientist) és a machine learning szakértő élete. A versek zseniálisak, engem a legjobban mindkét vers utolsó sora fogtak meg leginkább. A képek külön zseniálisak, azokat a könyvek stílusát idézik meg bennem, melyeket én magam forgattam tizenegy-néhány éves koromban, illetve azt is megérthetjük belőle, hogy miért pont a csivava és a muffin megkülönböztetésével foglalkozik egy "gépi tanuló tanítója".

Varró Dániel: Adattudós

 

a.jpgHa én úgynevezett adattudós volnék,
minden kis adatnak mélyére hatolnék.
Minden jelenségnek a mélyére ásnék,
big data scientist volna nevem másképp.

Az adattengerbe fejest ugranék én,
hajóroncsok közt a kincset keresgélném,
kutakodnék ott lent verejtékkel, könnyel,
s a felszínre úsznék egy kis igazgyönggyel.

Kifigyelnék mindent lopva, mint a kémek,
kik néznek a neten kínos-fókás mémet,
addig kutatnék, míg meglenne a jóslat:
néznek-e utána cicás videókat.

Sok tényt elemeznék ki az adatokból,
olyat is, mi meglep, olyat is, mi sokkol.
Egy nagy színes ábrán adnék róla képet,
akkor lennék boldog, ha megértenének.

Varró Dániel: Machine Learning szakértő

 

b.jpgRendőr, postás, pék is lennék,
kertésznek is vígan mennék,
de leginkább azért főleg
machine learning szakértőnek.

Nem törődnék semmi mással,
mint a gépi tanulással.
Megtanítanám a gépem,
hogy kell viselkedni szépen.

A férfiaktól a nőket
hogy különböztesse ő meg,
s mi egymástól nem áll távol:
a muffint a csivavától.

Ha ráunt a kiskutyákra,
emberekkel diskurálna,
ámuldozna ám a jónép,
milyen okos számítógép!

Tanítgatnám, nevelgetném,
adatokkal etetgetném,
s ha már kapott elég ételt,
ronggyá verné Lékó Pétert.

Én lennék a soselátott,
bablevesbe belemártott,
sakkozókat kiborító
számítógép idomító!

A verseket tartalmazó könyv ingyen elérhető az alábbi oldalon: Ha nagy leszek..

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Milyen lépések mentén tudod bevezetni a céged a big data világába

Milyen lépések mentén tudod bevezetni a céged a big data világába

Egy szervezetfejlesztési workshop során össze kellett gyűjtenünk, hogy milyen módon közelednek a big data világához az általunk támogatott cégek. Egy izgalmas ív került felrajzolásra, ami különösen tanulságos azoknak, akik érzik, szeretnének 2018-ban előrébb lépni az adatok adta lehetőségek kihasználásában. 

a.jpeg

A folyamatot öt fő lépésre lehet bontani:

  1. Lendület és lelkesedés megszerzése - Első lépésben nyitottságra és lelkesedésre van szükség, hogy megmozduljon valami. Ez általában két lépésben történik, először a cég vagy szervezeti egység egyik meghatározó egyénisége rákap a big data ízére: olvas egy jó cikket a neten, egy lelkesítő előadást hall egy konferencián, vagy egyszerűen beleszeret a témába egy régen látott rokonnal beszélgetve. Ezt a lelkesedést általában érdemes kicsit átragasztani a többi szereplőre is, erre remek lehetőségeket adnak a különböző olyan belső workshopok, ahol egy általános big data előadással alapozzuk meg a kollégák pozitív hozzáállását az ügyhöz (ilyen előadásokat mi is szoktunk vállalni, de erről majd később). 
  2. Kompetencia gyűjtése - Kellő induló lendület után a big data világához kapcsolódó kompetenciák gyűjtése a cél. Ez lehet új munkatársak bevonása is, de akár belső adatelemzési kurzusok, vagy megfelelő külső partnerekkel való bizalmi kapcsolat kialakítása is ide kapcsolódik. 
  3. Validáció - A következő fázisban a kompetenciákra támaszkodva kiválasztásra kerül, hogy milyen fajta folyamatokat érdemes átalakítani adatvezérelté. Ez egy részben üzleti feladat, hiszen azt is vizsgálni kell, hogy elérhetőek-e azok az adatok már a cégen belül, amik kulcsszerepet kapnak a ebben a megközelítésben. Itt konkrét adatelemzési feladatok ritkán valósulnak meg, sokkal inkább az újszerű, innovatív adatfelhasználás létjogosultságát kell ellenőrizni.
  4. Proof-of-concept - Ha tudjuk, hol lenne érdemes a big data módszereket használni, nem egy rendszert kell egyből építeni: sokkal fontosabb, hogy ellenőrizzük, hogy megfelelő szinten megoldható-e az data science feladat, amit kitűztünk magunk elé. Ekkor tipikusan historikus adatokon bizonyítjuk, hogy egy jó adatelemzési módszerrel elérhető az üzleti értelemben vett előrelépés az adott módszerrel. Az data science feladatok megoldásán, a gépi tanulási eljárások futtatásán túl ekkor lehet pontosabb megtérülési számításokat is végezni.
  5. Rendszer építése - Ha bizonyításra került, hogy a gépi tanulási eljárásokkal korábban is tudtunk volna előnyöket elérni, akkor érdemes ezeket a jelenben és a jövőben meg is szerezni. Ehhez egy olyan rendszert kell építeni, ami a big data megoldást folyamatosan üzemelteti, időről-időről időre ellenőrzi működését, számszerűsíti az általa elért többletet. Sokan azt hiszeik, hogy ez már csak egy apró lépés az előző pont után, de a valóság az, hogy ami a már ismert múltbeli adatokon jól működött, az jelentős mennyiségű fejlesztést és integrációs feladatot követelhet, ha egy teljes rendszerbe kell azt integrálni. 

Látható, hogy az öt lépés során bárhol el tud akadni a folyamat. Vagy azért, mert a prioritások máshova viszik a fókuszt, és nem szerzi meg a cég a megfelelő kompetenciát, vagy mert a proof-of-concept megoldás eredménye nem jelzi egyértelműen, hogy érdemes egy új rendszert építeni.

Ugyanakkor a fenti modell abban tényleg nagyon sokat segít, hogy azonosítani lehessen, mire is van valakinek szüksége. Például, ha még csak lelkes vagy a big data világa iránt, nem feltétlenül kell még egy konkrét technológia, platform mellett elköteleződnöd, ráérsz ezt majd a 4. és 5. pont között megtenni - még akkor sem, ha úgy gondolod, hogy egyből olyan kompetenciákat akarsz megszerezni, ami a majdani technológiákhoz szervesen kapcsolódik. 

Ha te is éppen a big data világába szeretnéd jobban bevinni a céged, érdemes elgondolkodni, hogy hol is tartasz a fenti folyamatban, és arra fókuszálni, ahol ténylegesen vagy. Tapasztalataink szerint nem érdemes kihagyni egyetlen fejlődési fázist sem, később ez mindig megbosszulja magát. 

Szívesen írunk a fenti fázisokról még tapasztalatokat, áruld el nekünk, neked melyik fázis izgalmas éppen:

Melyik lépést fejtsük ki bővebben - Szavazás

(Kép forrása)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Milyen lépések mentén tudod bevezetni a céged a big data világába

Milyen lépések mentén tudod bevezetni a céged a big data világába

Egy szervezetfejlesztési workshop során össze kellett gyűjtenünk, hogy milyen módon közelednek a big data világához az általunk támogatott cégek. Egy izgalmas ív került felrajzolásra, ami különösen tanulságos azoknak, akik érzik, szeretnének 2018-ban előrébb lépni az adatok adta lehetőségek kihasználásában. 

a.jpeg

A folyamatot öt fő lépésre lehet bontani:

  1. Lendület és lelkesedés megszerzése - Első lépésben nyitottságra és lelkesedésre van szükség, hogy megmozduljon valami. Ez általában két lépésben történik, először a cég vagy szervezeti egység egyik meghatározó egyénisége rákap a big data ízére: olvas egy jó cikket a neten, egy lelkesítő előadást hall egy konferencián, vagy egyszerűen beleszeret a témába egy régen látott rokonnal beszélgetve. Ezt a lelkesedést általában érdemes kicsit átragasztani a többi szereplőre is, erre remek lehetőségeket adnak a különböző olyan belső workshopok, ahol egy általános big data előadással alapozzuk meg a kollégák pozitív hozzáállását az ügyhöz (ilyen előadásokat mi is szoktunk vállalni, de erről majd később). 
  2. Kompetencia gyűjtése - Kellő induló lendület után a big data világához kapcsolódó kompetenciák gyűjtése a cél. Ez lehet új munkatársak bevonása is, de akár belső adatelemzési kurzusok, vagy megfelelő külső partnerekkel való bizalmi kapcsolat kialakítása is ide kapcsolódik. 
  3. Validáció - A következő fázisban a kompetenciákra támaszkodva kiválasztásra kerül, hogy milyen fajta folyamatokat érdemes átalakítani adatvezérelté. Ez egy részben üzleti feladat, hiszen azt is vizsgálni kell, hogy elérhetőek-e azok az adatok már a cégen belül, amik kulcsszerepet kapnak a ebben a megközelítésben. Itt konkrét adatelemzési feladatok ritkán valósulnak meg, sokkal inkább az újszerű, innovatív adatfelhasználás létjogosultságát kell ellenőrizni.
  4. Proof-of-concept - Ha tudjuk, hol lenne érdemes a big data módszereket használni, nem egy rendszert kell egyből építeni: sokkal fontosabb, hogy ellenőrizzük, hogy megfelelő szinten megoldható-e az data science feladat, amit kitűztünk magunk elé. Ekkor tipikusan historikus adatokon bizonyítjuk, hogy egy jó adatelemzési módszerrel elérhető az üzleti értelemben vett előrelépés az adott módszerrel. Az data science feladatok megoldásán, a gépi tanulási eljárások futtatásán túl ekkor lehet pontosabb megtérülési számításokat is végezni.
  5. Rendszer építése - Ha bizonyításra került, hogy a gépi tanulási eljárásokkal korábban is tudtunk volna előnyöket elérni, akkor érdemes ezeket a jelenben és a jövőben meg is szerezni. Ehhez egy olyan rendszert kell építeni, ami a big data megoldást folyamatosan üzemelteti, időről-időről időre ellenőrzi működését, számszerűsíti az általa elért többletet. Sokan azt hiszeik, hogy ez már csak egy apró lépés az előző pont után, de a valóság az, hogy ami a már ismert múltbeli adatokon jól működött, az jelentős mennyiségű fejlesztést és integrációs feladatot követelhet, ha egy teljes rendszerbe kell azt integrálni. 

Látható, hogy az öt lépés során bárhol el tud akadni a folyamat. Vagy azért, mert a prioritások máshova viszik a fókuszt, és nem szerzi meg a cég a megfelelő kompetenciát, vagy mert a proof-of-concept megoldás eredménye nem jelzi egyértelműen, hogy érdemes egy új rendszert építeni.

Ugyanakkor a fenti modell abban tényleg nagyon sokat segít, hogy azonosítani lehessen, mire is van valakinek szüksége. Például, ha még csak lelkes vagy a big data világa iránt, nem feltétlenül kell még egy konkrét technológia, platform mellett elköteleződnöd, ráérsz ezt majd a 4. és 5. pont között megtenni - még akkor sem, ha úgy gondolod, hogy egyből olyan kompetenciákat akarsz megszerezni, ami a majdani technológiákhoz szervesen kapcsolódik. 

Ha te is éppen a big data világába szeretnéd jobban bevinni a céged, érdemes elgondolkodni, hogy hol is tartasz a fenti folyamatban, és arra fókuszálni, ahol ténylegesen vagy. Tapasztalataink szerint nem érdemes kihagyni egyetlen fejlődési fázist sem, később ez mindig megbosszulja magát. 

Szívesen írunk a fenti fázisokról még tapasztalatokat, áruld el nekünk, neked melyik fázis izgalmas éppen:

Melyik lépést fejtsük ki bővebben - Szavazás

(Kép forrása)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

(Hallgatóknak rövidítve:)

BME választható tárgyak hiteles előadóktól:

- Alkalmazott adatelemzés (K-Cs 12h) minden órán laptopoddal dolgozol, Python, R és SAS + data science és gépi tanulás alapjai
- 'Big Data' elemzési eszközök nyílt forráskódú platformokon (Sz 12h) Hadoop, Spark, teljes big data stack

Go to Neptun!

a.jpg

(Külsősöknek, részletek után érdeklődőknek)

Idén is meghirdetjük a BME-n tartott legfontosabb tárgyainkat külsősök számára is. Ez azt jelenti, hogy a műegyetemista hallgatókkal együtt szeptember elejétől 14 héten keresztül lehet a data science és a big data világába betekintést kapni. 

A kezdeményezés igen népszerű, de a helyek számát korlátozzák (1) a rendelkezésre álló termek méretei, illetve (2) az az elvünk, hogy nem engedünk be több külsős érdeklődőt a tárgyra, mint ahány egyetemi hallgató jelentkezett az órára.

 

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Az iteratív módon fejlesztett adatfeldolgozó eljárások vannak a középpontban, az adatelemzés programozási nyelveit tanítjuk nektek. A téma a data science alapfeladatainak megoldása abban az esetben, ha valamilyen programozási nyelven kell megoldani a problémát: SAS programozási nyelvet, Python és R programozást tanítunk úgy, hogy az órákon mindenki a saját gépén ugyanúgy készíti a programkódot, mint az előadó a kivetítőn. Igazi közös gondolkodás, szemléletátadás is így válik lehetségessé, hiszen itt tényleg bezavarnak a valós adatok sajátosságai, nem minden csodaszép, mint a machine learning könyvekben. 

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Szerda 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Itt a Dmlab big data szakemberei adnak betekintést a területen kialakult technológiai stack felépítésébe. A MapReduce, Hadoop alapoktól indulunk, és a legújabb technológiákig jutunk el. Nyilván mindben teljesen nem fogunk tudni elmélyedni, de aki ezt a kurzust végighallgatja, az könnyen fog tájékozódni a big data technológiák között. A félév végén egy ZH és egy házifeladat alapján kapnak jegyet a hallgatók, külön kérésre a külsős kollégák is megmérettethetik magukat ezeken a számonkéréseken.

Mindkét tárgyra itt tudtok külsősként jelentkezni: JELENTKEZÉS

A jelentkezés alapvetően jelentkezési sorrendben történik, várhatóan a hét végén fogunk eredményt hirdetni. A hírlevélre feliratkozók között már néhány nappal korábban már kiküldtük az információt. A részvételnek nincs külön feltétele, a kurzuson való részvétel ingyenes. Van lehetőség arra is, hogy hivatalosan beiratkozz néhány tízezer Forintért a BME-re erre a tárgyra, ebben az esetben hivatalosan le is vizsgáztatunk, és mint hallgató vehetsz részt a tárgyon. 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

Å�szi data science választható tárgyak – Nem csak BME hallgatóknak

(Hallgatóknak rövidítve:)

BME választható tárgyak hiteles előadóktól:

- Alkalmazott adatelemzés (K-Cs 12h) minden órán laptopoddal dolgozol, Python, R és SAS + data science és gépi tanulás alapjai
- 'Big Data' elemzési eszközök nyílt forráskódú platformokon (Sz 12h) Hadoop, Spark, teljes big data stack

Go to Neptun!

a.jpg

(Külsősöknek, részletek után érdeklődőknek)

Idén is meghirdetjük a BME-n tartott legfontosabb tárgyainkat külsősök számára is. Ez azt jelenti, hogy a műegyetemista hallgatókkal együtt szeptember elejétől 14 héten keresztül lehet a data science és a big data világába betekintést kapni. 

A kezdeményezés igen népszerű, de a helyek számát korlátozzák (1) a rendelkezésre álló termek méretei, illetve (2) az az elvünk, hogy nem engedünk be több külsős érdeklődőt a tárgyra, mint ahány egyetemi hallgató jelentkezett az órára.

 

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Az iteratív módon fejlesztett adatfeldolgozó eljárások vannak a középpontban, az adatelemzés programozási nyelveit tanítjuk nektek. A téma a data science alapfeladatainak megoldása abban az esetben, ha valamilyen programozási nyelven kell megoldani a problémát: SAS programozási nyelvet, Python és R programozást tanítunk úgy, hogy az órákon mindenki a saját gépén ugyanúgy készíti a programkódot, mint az előadó a kivetítőn. Igazi közös gondolkodás, szemléletátadás is így válik lehetségessé, hiszen itt tényleg bezavarnak a valós adatok sajátosságai, nem minden csodaszép, mint a machine learning könyvekben. 

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Szerda 12-14h
Terem: Lágymányosi kampusz, Magyar tudósok körútja
Tárgy hivatalos tematikája

Itt a Dmlab big data szakemberei adnak betekintést a területen kialakult technológiai stack felépítésébe. A MapReduce, Hadoop alapoktól indulunk, és a legújabb technológiákig jutunk el. Nyilván mindben teljesen nem fogunk tudni elmélyedni, de aki ezt a kurzust végighallgatja, az könnyen fog tájékozódni a big data technológiák között. A félév végén egy ZH és egy házifeladat alapján kapnak jegyet a hallgatók, külön kérésre a külsős kollégák is megmérettethetik magukat ezeken a számonkéréseken.

Mindkét tárgyra itt tudtok külsősként jelentkezni: JELENTKEZÉS

A jelentkezés alapvetően jelentkezési sorrendben történik, várhatóan a hét végén fogunk eredményt hirdetni. A hírlevélre feliratkozók között már néhány nappal korábban már kiküldtük az információt. A részvételnek nincs külön feltétele, a kurzuson való részvétel ingyenes. Van lehetőség arra is, hogy hivatalosan beiratkozz néhány tízezer Forintért a BME-re erre a tárgyra, ebben az esetben hivatalosan le is vizsgáztatunk, és mint hallgató vehetsz részt a tárgyon. 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

10 éves a dmlab

10 éves a dmlab

Hálás vagyok. Ennek az egyszerű gondolatnak mindenféle variációja kavarog a fejemben, mikor arra gondolok, hogy ma 2017 május 10.-én ünnepeljük a dmlab alakulásának tizedik évfordulóját. Ahogy a tíz évnyi élményt átpörgetem a fejemen, valahogy azt érzem, hogy ez nagyon jó tíz év volt. Annyira pozitív bennem az összkép, hogy szinte hitetlenkedve szedem össze az agyam rejtet zugaiból a nehézségek, a kudarcok élményeit. És mikor ezeket is sorba veszem, méginkább kereknek és jónak látom ezt az időszakot. Hálás vagyok azért, hogy így tekinthetek vissza.


picture1.pngHálás vagyok azokért, akikkel ezt az egészet tíz éve elindítottuk. Ha dmlab indulására gondolok, egy rövid TED videó jut eszembe, ami egy rövid vicces videó elemzésén keresztül mutatja be, hogyan indul el egy mozgalom (link). Kiemeli, hogy egy új kezdeményezés indításánál nem az azt indító vezető személye a legfontosabb, hanem annak az első egy-két társnak a döntése, akik elsőként hozzá csatlakozva vezetővé teszik. Hálás vagyok ezért Nagy Istvánnak, Főző Csabának, majd Ivónak, Prekónak, Attilának, Petinek, majd Gergőnek, Csabinak, Simonnak, és sokáig sorolhatnám ki mindenkinek, akik hittek abban, hogy lehet és érdemes a dmlab kötelékében valami újat és nagyszerűt alkotni.

Hálás vagyok azért a bátorságért és azért vakságért, vakmerőségért, ami ezt a csapatot jellemezte. Bátrak voltunk, mikor új és járatlan, kockázatos utakon kezdtünk el járni, és olykor vakmerők voltunk, mikor nem is voltunk képesek felmérni, mekkora fába vágtuk a fejszénket - és néha milyen jól jött, hogy emiatt megijedni, visszarettenni sem volt lehetőségünk. Hálás vagyok azért, mert ez a kísérletező kedv, ez a szabályok és a berögződött reflexeket felülírni akaró szemlélet, ez a kreatív energia mind a mai napig áthatja a csapatot.

Hálás vagyok, hogy a tíz év során időről-időre feltettük a kérdést magunknak mit és hogyan akarunk elérni közösen. Hálás vagyok Törőért, mert segített nekünk rátalálni egy őszinte és előremutató vízióra, segített megérteni, hogy ahogy a cégnek ugyanúgy eredménye, terméke, hogy milyen munkahelyeket hoz létre, hogy milyen kollegiális viszonyban és hogyan dolgozunk együtt, tudatosodott bennünk, hogy milyen ügyeket, célokat és cégeket szolgálunk és segítünk.

Hálás vagyok a sok projektért, pilotért és oktatásért, hálás vagyok a dmlab-ból induló, “spin-off-oló� startupért és azok sikeréért. Büszkék vagyunk rátok.

Hálás vagyok a tíz évet folyton átszövő változásokért. Még úgy is, hogy tudom, hogy nem minden változás fejlődés, és nem minden fejlődés gyarapodás volt a dmlabban. De álltuk a sarat, megtaláltuk az új helyzetekben a lehetőséget, és szinte kivétel nélkül ki tudtuk használni azt. A napokban kezembe került a dmlab egy kilenc éve született stratégiai terve. Mellbevágó volt belenézni, és látni hogy mennyire keveset változtak a lényegi dolgok tíz év alatt, miközben mégis minden megváltozott: a szakma, a piac, és mi magunk is mennyit fejlődtünk.

Köszönjük.

“Ez jó mulatság, férfi munka volt!�

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

10 éves a dmlab

10 éves a dmlab

Hálás vagyok. Ennek az egyszerű gondolatnak mindenféle variációja kavarog a fejemben, mikor arra gondolok, hogy ma 2017 május 10.-én ünnepeljük a dmlab alakulásának tizedik évfordulóját. Ahogy a tíz évnyi élményt átpörgetem a fejemen, valahogy azt érzem, hogy ez nagyon jó tíz év volt. Annyira pozitív bennem az összkép, hogy szinte hitetlenkedve szedem össze az agyam rejtet zugaiból a nehézségek, a kudarcok élményeit. És mikor ezeket is sorba veszem, méginkább kereknek és jónak látom ezt az időszakot. Hálás vagyok azért, hogy így tekinthetek vissza.


picture1.pngHálás vagyok azokért, akikkel ezt az egészet tíz éve elindítottuk. Ha dmlab indulására gondolok, egy rövid TED videó jut eszembe, ami egy rövid vicces videó elemzésén keresztül mutatja be, hogyan indul el egy mozgalom (link). Kiemeli, hogy egy új kezdeményezés indításánál nem az azt indító vezető személye a legfontosabb, hanem annak az első egy-két társnak a döntése, akik elsőként hozzá csatlakozva vezetővé teszik. Hálás vagyok ezért Nagy Istvánnak, Főző Csabának, majd Ivónak, Prekónak, Attilának, Petinek, majd Gergőnek, Csabinak, Simonnak, és sokáig sorolhatnám ki mindenkinek, akik hittek abban, hogy lehet és érdemes a dmlab kötelékében valami újat és nagyszerűt alkotni.

Hálás vagyok azért a bátorságért és azért vakságért, vakmerőségért, ami ezt a csapatot jellemezte. Bátrak voltunk, mikor új és járatlan, kockázatos utakon kezdtünk el járni, és olykor vakmerők voltunk, mikor nem is voltunk képesek felmérni, mekkora fába vágtuk a fejszénket - és néha milyen jól jött, hogy emiatt megijedni, visszarettenni sem volt lehetőségünk. Hálás vagyok azért, mert ez a kísérletező kedv, ez a szabályok és a berögződött reflexeket felülírni akaró szemlélet, ez a kreatív energia mind a mai napig áthatja a csapatot.

Hálás vagyok, hogy a tíz év során időről-időre feltettük a kérdést magunknak mit és hogyan akarunk elérni közösen. Hálás vagyok Törőért, mert segített nekünk rátalálni egy őszinte és előremutató vízióra, segített megérteni, hogy ahogy a cégnek ugyanúgy eredménye, terméke, hogy milyen munkahelyeket hoz létre, hogy milyen kollegiális viszonyban és hogyan dolgozunk együtt, tudatosodott bennünk, hogy milyen ügyeket, célokat és cégeket szolgálunk és segítünk.

Hálás vagyok a sok projektért, pilotért és oktatásért, hálás vagyok a dmlab-ból induló, “spin-off-oló� startupért és azok sikeréért. Büszkék vagyunk rátok.

Hálás vagyok a tíz évet folyton átszövő változásokért. Még úgy is, hogy tudom, hogy nem minden változás fejlődés, és nem minden fejlődés gyarapodás volt a dmlabban. De álltuk a sarat, megtaláltuk az új helyzetekben a lehetőséget, és szinte kivétel nélkül ki tudtuk használni azt. A napokban kezembe került a dmlab egy kilenc éve született stratégiai terve. Mellbevágó volt belenézni, és látni hogy mennyire keveset változtak a lényegi dolgok tíz év alatt, miközben mégis minden megváltozott: a szakma, a piac, és mi magunk is mennyit fejlődtünk.

Köszönjük.

“Ez jó mulatság, férfi munka volt!�

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

[BreakingNews] A Kaggle-t felvásárolta a Google

[BreakingNews] A Kaggle-t felvásárolta a Google

Ma hajnalban ütött be a hír, hogy a Google felvásárolta a legnagyobb adatbányászati versenyeket szervező oldalt, a Kaggle.com site-ot (első hír itt, hivatalosabbak itt , de a Google a blogposzt írásának időpontjában még hivatalosan nem jelentette be a tranzakciót). A vételárról nincsenek hírek, a 2010-es alapítása óta eddig 12,5 millió dollár befektetést tudott bevonni a cég.


kaggle_vs_google.pngA hír váratlanul ért, de sok szempontból nem annyira meglepő: a Google számára sok dolog jól jöhet a Kaggle portfóliójából. Kaggle a data science közösség egyik központi oldala, saját álláskereső oldalával és a közel félmillió felhasználójával (! - én ezt nem is nagyon akarom elhinni) jó merítés a cégnek már csak toborzási szempontból is. Ezen túlmenően a Kernels nevű kezdeményezésével a Kaggle egy saját gépi tanulási platformot is létrehozott, ami jól fog virítani a Google Cloud embléma alatt is. Talán ez az a pont, ahol mint Kaggle felhasználók a legtöbbet nyerhetünk. Nem hiába, a Google olyan cég, aki hisz az adatok erejében, miért ne hinné el, hogy a data scientist-ek világának közepét is érdemes birtokolnia. 


Másfelöl a felvásárlás azt is bizonyítja számomra, hogy az adatokkal dolgozó cégek és szakemberek univerzumában a nagy techóriások egyfajta hatalmas gravitációjú csillagoknak tekinthetők: egyre gyorsabban szippantják be az ígéretes kezdeményezéseket, az igazán izgalmas dolgok körülöttük történnek. Az itt felhalmozódó hatalmas adat- és tudásvagyonnal egyre nehezebben fognak versenyezni azok a vállalatok, melyek homlokterében az adatokkal való munka egyfajta megtűrt hobby vagy kényszerű próbálkozás.

google_vs_kaggle_1.pngPéldául a napokban találkoztam olyan nagyvállalattal, ahol egyenesen az volt a vélemény, hogy félnek belső kompetenciát építeni, mert ha valaki megtanulná ezt a szakmát a cégen belül, azt biztos hamar lecsábítanák az ilyen emberekre vadászó más cégek. Pedig hosszú távon valójában fordított tendenciák várhatók: hosszú távon az adatvezérelt gondolkodás, az adatokkal való barátság inkább alapkövetelményként fog megjelenni, mint szelekciós szempontként. De a lemaradók megnyugtatására és az élenjárók szomorúsága végett le kell szögeznem: mint minden változás, aminek az emberi fejekben kell végbemennie, sokkal lassabban fog megvalósulni, mint amekkora tempót maga a technológia diktál. 

Gratulálunk a Kaggle csapatának!

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Big data nyugati és keleti szemléletben

Big data nyugati és keleti szemléletben

A Műegyetem büféjében egy közgazdász kolléganőnktől hallottam egy érdekes gondolatot (mémet), melyen az elmúlt hónapban sokat morfondíroztam. Zsuzsa meglátása szerint az európai kultúrában a gazdaságban megjelenő adatokhoz, az azokban megjelenő összefüggésekhez, a ma big data néven futó jelenséghez külön nyugati és keleti (bizánci) megközelítés tartozik. A nyugati gondolkodásmódban az adatokra támaszkodva növelhetjük a hatékonyságunkat, alkalmazkodhatunk a változó környezethez, versenyelőnyhöz juthatunk - így az adatelemzés célja tipikusan a profitnövelés irányába mutat. A keleti (bizánci) szemléletben az adatok gyűjtésének célja az ellenőrzés, az állami vagy egyéb hatalom felügyeleti tevékenységéhez tartozik - célunk az ellenőrzés, a kitűzött célok végrehajtásának ellenőrzése. 

east-vs-west.jpgValóban kézzelfoghatóan különválik ez a két szemlélet, még akkor is, ha egy-egy jól működő szervezeten belül mindkettőnek meg kell jelennie. Ha technológiai szemmel nézzük az gépi tanulási feladatok előrejelzéshez köthető részei inkább a profitmaximalizáló, hatékonyságnövelő szemlélethez köthető, míg az én látásmódomban kicsit a klaszterezés és nagy mértékben az anomália detekció a felügyelő / ellenőrző látásmódhoz köthető. Egy BI vagy riporting rendszer magában nem köthető egy-egy területhez, de a használatuk mögötti motiváció gyakran az egyik szemlélethez húz. 

Az elmúlt héten áttekintettem a fenti szempontból a 2016-os projektjeinket (jó lehetőséget adott erre, mikor az Éviránytű évértékelő munkafüzetét töltöttem ki), és egyértelműen szátváltak erre a két csoportra, még akkor is, ha egyes partnereknél végül mindkét irány megjelent. Az egyik legtipikusabb példa, mikor kamionsofőrök fogyasztási szokásainak elemzését végeztük: elsőként úgy volt megfogalmazva az üzleti kérdés, hogy találjuk meg, mi a különbség a jól fogyasztási adatokkal futó sofőrök és a több üzemanyagot használó kollégáik között. A projekt végkicsengésénél viszont megjelent az az igény, hogy mennyivel jobb lenne a sofőr szokásai, az útviszonyok, az időjárás és a rakomány figyelembevételével olyan útvonaltervezést megvalósítani, ahol a becsült üzemanyagköltséggel és a különböző útdíjakkal egyszerre tudnánk számolni.

Elgondolkodtam azon is, vajon milyen szemlélet jellemző hazai cégekre? Ez cégkultúrától függ, ami alakítható - így talán nem is ez a jó kérdés. Ha az egyének szintjén vizsgáljuk a kérdést, azt mondhatjuk, hogy a magyarok alap beállítottsága inkább a keleti szemlélethez húz. Jó példázza ezt nekem, hogy mikor egy társaságban elmesélem, hogy egy jó és egy rossz kamionsofőr között 3-4 liter fogyasztás-különbség is lehet 100 km-en, a legtöbben azt a zsigeri választ adják, hogy biztos lopják az üzemanyagot. Az adatokból látszik, hogy rengeteg oka lehet a különbségnek (például mennyit használja a tempomatot az vezető), de az alap asszociációnk oda mutat, az adatok valami kis stiklit, csalást, trükközést fognak felfedni.

Fontos kiemelni, hogy ez a kettősség nem a személyes adatokról vagy privacy védelméről szól - de mégis van ide vágó aspektusa. Képzeljük el, hogy a munkahelyünkön minden eddiginél pontosabb és jobb adatgyűjtést vezet be a főnökség, például pontosabb képet fognak kapni az egyes kollégák teljesítményéről. A változást lehet pozitívan látni ("végre látni fogják, milyen sokat tettem a cégért"), vagy negatív módon viszonyulni hozzá ("ki fogják szúrni, hogy pénteken hamarabb szoktam lelépni"), és utána ennek megfelelően lehet támogatni vagy szabotálni a bevezetést. Mindenkire rábízom, hogy mit tenne ő egy ilyen szituációban. 

Bármilyen is az alap beállítottságunk, erre rálátva tudatosan tudjuk integrálni a kétfajta szemlélet előnyeit. Izgalmasabb kérdés számomra, hogy mennyire más módon kell a különböző szemléletű cégeknél egy-egy megoldást bevezetni, mennyire más motivációk és félelmek uralják a gondolkodást a két esetben.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

A túlterhelt csomagküldÅ‘k esete – adatelemzÅ‘ szemmel

A túlterhelt csomagküldÅ‘k esete – adatelemzÅ‘ szemmel

Idén az adventi időszak kötelező feladatai közé bekerült a Posta illetve más csomagküldő szolgálatok szidása, miszerint miért nem készültek fel időben a karácsonyi dömpingre. Örök téma ez, bárkivel el lehet róla beszélgetni, mindenkit érint és mindenki ért hozzá - olyan mint az időjárás, a politika vagy a foci. A szállingózó történetek először idén is a Postáról szóltak, de az elmúlt hetekre végülis minden csomagküldőre kiterjedtek, végül nem egyetlen cég bénázásáról, hanem valami általánosabb jelenségről van szó.

Tudvalevő, hogy a karácsonyi webshop őrületre a csomagküldő szolgáltatók is készülnek. Ez a szektor az elmúlt évtized EU-s szabályozási változtatásai kapcsán egy fejlődő, sokszereplős és versenyezni képes iparággá nőtte ki magát, ahol a hétköznapi értelemben van innováció, a legtöbb cég vezetőit kőkemény üzleti racionalitás hatja át: a karácsony a legerősebb időszakuk, biztosan kalkuláltak a megnövekedett feladatokkal. Ahogy a hírekben hallható mentegetőzésből kijön, azt is tudták, hogy nemcsak több, hanem a tavalyinál jóval több csomagot kell elvinni majd. Több helyen is olvashatjuk, hogy a karácsonyi időszak csomagmennyisége évi 20%-kal növekedett az elmúlt években, így a legtöbb helyen erre a mennyiségre lőtték be a kapacitásaikat.

screen_shot_2016-12-22_at_23_44_33.pngÉs itt jön a fordulat - idén a 40%-kal több csomagot adtunk fel. Persze lehetne ezt a hazai webes áruküldés csodájaként is megélni, ünnepelhetnénk a hazai digitális fordulatot (mint ahogy sok más országban egy-egy black friday után a webes cégek azzal dicsekednek mennyivel dőltek meg az eddigi rekordok), ehelyett inkább azt hallhatjuk, hogy ez az óriási különbség mennyire váratlanul érte az előrejelzés szerint 20%-os emelkedésre számító szereplőket.

�BRA: Az eNet pont egy évvel ezelőtti infografikájából kivágott rész a hazai webes kereskedelem forgalmáról - Eredeti cikket is ajánlom figyelmetekbe: eNet: E-kereskedelmi körkép 2015

Adatelemzőként persze csak csóválom a fejem. Ha valami három éve 20%-ot nő, akkor a következő évre 20% növekedést prognosztizálni elsőre nem tűnik butaságnak. Csak akkor, ha valamit épp pont a web hajt. Hol hallottunk olyat egy webes trend kapcsán, hogy úgy örökké egyenletesen emelkedett? A weben a dolgok berobbanása vagy elhalása a gyakoribb. Mindemelett 40% növekedés nem berobbanás. És itt kezdek zavarba jönni adatok híján: vajon megvizsgálták a cégek, hogy a sok rendelés közül mely webáruházakra, mely termékcsoportokra volt jellemző a felfutás? Nagy összegekben mernék fogadni, hogy a többlet nem egyenletesen oszlik el. Vagy nem egyenletes vásárlói csoporton. A web világa csak eleinte "lassú víz partot mos" jellegű - később vagy nem lesz semmi, vagy jön a földcsuszamlás. Ez az óriási melléfogás bizony az előrejelzést végzők hibája - a csomagküldés piacát legjobban a webes kiskereskedelem hajtja, ennek elemzése nélkül nem lehet csak a görbére ránézni, és csak úgy továbbhúzni a vonalat.

Hallottam persze furfangos magyarázatokat is - szigorúan a felelősöket minél távolabb keresve. A kedvenc két témám a vasárnapi boltbezárás és a későn érkező hideggel magyarázza a dolgokat. Az első úgy jön a képbe, hogy a vasárnapi boltbezárás időszaka alatt a webáruházak jóval elfogadottabbak lettek az elmúlt években, ez a hatás "gyűrűzött" be most karácsonykor ennyire erősen. Egy másik elmélet azzal magyarázza a dolgokat, hogy későn jött be az igazán hideg hazákba, ami hatására mindig jobban felpörögnek az otthon melegéből rendelhető termékek forgalma. Egyik hatásra vonatkozó elemzéseket se ismerek, de mindkettő inkább műértő okoskodásnak tűnik elsőre.

Mit tegyenek a csomagküldők jövőre? Ezer ötletem van az adatelemzés területén kívülről is, kezdve a novemberben előre megvásárolható futárkapacitástól, a rendelés pillanatában előre kalkulált valós érkezési időpontig. Az adatok jobb kihasználása nem annyit tesz, hogy jövőre komolyabb aparátussal ki tudnak hozni 20+x százaléknyi várható forgalomnövekedést, és ezt higgye el mindenki. Itt folyamatokhoz kellene hozzányúlni, miközben extra nagy források a feladat megoldására nem állhat rendelkezésre.

Leginkább azokat az ajándékozni vágyókat sajnálom, akik félve figyelik a kaput, megjön-e még a csomagjuk karácsony este előtt. Drukkolunk nekik és bízunk hogy nem kuponok gyártásával telik majd a szombat délutánjuk.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Data science és big data képzések – ÉrdeklÅ‘dÅ‘k gyűjtése

Data science és big data képzések – ÉrdeklÅ‘dÅ‘k gyűjtése

A napokban sokan megkerestek milyen oktatásokat tartunk a közeljövőben, milyen BME-s előadásokat fogunk megnyitni a külsősök előtt, milyen cégre szabott oktatásokat lehet kérni tőlünk. Hogy ne csak azt mondhassuk, hogy a kövessétek a blogot, arra gondoltam jó ötlet gyűjteni az érdeklődők elérhetőségeti:

Ha szeretnél értesítést kapni előzetesen azokról a data science és big data oktatásokról, melyekben részt veszünk, regisztráld magadat az alábbi oldalon:

Érdeklődőként való regisztráció

proactive.pngA blogon továbbra is jelezni fogjuk az aktuális lehetőségeket, a blog hírlevelét (jelentkezés itt) most újítottuk meg, ott is megírjuk az információkat, ez a lista azonban nem hírlevél. Ha bejelölöd milyen típusú dolgok érdekelnek, és éppen indítunk valami ide vágó oktatást, akkor a regisztráltaknak proaktívan kiküldjük a rájuk vonatkozó információkat. 

Reméljük ez is segít majd azoknak, akik már most tervezik a jövő évi oktatási keretüket is. 

 

ideaw.gifHa nem tudtok várni arra, hogy megjelenjenek a meghirdetett oktatások, vagy egyedi igényetek van, keressetek meg bátran, a legtöbb oktatásunk cégre / személyre szabottan fut, keress meg minket, szívesen javaslunk tematikát és adunk ajánlatot.

Gáspár Csaba: gaspar.csaba@dmlab.hu  +36208234154

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Csavarjunk egyet az innovatív adatelemzési irányok keresésén

Csavarjunk egyet az innovatív adatelemzési irányok keresésén

crisp_dm.pngA Nagy Könyvben az áll, hogy egy valamirevaló adatbányászati / adatelemzési projektet a CRISP-DM (Cross Industry Standard Process for Data Mining) metodika szerint érdemes menedzselni. Eszerint egy projektnek hat fő fázisa van, (1) első lépésben megértjük az üzleti problémát, majd (2) a hozzá kapcsolódó adatokat, (3) adatátalakításokat végzünk, (4) gépi tanulási vagy statisztikai modelleket futtatunk, (5) kiértékeljük a kapott eredményeket üzleti szempontból, és persze ha minden klappol, akkor (6) hadrendbe állítjuk a megoldást. Nyilván ennél bonyolultabb a helyzet (a részletes leírást a metodikáról itt olvashatunk), szinte mindig van szükség iterációkra, mikor egy vagy több fázist is vissza kell ugranunk az aktuális lépés során tapasztaltak miatt. Érdekes látni, hogy ez iteratív fejlesztés mennyire jól illeszthető a ma egyre jobban terjedő agilis szemlélethez. 

De nem is a CRISP-DM metodikát akarom most kivesézni, felülbírálni - minden hibája ellenére igazán szeretem, gyakran mentett meg minket kényes helyzetekben. Inkább egy újfajta jelenségre szeretném felhívni a figyelmet: egyre többször van lehetőségünk olyan módon elkezdeni egy-egy projektet, hogy nem a legelső fázisnál, az üzleti feladat megértésénél indulunk - hanem a másodiknál, az adatok megismerésénél.

Arról van szó, hogy vannak vállalatok, akik nagyon vágynak arra, hogy valami igazán izgalmas, jelentős üzleti hatást felmutatni képes adatos projektet indítsanak, és a lehetséges partnereket állandóan szondázzák, mondjanak valami igazán ütős use-case-t. Gyakran egy-egy jó pozícióban levő tanácsadó cég is megkeres hasonló feladattal: "bent ülök az X cég big data board-jában, most dolgozzuk ki a stratégiát, ha van valami remek alkalmazási ötletetek, mondjátok el, ha elég jó, lehetne belőle jó üzletet csinálni". 

Nagyon nehéz ilyenkor valami jó javaslattal előállni, faramuci helyzet, hogy nem a megrendelő hozza az üzleti problémát, hanem mi. Ezért ezekben a helyzetekben gyakran azt javasoljuk, forduljunk az adatokhoz: néhány ilyen megkeresést át tudtunk alakítani egy adatvezéreltebb gondolkodás mentén működő projekté:

  • ElsÅ‘ként hozzáférést kaptunk az adatok egy részhez, és egyszerűen megértettük milyen típusú, mennyiségű és minÅ‘ségű adattal élnek együtt ezek a cégek. Tipikusan néhány érdekes adatkört adtak oda, ami szerintük is tartogat meglepetéseket.
  • Ezt követÅ‘en egyfajta data discovery fázisban kicsit megpiszkáltuk az adatokat, mit is rejtenek. Ezek az elemzések egyfajta ad-hoc riportoknak foghatók fel, segítenek abban, hogy ötleteket tudjunk adni arról, mire is használhatók ezek az adatok. Lényeg, hogy itt az adatok is súgnak nekünk.
  • Az adatok ismeretében készítettünk jó sok javaslatot, hogyan lehetne üzletileg kiaknázni az adatokat. Itt a friss, más nézÅ‘pontból érkezÅ‘ szemünk adata lehetÅ‘ségek (és korlátok) mentén leírtunk 10-20 use-case-t, esetenként néhány slide-nyi anyagot szedtünk össze. Egy-egy ilyen javaslatot gyakran néhány, a cégre vonatkozó adattal is megtámogatunk.
  • Ezeket vizsgálta meg a megrendelÅ‘ üzleti csapata, a use-case-ek jelentÅ‘s része nem érte el az ingerküszöbüket, de mindig akadt egy-kettÅ‘, ami érdekelte Å‘ket. Mivel láttak hozzá néhány releváns adatot, gyakran könnyebben meggyÅ‘zhetÅ‘ek ilyenkor, mintha külsÅ‘sként azt mondom, ez biztos megoldás után kiáltó gond nálatok.
  • Ezt követÅ‘en általában egy proof-of-concept fázis jön, mikor az adott use-case-re kidolgozzuk az elemzést a múltbeli adatokon, itt bizonyítjuk be, hogy érdemes ez az elemzést, adatbányászati modellezést folytatni.
  • Végül, ha ez utóbbi lépésben is meggyÅ‘zÅ‘k voltunk, akkor foglalkozunk a megoldás integrációjával, ekkor kerülnek fel az eredményeink a dashboard-okra, beépítjük a kalkulációkat a rendszerekbe, és itt dolgozzuk ki hosszú távon hogyan érdemes frissíteni az eredményeket.

gut.jpgLátható, hogy az iteratív, egyre komplexebb megoldásokat kihozó szemlélet itt is megmaradt, de az első pont az adatokról szól, és nem az üzletről. A döntések meghozatalánál persze az is sokat nyomott a latba, hogy így a költségek is fokozatosan jelennek meg. Az adatfeltárás + use-case készítés jóval kisebb feladat (8-21 nap), mint mondjuk a historikus adatokon már futó poof-of-concept megoldás kialakítása, de az igazán komoly befektetést igénylő integráció előtt van egy érvényes döntési pont, ahol múltbeli adatokra támaszkodva jól meg lehet becsülni az üzletre gyakorolt hatását az adott megoldásnak.

Én igazán szeretek így dolgozni, nagyon kreatív és sokkal üzletszagúbb megoldások tudnak így létrejönni. És attól a pillanattól fogva, hogy a partner saját adatain futó elemzésekkel támasztjuk alá a mondandónkat, sokkal érdekesebbek lesznek az elsőre akár túl egyszerű vagy sci-fi jellegű ötletek is.

ideaw.gifÉrdekes számodra ez a megközelítés, mert a Te cégednél is van egy állandó ötletvadászat az innovatív irányokat illetően, de valahogy mindig az az érzésed, hogy a bejövő ötletek valahogy nem hitelesek. �rj nekünk, és mi szívesen segítünk a fenti metodika szerint megtalálni azt, ami nálatok valóban érdemes bevezetni.

Gáspár Csaba: gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Adat-alapú vezetés meetup kedden

Adat-alapú vezetés meetup kedden

Az big data megoldásokban rejlő lehetőségek kihasználása nem tekinthető pusztán IT feladatnak. Erre a területre is igaz, hogy akkor tudják hatékonyabbá tenni egy-egy vállalat működését, ha az adatvezérelt gondolkodás vezetői szinten is gyökeret ver. A technológiai oldalról számtalan lehetőség van arra, hogy egy a data science vagy big data téma iránt érdeklődő szakember belekóstoljon ezekbe a témákba, csak gondoljunk arra a rengeteg technológiai meetupra, ami ma Budapesten elérhető a nagyközönség számára.

a_6.jpgA vezetői réteg lehetősége sokkal korlátozottabb, ezért is nagy öröm számomra, hogy következő kedden, 2016. október 11.-én tartja a Spark Institute az Adat-alapú vezetés című meetupját. A Spark Institute képzéseivel a vezetői réteget célozzák meg, a változó technológiai környezethez való alkalmazkodásra illetve a felforgató technológiák felhasználására kívánja felkészíteni a résztvevőket.

Ezen a vonalon kerül képbe az adatvezérelt gondolkodás, a big data világának üzleti vonatkozásai. A keddi meetup-on én tartom a felvezető előadást a big data technológiai és üzleti aspektusairól, majd Szukács István (StreamBright Data) fog beszélni az ajánlórendszerekben rejlő lehetőségekről, majd Vértes Balázs (Enbrite.ly) az online hirdetések minőségbiztosításáról.

2016. október 11. 19.00

Adat-alapú vezetés meetup - Spark Institute

Helyszín: LogMeIn - 1061 Budapest, Paulay Ede u 12.

Figyelem, a rendezvényt nem a meetup.com-on szervezik, a részvétel regisztrációhoz kötött,
a rendezvény holnapján erre van lehetőséged

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Tároljuk-e le ezt az adatot?

Tároljuk-e le ezt az adatot?

Egy data scientist a címben szereplő kérdésre egy automatikus igennel szokott válaszolni - ha van valami adatunk, tároljuk le, mi ezen a kérdés. És valóban, mi akadályoz meg minket ebben? Ha belegondolunk, mennyire olcsó ma már az adattárolás, a kérdés felmerülése elsőre furcsán is hathat. Többek előadásában láttam már visszaköszönni a mellékelt ábrát, és én is gyakran használom - azt mutatja meg, hogy az elmúlt 35 évben hogyan zuhant le egyetlen GB adattárolás éves költsége. A születésem környékén több mint egy millió dollárba került volna azt eltárolni, ami ma egy promóciós ajándéknak utánam dobott 8GB-os pendrive-on elfér. Bár sokat keresgéltem, de nem láttam 2015/2016-os adatokat, de az ábrán így is látszik, hogy az elmúlt években már bőven beestünk a 10 dollárcent alatti értékekhez, ennyibe kerül 1GB háttértár kapacitás manapság.

cost-per-gigabyte-large.pngMit is jelent ez? Azt, hogy ha az adatmennyiség nem extrém nagy, akkor egy átlagos nagyvállalatnál az adatok tárolásáról szóló meetinget résztvevő kollégák órabére valószínűleg jelentősen meghaladja a teljes tárolás költségét. 

Mégis meg kell védenem azokat a szervezeteket, ahol nem minden adatot tárolnak, amire valaha rátaláltak vagy valaha birtokoltak. Mert csak egy szempont az, hogy egy ilyen adatot el kell tárolni, de van itt néhány más szempont is:

  • Ha eltároltuk, akkor kinek lesz jogosultsága ezeket az adatokat olvasni? Egy nagyvállalati környezetben ennek eldöntése már nem annyira triviális, mint lementeni azt.
  • Felmerül a kérdés, hogy ha tároljuk az adatot, akkor azt mennyire biztonságosan kell tenni. Nincs-e benne valami olyan érzékeny adat, aminek védelme extra költséget igényel. 
  • Sokszor olyan ügyféladat is lehet az adathalmaz mélyén, amire törlési kényszer van törvényi kötelezettségek miatt. Ã�gy a felelÅ‘tlenül törölt adatok a végén akár több fejfájást is okozhatnak, mint eredetileg gondoltuk.

Jól látható tehát, hogy a "mindent tároljunk" szabály inkább kihívásokat hoz egy hagyományos óriáscég számára. Az elv bevezetését én csak olyan helyen láttam, ahol (1) az ügyfelekhez köthető személyes adatok kezelése egyszerűsítve volt, (2) ahol minden alkalmazott bátran hozzáférhet (pénzügyi adatok kivételével) minden adathoz, azaz nagyon egyszerű jogosultsági szabályok voltak adathozzáférés szempontjából, (3) és ahol tipikusan rugalmasan bővíthető adattárolási infrastruktúra (pl. AWS) állt rendelkezésre. Ha ezt a három szempontot összeadjuk, könnyű kitalálni, hogy az innovatív, startup világ felöl közelítő techcégek eshetnek bele csak ebbe a körbe.

Pedig valójában minden cégnél van létjogosultsága a "tároljunk mindent" elv feltételeit megteremteni. Ma egyre több iparágban az adatokban rejlő lehetőségek jelentik az egyik legfontosabb feltételét annak, hogy hosszú távon versenyképesek legyenek. Az adatok kiaknázásához pedig - nem meglepő módon - már eltárolt adatok is szükségesek szoktak lenni.

Adalék az árakhoz: Ha megnyitom a Google Drive fiókomat, akkor ott egyetlen gomb megnyomásával az elérhető tárkapacitásomat felnyomhatom 10TB (10*1000GB) területre. Ezért cserébe elég biztonságos hozzáférést, adatvesztés nélküli tárolást kapok úgy, hogy egyszerre 3 példányban tárolják az adataimat olyan adatközpontokban, amik legalább 300km távolságban vannak egymástól - így egy kisbolygó szerencsétlen érkezése sem nagyon veszélyeztetik a családi fotókat. Ezért összesen havi 100$ kérnének most tőlem.

Azaz évente 1GB tárolása 0,012$-ba (alig 35Ft-ba) kerülne.

aaa.jpgSok adat van nálatok is, már foglalkoztok a kiaknázásával, de jó lenne ha valaki friss szemmel is rá tudna nézni, elbeszélgetnél arról milyen módon lehetne még felhasználni azt? �rj bátran nekünk, szívesen gondolkodunk együtt olyanokkal, akiket érdekelnek az innovatív big data és data science megoldások. Cím: gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Mi maradt le a bevásárlólistáról? – Ma új hazai adatbányászati verseny indul

Mi maradt le a bevásárlólistáról? – Ma új hazai adatbányászati verseny indul

A data scientistté válás útjának egyik fontos állomása az adatbányászati versenyeken való indulás. A gépi tanulási eljárásokkal kapcsolatos tudásod, a helyes tesztelési és tanítási rendszer kialakításának a képessége, a jó visszamérési stratégiád ellenőrzésére nagyon alkalmas egy jó versenyen való részvétel. Ezért is népszerű a kaggle.com adatbányászati versenyeket szervező oldal, érdemes követni rajta az eseményeket akkor is, ha nincs időd bekapcsolódni a megmérettetésekbe.

a_5.jpgKülön örülök, ha hazai versenyek indulnak, hiszen ezen események egyfajta indikátorai annak, hogy a hazai adatos közösség hol is tart valójában. Ezért is szeretém külön felhívni a figyelmet a ma induló Cetli  ("Shopping List") Competition versenyre: a Nextent jóvoltából és az ő támogatásukkal induló megmérettetésen a Cetli nevű applikáció adatai felett dolgozhatunk. A versenyt a datapallet.io hosztolja. A verseny során az anonimizált felhasználók bevásárlólistáit láthatjuk, amik júliusi-augusztusi példányaiból találomra eltávolítottak egy-egy elemet. A versenyen résztvevőinek ezeket az eltávolított termékeket kell megbecsülni. 

Ha érdekel, nézz körül a verseny oldalán, majd regisztrálj versenyzőnek. 

Verseny hivatalos oldala 

A verseny indulásáról a ma esti Budapest.py Meetupon fognak bővebben beszélni a verseny szervezői. 

Ha úgy érzed, hogy neked is van olyan adathalmazod, ami kapcsán érdekes lehetne kiírni egy adatbányászati versenyt? Érdekelne, mi lenne az elérhető közel legjobb megoldás, vagy kíváncsi vagy rá, kik értenek igazán az adott fajta feladat megoldásához? Egyszerűen a beszállítóidat szeretnéd megversenyeztetni? Keress meg minket, és mi szívesen segítünk a verseny megfogalmazásában, kiírásában, akár a lebonyolításában.  - Gáspár Csaba gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Lakótársat keresünk – Inspiráló belvárosi iroda

Lakótársat keresünk – Inspiráló belvárosi iroda

Mindig meglep, mennyire sokat számít milyen környezetben dolgozik egy csapat. Először ezt akkor éreztem meg, mikor a Radoop és a Dmlab közösen bérelt irodát az Ipar utcában, mikor a szürke egyetemi közegből kiszabadultunk. A jó környezet egyszerűen húz előre, repülsz, nagyobb tempóra tudsz kapcsolni. Sokan félreértik ezt az állításomat, és azt gondolják hogy a design bútor, vicces grafikák és babzsákok háromszögébe kell zárni a kollégákat. De a környezet tágabb értelemben értelmezendő: sokat számít, hogy milyen emberek között ülsz, milyen más cégek azok akik körülötted vannak, kikkel találkozol a konyhában, ha kávézol, és milyen környezetben vagy, ha kilépsz az utcára, vagy ha elmész ebédelni.

moving.jpgEzért szeretem a mi irodánkat, a RED-et, amiben most üresedés van, és ahova új lakótársakat keresünk. Eddig a RapidMiner, az Enbrite.ly és a Dmlab uralta ezt a Madách térnél lévő 400 négyzetméteres teret. Lényegében a régi Kirowsky, majd régi Prezi.com iroda első emeleti szintjéről van szó a Károly körút 9. alatt. Biztos sokatok járt már itt korábban akár egy meetup kapcsán. Most az Enbrite.ly költözik tovább tőlünk a Mosaikba, az iroda közel harmada kiadó.

Ha érdekes lehet nektek, vagy ismersz valakit, akinek megmozgathatja a fantáziáját a dolog, akkor álljon itt néhány infó az irodáról (nyilván a teljesség igénye nélkül):

  • A belvárosban, a Deák tér tÅ‘szomszédságában, a Károly körút 9-ben vagyunk, ha valaha dolgoztál ennyire a város közepén, tudod mirÅ‘l beszélek.
  • Egy nagy közös térben van 10-14 szabad asztalunk, ami mellé jár két nagyobb tárgyaló használata, és egy hatalmas közös konyha. Ezen túlmenÅ‘en van két apróbb telefonálószoba, ahol egy-két fÅ‘s hívásokat lehet elintézni.
  • Magunk menedzseljük az irodát, a költségeken osztozunk, de a takarítást külsÅ‘ cég végzi.
  • A kényelmünket szolgáló dolgok: Illy kapszulás kávé, ballonos viz, hetente többször gyümölcs. 
  • A közeg fÅ‘leg adatos világban dolgozó, nyitott emberekbÅ‘l áll.
  • Négyzetméterárak szempontjából kedvezÅ‘ megállapodásunk van a tulajdonossal, a költségeket a csapatok lényegében szétdobják egymás között. Mivel közvetlenül velünk kell szerzÅ‘dnöd, így itt nem gond magában, ha nem tudsz több éves szerzÅ‘déseket aláírni.

Ha érdekes lehet neked vagy egy ismerősödnek a téma, írj nekünk egy emailt. Nagy-Rácz István: (nagyracz.istvan@dmlab.hu) vagy Gáspár Csaba (gaspar.csaba@dmlab.hu). 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Barabási új könyve – Leesett az állam

Barabási új könyve – Leesett az állam

Eddig is tudtuk, hogy Barabási Albert-László azon ritka kutatók egyike, akik a szélesebb közönség számára is élvezhető módon tudnak kommunikálni. A korábbi könyveit ismerők (Behálózva, Villanások) már bizonyára felkapták a fejüket az új könyv megjelenésének hírére. �k biztosan csalódottak lesznek, ha kezükbe veszik a "A hálózatok tudománya" című kiadványt, ugyanis ez nem ismeretterjesztő céllal, hanem mint egyetemi tankönyv jelent meg. A rengeteg képleten, levezetésen bizonyára csak nagyon kevesen fogják magukat végigrágni, főleg azok, akik kreditpontokat kapnak azért, ha levizsgáznak az adott anyagból.

a_halozatok_tudomanya_barabasi.JPGMindezek ellenére szenzációsnak tartom a könyv megjelenését, elég ehhez egy kicsit más szemmel lapozgatni az oldalakat. Ha egyetemi oktatóként nézek erre a kiadványra, hirtelen minden idegszálam felvillanyozódik, le vagyok nyűgözve - mint mikor az első valóban okostelefont tartottam a kezemben: sosem gondoltam, hogy szükség van ilyenre a világnak, de mikor megtapasztalom annak erejét, minden más mobiltelefon elveszti értelmét és szürke semmiséggé válik.

Ugyanez az érzés fogott el Barabási új könyve kapcsán is, azt hiszem ez az első igazi magyar nyelvű egyetemi tankönyv, amit a kezemben tartottam valaha. Nem egyszerűen szép és szemléletes, hanem magával ragadó ábrák, remek illusztrációk, színes érdekességek, háttérinformációk teszik kiemelkedővé a könyvet. Jól felépített fejezetek, a komolyabb levezetések külön kiszerkesztve, hogy olyan szakokon is lehessen belőle tanítani, ahol nincs meg minden tétel bizonyításához a megfelelő matematikai háttér. Gyakorlófeladatok, házifeladatok, ellenőrző kérdések. Mindezt keménykötéses, nagyméretű alakban, majdnem 500 oldalon keresztül élvezhetjük a legfinomabb papírra nyomtatva.

Mindenkinek javaslom, hogy ha könyvesboltban jár, keressen meg egy példányt, és csak játsszon el a gondolattal, hogy mi lett volna ha ilyen jellegű könyvekből kellett volna felkészülnie egyetemi évei alatt egy-egy tárgyból. Egy ilyen könyvet kézben tartva az kevésbé tűnik valószínűleg, hogy a közeljövőben az egyetemek helyett a fiatalok a Coursera kurzusaira járnak majd, hogy mindent a Youtube-on látható karizmatikus előadóktól érdemes csak tanulni.

Érdeklődő hallgatóknak

Biztos vagyok benne, hogy már szeptembertől lesznek olyan kurzusok a hazai felsőoktatásban, aminek alapját a könyvben leírtak adják. Ha hallgatóként mégis úgy érzed, hogy nem lesz elérhető számodra ilyen óra, szívesen megtanulnád ami a könyvben van, de félsz, hogy csak úgy önszorgalomból nem leszel elég kitartó, úgy van egy formabontó ajánlatunk:

  • Adunk neked ajándékba egy példányt a könyvbÅ‘l
  • Gyere el vizsgázni hozzánk a könyv anyagából 2016. október 1-ig, szívesen levizsgáztatunk belÅ‘le.
  • Ha nem sikerülne a vizsgád, vagy végül nem tudtál eljönni, akkor visszakérjük tÅ‘led a könyvet.

A részleteket úgyis megbeszéljük majd, a lényeg, hogy segítünk abban, hogy rávedd magad arra, hogy a könyvben foglaltakat megtanuld. A lehetőséget első körben a 3 leggyorsabban jelentkező hallgatónak adjuk meg. Jelentkezni: gaspar@tmit.bme.hu címen tudtok.

UPDATE: A blogposztunkra a könyvet kiadó Libri is reagált: támogatásként felajánlottak három példányt a könyvből. Hálás köszönet érte.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Privacy Policy

Copyright © 2019 BBBT - All Rights Reserved
Powered by WordPress & Atahualpa
X