[BreakingNews] A Kaggle-t felvásárolta a Google

[BreakingNews] A Kaggle-t felvásárolta a Google

Ma hajnalban ütött be a hír, hogy a Google felvásárolta a legnagyobb adatbányászati versenyeket szervező oldalt, a Kaggle.com site-ot (első hír itt, hivatalosabbak itt , de a Google a blogposzt írásának időpontjában még hivatalosan nem jelentette be a tranzakciót). A vételárról nincsenek hírek, a 2010-es alapítása óta eddig 12,5 millió dollár befektetést tudott bevonni a cég.


kaggle_vs_google.pngA hír váratlanul ért, de sok szempontból nem annyira meglepő: a Google számára sok dolog jól jöhet a Kaggle portfóliójából. Kaggle a data science közösség egyik központi oldala, saját álláskereső oldalával és a közel félmillió felhasználójával (! - én ezt nem is nagyon akarom elhinni) jó merítés a cégnek már csak toborzási szempontból is. Ezen túlmenően a Kernels nevű kezdeményezésével a Kaggle egy saját gépi tanulási platformot is létrehozott, ami jól fog virítani a Google Cloud embléma alatt is. Talán ez az a pont, ahol mint Kaggle felhasználók a legtöbbet nyerhetünk. Nem hiába, a Google olyan cég, aki hisz az adatok erejében, miért ne hinné el, hogy a data scientist-ek világának közepét is érdemes birtokolnia. 


Másfelöl a felvásárlás azt is bizonyítja számomra, hogy az adatokkal dolgozó cégek és szakemberek univerzumában a nagy techóriások egyfajta hatalmas gravitációjú csillagoknak tekinthetők: egyre gyorsabban szippantják be az ígéretes kezdeményezéseket, az igazán izgalmas dolgok körülöttük történnek. Az itt felhalmozódó hatalmas adat- és tudásvagyonnal egyre nehezebben fognak versenyezni azok a vállalatok, melyek homlokterében az adatokkal való munka egyfajta megtűrt hobby vagy kényszerű próbálkozás.

google_vs_kaggle_1.pngPéldául a napokban találkoztam olyan nagyvállalattal, ahol egyenesen az volt a vélemény, hogy félnek belső kompetenciát építeni, mert ha valaki megtanulná ezt a szakmát a cégen belül, azt biztos hamar lecsábítanák az ilyen emberekre vadászó más cégek. Pedig hosszú távon valójában fordított tendenciák várhatók: hosszú távon az adatvezérelt gondolkodás, az adatokkal való barátság inkább alapkövetelményként fog megjelenni, mint szelekciós szempontként. De a lemaradók megnyugtatására és az élenjárók szomorúsága végett le kell szögeznem: mint minden változás, aminek az emberi fejekben kell végbemennie, sokkal lassabban fog megvalósulni, mint amekkora tempót maga a technológia diktál. 

Gratulálunk a Kaggle csapatának!

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Big data nyugati és keleti szemléletben

Big data nyugati és keleti szemléletben

A Műegyetem büféjében egy közgazdász kolléganőnktől hallottam egy érdekes gondolatot (mémet), melyen az elmúlt hónapban sokat morfondíroztam. Zsuzsa meglátása szerint az európai kultúrában a gazdaságban megjelenő adatokhoz, az azokban megjelenő összefüggésekhez, a ma big data néven futó jelenséghez külön nyugati és keleti (bizánci) megközelítés tartozik. A nyugati gondolkodásmódban az adatokra támaszkodva növelhetjük a hatékonyságunkat, alkalmazkodhatunk a változó környezethez, versenyelőnyhöz juthatunk - így az adatelemzés célja tipikusan a profitnövelés irányába mutat. A keleti (bizánci) szemléletben az adatok gyűjtésének célja az ellenőrzés, az állami vagy egyéb hatalom felügyeleti tevékenységéhez tartozik - célunk az ellenőrzés, a kitűzött célok végrehajtásának ellenőrzése. 

east-vs-west.jpgValóban kézzelfoghatóan különválik ez a két szemlélet, még akkor is, ha egy-egy jól működő szervezeten belül mindkettőnek meg kell jelennie. Ha technológiai szemmel nézzük az gépi tanulási feladatok előrejelzéshez köthető részei inkább a profitmaximalizáló, hatékonyságnövelő szemlélethez köthető, míg az én látásmódomban kicsit a klaszterezés és nagy mértékben az anomália detekció a felügyelő / ellenőrző látásmódhoz köthető. Egy BI vagy riporting rendszer magában nem köthető egy-egy területhez, de a használatuk mögötti motiváció gyakran az egyik szemlélethez húz. 

Az elmúlt héten áttekintettem a fenti szempontból a 2016-os projektjeinket (jó lehetőséget adott erre, mikor az Éviránytű évértékelő munkafüzetét töltöttem ki), és egyértelműen szátváltak erre a két csoportra, még akkor is, ha egyes partnereknél végül mindkét irány megjelent. Az egyik legtipikusabb példa, mikor kamionsofőrök fogyasztási szokásainak elemzését végeztük: elsőként úgy volt megfogalmazva az üzleti kérdés, hogy találjuk meg, mi a különbség a jól fogyasztási adatokkal futó sofőrök és a több üzemanyagot használó kollégáik között. A projekt végkicsengésénél viszont megjelent az az igény, hogy mennyivel jobb lenne a sofőr szokásai, az útviszonyok, az időjárás és a rakomány figyelembevételével olyan útvonaltervezést megvalósítani, ahol a becsült üzemanyagköltséggel és a különböző útdíjakkal egyszerre tudnánk számolni.

Elgondolkodtam azon is, vajon milyen szemlélet jellemző hazai cégekre? Ez cégkultúrától függ, ami alakítható - így talán nem is ez a jó kérdés. Ha az egyének szintjén vizsgáljuk a kérdést, azt mondhatjuk, hogy a magyarok alap beállítottsága inkább a keleti szemlélethez húz. Jó példázza ezt nekem, hogy mikor egy társaságban elmesélem, hogy egy jó és egy rossz kamionsofőr között 3-4 liter fogyasztás-különbség is lehet 100 km-en, a legtöbben azt a zsigeri választ adják, hogy biztos lopják az üzemanyagot. Az adatokból látszik, hogy rengeteg oka lehet a különbségnek (például mennyit használja a tempomatot az vezető), de az alap asszociációnk oda mutat, az adatok valami kis stiklit, csalást, trükközést fognak felfedni.

Fontos kiemelni, hogy ez a kettősség nem a személyes adatokról vagy privacy védelméről szól - de mégis van ide vágó aspektusa. Képzeljük el, hogy a munkahelyünkön minden eddiginél pontosabb és jobb adatgyűjtést vezet be a főnökség, például pontosabb képet fognak kapni az egyes kollégák teljesítményéről. A változást lehet pozitívan látni ("végre látni fogják, milyen sokat tettem a cégért"), vagy negatív módon viszonyulni hozzá ("ki fogják szúrni, hogy pénteken hamarabb szoktam lelépni"), és utána ennek megfelelően lehet támogatni vagy szabotálni a bevezetést. Mindenkire rábízom, hogy mit tenne ő egy ilyen szituációban. 

Bármilyen is az alap beállítottságunk, erre rálátva tudatosan tudjuk integrálni a kétfajta szemlélet előnyeit. Izgalmasabb kérdés számomra, hogy mennyire más módon kell a különböző szemléletű cégeknél egy-egy megoldást bevezetni, mennyire más motivációk és félelmek uralják a gondolkodást a két esetben.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

A túlterhelt csomagküldők esete – adatelemző szemmel

A túlterhelt csomagküldők esete – adatelemző szemmel

Idén az adventi időszak kötelező feladatai közé bekerült a Posta illetve más csomagküldő szolgálatok szidása, miszerint miért nem készültek fel időben a karácsonyi dömpingre. Örök téma ez, bárkivel el lehet róla beszélgetni, mindenkit érint és mindenki ért hozzá - olyan mint az időjárás, a politika vagy a foci. A szállingózó történetek először idén is a Postáról szóltak, de az elmúlt hetekre végülis minden csomagküldőre kiterjedtek, végül nem egyetlen cég bénázásáról, hanem valami általánosabb jelenségről van szó.

Tudvalevő, hogy a karácsonyi webshop őrületre a csomagküldő szolgáltatók is készülnek. Ez a szektor az elmúlt évtized EU-s szabályozási változtatásai kapcsán egy fejlődő, sokszereplős és versenyezni képes iparággá nőtte ki magát, ahol a hétköznapi értelemben van innováció, a legtöbb cég vezetőit kőkemény üzleti racionalitás hatja át: a karácsony a legerősebb időszakuk, biztosan kalkuláltak a megnövekedett feladatokkal. Ahogy a hírekben hallható mentegetőzésből kijön, azt is tudták, hogy nemcsak több, hanem a tavalyinál jóval több csomagot kell elvinni majd. Több helyen is olvashatjuk, hogy a karácsonyi időszak csomagmennyisége évi 20%-kal növekedett az elmúlt években, így a legtöbb helyen erre a mennyiségre lőtték be a kapacitásaikat.

screen_shot_2016-12-22_at_23_44_33.pngÉs itt jön a fordulat - idén a 40%-kal több csomagot adtunk fel. Persze lehetne ezt a hazai webes áruküldés csodájaként is megélni, ünnepelhetnénk a hazai digitális fordulatot (mint ahogy sok más országban egy-egy black friday után a webes cégek azzal dicsekednek mennyivel dőltek meg az eddigi rekordok), ehelyett inkább azt hallhatjuk, hogy ez az óriási különbség mennyire váratlanul érte az előrejelzés szerint 20%-os emelkedésre számító szereplőket.

ÁBRA: Az eNet pont egy évvel ezelőtti infografikájából kivágott rész a hazai webes kereskedelem forgalmáról - Eredeti cikket is ajánlom figyelmetekbe: eNet: E-kereskedelmi körkép 2015

Adatelemzőként persze csak csóválom a fejem. Ha valami három éve 20%-ot nő, akkor a következő évre 20% növekedést prognosztizálni elsőre nem tűnik butaságnak. Csak akkor, ha valamit épp pont a web hajt. Hol hallottunk olyat egy webes trend kapcsán, hogy úgy örökké egyenletesen emelkedett? A weben a dolgok berobbanása vagy elhalása a gyakoribb. Mindemelett 40% növekedés nem berobbanás. És itt kezdek zavarba jönni adatok híján: vajon megvizsgálták a cégek, hogy a sok rendelés közül mely webáruházakra, mely termékcsoportokra volt jellemző a felfutás? Nagy összegekben mernék fogadni, hogy a többlet nem egyenletesen oszlik el. Vagy nem egyenletes vásárlói csoporton. A web világa csak eleinte "lassú víz partot mos" jellegű - később vagy nem lesz semmi, vagy jön a földcsuszamlás. Ez az óriási melléfogás bizony az előrejelzést végzők hibája - a csomagküldés piacát legjobban a webes kiskereskedelem hajtja, ennek elemzése nélkül nem lehet csak a görbére ránézni, és csak úgy továbbhúzni a vonalat.

Hallottam persze furfangos magyarázatokat is - szigorúan a felelősöket minél távolabb keresve. A kedvenc két témám a vasárnapi boltbezárás és a későn érkező hideggel magyarázza a dolgokat. Az első úgy jön a képbe, hogy a vasárnapi boltbezárás időszaka alatt a webáruházak jóval elfogadottabbak lettek az elmúlt években, ez a hatás "gyűrűzött" be most karácsonykor ennyire erősen. Egy másik elmélet azzal magyarázza a dolgokat, hogy későn jött be az igazán hideg hazákba, ami hatására mindig jobban felpörögnek az otthon melegéből rendelhető termékek forgalma. Egyik hatásra vonatkozó elemzéseket se ismerek, de mindkettő inkább műértő okoskodásnak tűnik elsőre.

Mit tegyenek a csomagküldők jövőre? Ezer ötletem van az adatelemzés területén kívülről is, kezdve a novemberben előre megvásárolható futárkapacitástól, a rendelés pillanatában előre kalkulált valós érkezési időpontig. Az adatok jobb kihasználása nem annyit tesz, hogy jövőre komolyabb aparátussal ki tudnak hozni 20+x százaléknyi várható forgalomnövekedést, és ezt higgye el mindenki. Itt folyamatokhoz kellene hozzányúlni, miközben extra nagy források a feladat megoldására nem állhat rendelkezésre.

Leginkább azokat az ajándékozni vágyókat sajnálom, akik félve figyelik a kaput, megjön-e még a csomagjuk karácsony este előtt. Drukkolunk nekik és bízunk hogy nem kuponok gyártásával telik majd a szombat délutánjuk.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Data science és big data képzések – Érdeklődők gyűjtése

Data science és big data képzések – Érdeklődők gyűjtése

A napokban sokan megkerestek milyen oktatásokat tartunk a közeljövőben, milyen BME-s előadásokat fogunk megnyitni a külsősök előtt, milyen cégre szabott oktatásokat lehet kérni tőlünk. Hogy ne csak azt mondhassuk, hogy a kövessétek a blogot, arra gondoltam jó ötlet gyűjteni az érdeklődők elérhetőségeti:

Ha szeretnél értesítést kapni előzetesen azokról a data science és big data oktatásokról, melyekben részt veszünk, regisztráld magadat az alábbi oldalon:

Érdeklődőként való regisztráció

proactive.pngA blogon továbbra is jelezni fogjuk az aktuális lehetőségeket, a blog hírlevelét (jelentkezés itt) most újítottuk meg, ott is megírjuk az információkat, ez a lista azonban nem hírlevél. Ha bejelölöd milyen típusú dolgok érdekelnek, és éppen indítunk valami ide vágó oktatást, akkor a regisztráltaknak proaktívan kiküldjük a rájuk vonatkozó információkat. 

Reméljük ez is segít majd azoknak, akik már most tervezik a jövő évi oktatási keretüket is. 

 

ideaw.gifHa nem tudtok várni arra, hogy megjelenjenek a meghirdetett oktatások, vagy egyedi igényetek van, keressetek meg bátran, a legtöbb oktatásunk cégre / személyre szabottan fut, keress meg minket, szívesen javaslunk tematikát és adunk ajánlatot.

Gáspár Csaba: gaspar.csaba@dmlab.hu  +36208234154

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Csavarjunk egyet az innovatív adatelemzési irányok keresésén

Csavarjunk egyet az innovatív adatelemzési irányok keresésén

crisp_dm.pngA Nagy Könyvben az áll, hogy egy valamirevaló adatbányászati / adatelemzési projektet a CRISP-DM (Cross Industry Standard Process for Data Mining) metodika szerint érdemes menedzselni. Eszerint egy projektnek hat fő fázisa van, (1) első lépésben megértjük az üzleti problémát, majd (2) a hozzá kapcsolódó adatokat, (3) adatátalakításokat végzünk, (4) gépi tanulási vagy statisztikai modelleket futtatunk, (5) kiértékeljük a kapott eredményeket üzleti szempontból, és persze ha minden klappol, akkor (6) hadrendbe állítjuk a megoldást. Nyilván ennél bonyolultabb a helyzet (a részletes leírást a metodikáról itt olvashatunk), szinte mindig van szükség iterációkra, mikor egy vagy több fázist is vissza kell ugranunk az aktuális lépés során tapasztaltak miatt. Érdekes látni, hogy ez iteratív fejlesztés mennyire jól illeszthető a ma egyre jobban terjedő agilis szemlélethez. 

De nem is a CRISP-DM metodikát akarom most kivesézni, felülbírálni - minden hibája ellenére igazán szeretem, gyakran mentett meg minket kényes helyzetekben. Inkább egy újfajta jelenségre szeretném felhívni a figyelmet: egyre többször van lehetőségünk olyan módon elkezdeni egy-egy projektet, hogy nem a legelső fázisnál, az üzleti feladat megértésénél indulunk - hanem a másodiknál, az adatok megismerésénél.

Arról van szó, hogy vannak vállalatok, akik nagyon vágynak arra, hogy valami igazán izgalmas, jelentős üzleti hatást felmutatni képes adatos projektet indítsanak, és a lehetséges partnereket állandóan szondázzák, mondjanak valami igazán ütős use-case-t. Gyakran egy-egy jó pozícióban levő tanácsadó cég is megkeres hasonló feladattal: "bent ülök az X cég big data board-jában, most dolgozzuk ki a stratégiát, ha van valami remek alkalmazási ötletetek, mondjátok el, ha elég jó, lehetne belőle jó üzletet csinálni". 

Nagyon nehéz ilyenkor valami jó javaslattal előállni, faramuci helyzet, hogy nem a megrendelő hozza az üzleti problémát, hanem mi. Ezért ezekben a helyzetekben gyakran azt javasoljuk, forduljunk az adatokhoz: néhány ilyen megkeresést át tudtunk alakítani egy adatvezéreltebb gondolkodás mentén működő projekté:

  • Elsőként hozzáférést kaptunk az adatok egy részhez, és egyszerűen megértettük milyen típusú, mennyiségű és minőségű adattal élnek együtt ezek a cégek. Tipikusan néhány érdekes adatkört adtak oda, ami szerintük is tartogat meglepetéseket.
  • Ezt követően egyfajta data discovery fázisban kicsit megpiszkáltuk az adatokat, mit is rejtenek. Ezek az elemzések egyfajta adhoc riportoknak foghatók fel, segítenek abban, hogy ötleteket tudjunk adni arról, mire is használhatók ezek az adatok. Lényeg, hogy itt az adatok is súgnak nekünk.
  • Az adatok ismeretében készítettünk jó sok javaslatot, hogyan lehetne üzletileg kiaknázni az adatokat. Itt a friss, más nézőpontból érkező szemünk adata lehetőségek (és korlátok) mentén leírtunk 10-20 use-case-t, esetenként néhány slide-nyi anyagot szedtünk össze. Egy-egy ilyen javaslatot gyakran néhány, a cégre vonatkozó adattal is megtámogatunk.
  • Ezeket vizsgálta meg a megrendelő üzleti csapata, a use-case-ek jelentős része nem érte el az ingerküszöbüket, de mindig akadt egy-kettő, ami érdekelte őket. Mivel láttak hozzá néhány releváns adatot, gyakran könnyebben meggyőzhetőek ilyenkor, mintha külsősként azt mondom, ez biztos megoldás után kiáltó gond nálatok.
  • Ezt követően általában egy proof-of-concept fázis jön, mikor az adott use-case-re kidolgozzuk az elemzést a múltbeli adatokon, itt bizonyítjuk be, hogy érdemes ez az elemzést, adatbányászati modellezést folytatni.
  • Végül, ha ez utóbbi lépésben is meggyőzők voltunk, akkor foglalkozunk a megoldás integrációjával, ekkor kerülnek fel az eredményeink a dashboard-okra, beépítjük a kalkulációkat be a rendszerekbe, és itt dolgozzuk ki hosszú távon hogyan érdemes frissíteni az eredményeket.

gut.jpgLátható, hogy az iteratív, egyre komplexebb megoldásokat kihozó szemlélet itt is megmaradt, de az első pont az adatokról szól, és nem az üzletről. A döntések meghozatalánál persze az is sokat nyomott a latba, hogy így a költségek is fokozatosan jelennek meg. Az adatfeltárás + use-case készítés jóval kisebb feladat (8-21 nap), mint mondjuk a historikus adatokon már futó poof-of-concept megoldás kialakítása, de az igazán komoly befektetést igénylő integráció előtt van egy érvényes döntési pont, ahol múltbeli adatokra támaszkodva jól meg lehet becsülni az üzletre gyakorolt hatását az adott megoldásnak.

Én igazán szeretek így dolgozni, nagyon kreatív és sokkal üzletszagúbb megoldások tudnak így létrejönni. És attól a pillanattól fogva, hogy a partner saját adatain futó elemzésekkel támasztjuk alá a mondandónkat, sokkal érdekesebbek lesznek az elsőre akár túl egyszerű vagy scifi jellegű ötletek is.

ideaw.gifÉrdekes számodra ez a megközelítés, mert a Te cégednél is van egy állandó ötletvadászat az innovatív irányokat illetően, de valahogy mindig az az érzésed, hogy a bejövő ötletek valahogy nem hitelesek. Írj nekünk, és mi szívesen segítünk a fenti metodika szerint megtalálni azt, ami nálatok valóban érdemes bevezetni.

Gáspár Csaba: gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Adat-alapú vezetés meetup kedden

Adat-alapú vezetés meetup kedden

Az big data megoldásokban rejlő lehetőségek kihasználása nem tekinthető pusztán IT feladatnak. Erre a területre is igaz, hogy akkor tudják hatékonyabbá tenni egy-egy vállalat működését, ha az adatvezérelt gondolkodás vezetői szinten is gyökeret ver. A technológiai oldalról számtalan lehetőség van arra, hogy egy a data science vagy big data téma iránt érdeklődő szakember belekóstoljon ezekbe a témákba, csak gondoljunk arra a rengeteg technológiai meetupra, ami ma Budapesten elérhető a nagyközönség számára.

a_6.jpgA vezetői réteg lehetősége sokkal korlátozottabb, ezért is nagy öröm számomra, hogy következő kedden, 2016. október 11.-én tartja a Spark Institute az Adat-alapú vezetés című meetupját. A Spark Institute képzéseivel a vezetői réteget célozzák meg, a változó technológiai környezethez való alkalmazkodásra illetve a felforgató technológiák felhasználására kívánja felkészíteni a résztvevőket.

Ezen a vonalon kerül képbe az adatvezérelt gondolkodás, a big data világának üzleti vonatkozásai. A keddi meetup-on én tartom a felvezető előadást a big data technológiai és üzleti aspektusairól, majd Szukács István (StreamBright Data) fog beszélni az ajánlórendszerekben rejlő lehetőségekről, majd Vértes Balázs (Enbrite.ly) az online hirdetések minőségbiztosításáról.

2016. október 11. 19.00

Adat-alapú vezetés meetup - Spark Institute

Helyszín: LogMeIn - 1061 Budapest, Paulay Ede u 12.

Figyelem, a rendezvényt nem a meetup.com-on szervezik, a részvétel regisztrációhoz kötött,
a rendezvény holnapján erre van lehetőséged

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Tároljuk-e le ezt az adatot?

Tároljuk-e le ezt az adatot?

Egy data scientist a címben szereplő kérdésre egy automatikus igennel szokott válaszolni - ha van valami adatunk, tároljuk le, mi ezen a kérdés. És valóban, mi akadályoz meg minket ebben? Ha belegondolunk, mennyire olcsó ma már az adattárolás, a kérdés felmerülése elsőre furcsán is hathat. Többek előadásában láttam már visszaköszönni a mellékelt ábrát, és én is gyakran használom - azt mutatja meg, hogy az elmúlt 35 évben hogyan zuhant le egyetlen GB adattárolás éves költsége. A születésem környékén több mint egy millió dollárba került volna azt eltárolni, ami ma egy promóciós ajándéknak utánam dobott 8GB-os pendrive-on elfér. Bár sokat keresgéltem, de nem láttam 2015/2016-os adatokat, de az ábrán így is látszik, hogy az elmúlt években már bőven beestünk a 10 dollárcent alatti értékekhez, ennyibe kerül 1GB háttértár kapacitás manapság.

cost-per-gigabyte-large.pngMit is jelent ez? Azt, hogy ha az adatmennyiség nem extrém nagy, akkor egy átlagos nagyvállalatnál az adatok tárolásáról szóló meetinget résztvevő kollégák órabére valószínűleg jelentősen meghaladja a teljes tárolás költségét. 

Mégis meg kell védenem azokat a szervezeteket, ahol nem minden adatot tárolnak, amire valaha rátaláltak vagy valaha birtokoltak. Mert csak egy szempont az, hogy egy ilyen adatot el kell tárolni, de van itt néhány más szempont is:

  • Ha eltároltuk, akkor kinek lesz jogosultsága ezeket az adatokat olvasni? Egy nagyvállalati környezetben ennek eldöntése már nem annyira triviális, mint lementeni azt.
  • Felmerül a kérdés, hogy ha tároljuk az adatot, akkor azt mennyire biztonságosan kell tenni. Nincs-e benne valami olyan érzékeny adat, aminek védelme extra költséget igényel. 
  • Sokszor olyan ügyféladat is lehet az adathalmaz mélyén, amire törlési kényszer van törvényi kötelezettségek miatt. Így a felelőtlenül törölt adatok a végén akár több fejfájást is okozhatnak, mint eredetileg gondoltuk.

Jól látható tehát, hogy a "mindent tároljunk" szabály inkább kihívásokat hoz egy hagyományos óriáscég számára. Az elv bevezetését én csak olyan helyen láttam, ahol (1) az ügyfelekhez köthető személyes adatok kezelése egyszerűsítve volt, (2) ahol minden alkalmazott bátran hozzáférhet (pénzügyi adatok kivételével) minden adathoz, azaz nagyon egyszerű jogosultsági szabályok voltak adathozzáférés szempontjából, (3) és ahol tipikusan rugalmasan bővíthető adattárolási infrastruktúra (pl. AWS) állt rendelkezésre. Ha ezt a három szempontot összeadjuk, könnyű kitalálni, hogy az innovatív, startup világ felöl közelítő techcégek eshetnek bele csak ebbe a körbe.

Pedig valójában minden cégnél van létjogosultsága a "tároljunk mindent" elv feltételeit megteremteni. Ma egyre több iparágban az adatokban rejlő lehetőségek jelentik az egyik legfontosabb feltételét annak, hogy hosszú távon versenyképesek legyenek. Az adatok kiaknázásához pedig - nem meglepő módon - már eltárolt adatok is szükségesek szoktak lenni.

Adalék az árakhoz: Ha megnyitom a Google Drive fiókomat, akkor ott egyetlen gomb megnyomásával az elérhető tárkapacitásomat felnyomhatom 10TB (10*1000GB) területre. Ezért cserébe elég biztonságos hozzáférést, adatvesztés nélküli tárolást kapok úgy, hogy egyszerre 3 példányban tárolják az adataimat olyan adatközpontokban, amik legalább 300km távolságban vannak egymástól - így egy kisbolygó szerencsétlen érkezése sem nagyon veszélyeztetik a családi fotókat. Ezért összesen havi 100$ kérnének most tőlem.

Azaz évente 1GB tárolása 0,012$-ba (alig 35Ft-ba) kerülne.

aaa.jpgSok adat van nálatok is, már foglalkoztok a kiaknázásával, de jó lenne ha valaki friss szemmel is rá tudna nézni, elbeszélgetnél arról milyen módon lehetne még felhasználni azt? Írj bátran nekünk, szívesen gondolkodunk együtt olyanokkal, akiket érdekelnek az innovatív big data és data science megoldások. Cím: gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Mi maradt le a bevásárlólistáról? – Ma új hazai adatbányászati verseny indul

Mi maradt le a bevásárlólistáról? – Ma új hazai adatbányászati verseny indul

A data scientistté válás útjának egyik fontos állomása az adatbányászati versenyeken való indulás. A gépi tanulási eljárásokkal kapcsolatos tudásod, a helyes tesztelési és tanítási rendszer kialakításának a képessége, a jó visszamérési stratégiád ellenőrzésére nagyon alkalmas egy jó versenyen való részvétel. Ezért is népszerű a kaggle.com adatbányászati versenyeket szervező oldal, érdemes követni rajta az eseményeket akkor is, ha nincs időd bekapcsolódni a megmérettetésekbe.

a_5.jpgKülön örülök, ha hazai versenyek indulnak, hiszen ezen események egyfajta indikátorai annak, hogy a hazai adatos közösség hol is tart valójában. Ezért is szeretém külön felhívni a figyelmet a ma induló Cetli  ("Shopping List") Competition versenyre: a Nextent jóvoltából és az ő támogatásukkal induló megmérettetésen a Cetli nevű applikáció adatai felett dolgozhatunk. Az anonimizált felhasználók bevásárlólistáit láthatjuk, és tudjuk hol töröltek le azokról tételeket. Azt kell megbecsülni hogy adott boltban mi az a termék, amit a verseny kiírói letöröltek a listáról. Ebből következően egyszerre láthatjuk, hogy mit és hol vásároltak, szóval maga az adathalmaz magában is érdekes. 

Ha érdekel, nézz körül a verseny oldalán, majd regisztrálj versenyzőnek. 

Verseny hivatalos oldala 

A verseny indulásáról a ma esti Budapest.py Meetupon fognak bővebben beszélni a verseny szervezői.

Úgy érzed, hogy neked is van olyan adathalmazod, ami kapcsán érdekes lehetne kiírni egy adatbányászati versenyt? Érdekelne, mi lenne az elérhető közel legjobb megoldás, vagy kíváncsi vagy rá, kik értenek igazán az adott fajta feladat megoldásához? Egyszerűen a beszállítóidat szeretnéd megversenyeztetni? Keress meg minket, és mi szívesen segítünk a verseny megfogalmazásában, kiírásában, akár a lebonyolításában.  - Gáspár Csaba gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Lakótársat keresünk – Inspiráló belvárosi iroda

Lakótársat keresünk – Inspiráló belvárosi iroda

Mindig meglep, mennyire sokat számít milyen környezetben dolgozik egy csapat. Először ezt akkor éreztem meg, mikor a Radoop és a Dmlab közösen bérelt irodát az Ipar utcában, mikor a szürke egyetemi közegből kiszabadultunk. A jó környezet egyszerűen húz előre, repülsz, nagyobb tempóra tudsz kapcsolni. Sokan félreértik ezt az állításomat, és azt gondolják hogy a design bútor, vicces grafikák és babzsákok háromszögébe kell zárni a kollégákat. De a környezet tágabb értelemben értelmezendő: sokat számít, hogy milyen emberek között ülsz, milyen más cégek azok akik körülötted vannak, kikkel találkozol a konyhában, ha kávézol, és milyen környezetben vagy, ha kilépsz az utcára, vagy ha elmész ebédelni.

moving.jpgEzért szeretem a mi irodánkat, a RED-et, amiben most üresedés van, és ahova új lakótársakat keresünk. Eddig a RapidMiner, az Enbrite.ly és a Dmlab uralta ezt a Madách térnél lévő 400 négyzetméteres teret. Lényegében a régi Kirowsky, majd régi Prezi.com iroda első emeleti szintjéről van szó a Károly körút 9 alatt. Biztos sokatok járt már itt korábban akár egy meetup kapcsán. Most az Enbrite.ly költözik tovább tőlünk a Mosaikba, az iroda közel harmada kiadó.

Ha érdekes lehet nektek, vagy ismersz valakit, akinek megmozgathatja a fantáziáját a dolok, akkor álljon itt néhány infó az irodáról (nyilván a teljesség igénye nélkül):

  • A belvárosba, a Deák tér tőszomszédságában, a Károly körút 9.-ben vagyunk, ha valaha dolgoztál ennyire a város közepén, tudod miről beszélek
  • Egy nagy közös térben van 10-14 szabad asztalunk, ami mellé jár két nagyobb tárgyaló használata, és egy hatalmas közös konyha. Ezen túlmenően van két apróbb telefonálószoba, ahol egy-két fős hívásokat lehet elintézni.
  • Magunk menedzseljük az irodát, a költségeken osztozunk, de a takarítást külső cég végzi.
  • A kényelmünket szolgáló dolgok: Illy patronos kávé, ballonos viz, hetente többször gyümölcs. 
  • A közeg főleg adatos világban dolgozó, nyitott emberekből áll.
  • Négyzetméterárak szempontjából kedvező megállapodásunk van a tulajdonossal, a költségeket a csapatok lényegében szétdobják egymás között. Mivel közvetlenül velünk kell szerződnöd, így itt nem gond magában, ha nem tudsz több éves szerződéseket aláírni.

Ha érdekes lehet neked vagy egy ismerősödnek a téma, írjál nekünk egy emailt. Nagy-Rácz István: (nagy-racz.istvan@dmlab.hu) vagy Gáspár Csaba (gaspar.csaba@dmlab.hu). 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Barabási új könyve – Leesett az állam

Barabási új könyve – Leesett az állam

Eddig is tudtuk, hogy Barabási Albert-László azon ritka kutatók egyike, akik a szélesebb közönség számára is élvezhető módon tudnak kommunikálni. A korábbi könyveit ismerők (Behálózva, Villanások) már bizonyára felkapták a fejüket az új könyv megjelenésének hírére. Ők biztosan csalódottak lesznek, ha kezükbe veszik a "A hálózatok tudománya" című kiadványt, ugyanis ez nem ismeretterjesztő céllal, hanem mint egyetemi tankönyv jelent meg. A rengeteg képleten, levezetésen bizonyára csak nagyon kevesen fogják magukat végigrágni, főleg azok, akik kreditpontokat kapnak azért, ha levizsgáznak az adott anyagból.

a_halozatok_tudomanya_barabasi.JPGMindezek ellenére szenzációsnak tartom a könyv megjelenését, elég ehhez egy kicsit más szemmel lapozgatni az oldalakat. Ha egyetemi oktatóként nézek erre a kiadványra, hirtelen minden idegszálam felvillanyozódik, le vagyok nyűgözve - mint mikor az első valóban okostelefont tartottam a kezemben: sosem gondoltam, hogy szükség van ilyenre a világnak, de mikor megtapasztalom annak erejét, minden más mobiltelefon elveszti értelmét és szürke semmiséggé válik.

Ugyanez az érzés fogott el Barabási új könyve kapcsán is, azt hiszem ez az első igazi magyar nyelvű egyetemi tankönyv, amit a kezemben tartottam valaha. Nem egyszerűen szép és szemléletes, hanem magával ragadó ábrák, remek illusztrációk, színes érdekességek, háttérinformációk teszik kiemelkedővé a könyvet. Jól felépített fejezetek, a komolyabb levezetések külön kiszerkesztve, hogy olyan szakokon is lehessen belőle tanítani, ahol nincs meg minden tétel bizonyításához a megfelelő matematikai háttér. Gyakorlófeladatok, házifeladatok, ellenőrző kérdések. Mindezt keménykötéses, nagyméretű alakban, majdnem 500 oldalon keresztül élvezhetjük a legfinomabb papírra nyomtatva.

Mindenkinek javaslom, hogy ha könyvesboltban jár, keressen meg egy példányt, és csak játsszon el a gondolattal, hogy mi lett volna ha ilyen jellegű könyvekből kellett volna felkészülnie egyetemi évei alatt egy-egy tárgyból. Egy ilyen könyvet kézben tartva az kevésbé tűnik valószínűleg, hogy a közeljövőben az egyetemek helyett a fiatalok a Coursera kurzusaira járnak majd, hogy mindent a Youtube-on látható karizmatikus előadóktól érdemes csak tanulni.

Érdeklődő hallgatóknak

Biztos vagyok benne, hogy már szeptembertől lesznek olyan kurzusok a hazai felsőoktatásban, aminek alapját a könyvben leírtak adják. Ha hallgatóként mégis úgy érzed, hogy nem lesz elérhető számodra ilyen óra, szívesen megtanulnád ami a könyvben van, de félsz, hogy csak úgy önszorgalomból nem leszel elég kitartó, úgy van egy formabontó ajánlatunk:

  • Adunk neked ajándékba egy példányt a könyvből
  • Gyere el vizsgázni hozzánk a könyv anyagából 2016. október 1-ig, szívesen levizsgáztatunk belőle.
  • Ha nem sikerülne a vizsgád, vagy végül nem tudtál eljönni, akkor visszakérjük tőled a könyvet.

A részleteket úgyis megbeszéljük majd, a lényeg, hogy segítünk abban, hogy rávedd magad arra, hogy a könyvben foglaltakat megtanuld. A lehetőséget első körben a 3 leggyorsabban jelentkező hallgatónak adjuk meg. Jelentkezni: gaspar@tmit.bme.hu címen tudtok.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Etika a big data világában

Etika a big data világában

Néhány hete egy Python kurzus végén beszélgettem egy lelkes kollégával, akinek lelkesen újságoltam milyen izgalmas adatelemzési projektet indítottunk egy új partnernél. A partner neve hallatán ő egyáltalán nem lett lelkes - sőt kijelentette, hogy ennek társaságnak ő sosem dolgozna. Régi gondolatokat ébresztett fel bennem ez a történet.

Korábban nem volt annyira érdekes a civil szférában, hogy egy adatelemző adta eredmény mennyire szól bele az egyén életébe. Egyszerűen nem voltak a legyűjtött adatok olyan részletesek, hogy olyan erős modellt tudjunk építeni, ami alapján valakinek az életébe túlzottan beleszóljunk. 

a_4.jpgAztán szép lassan egyre mélyebbre ásott a szakma, mígnem szinte előjel nélkül eljött a data science etika fekete napja, ami egyértelműen a Target.com körül kitört botrány: az árurendelési és böngészési szokásokból nagy pontossággal tudták kimutatni, hogy mikor esett teherbe egy ügyfelük. Ennek birtokában célzottan keresték meg prospektusokkal a kismamákat, akik gyakran még a hírt nem is közölték környezetükkel. Sőt, később kiderült, hogy bizonyos esetekben a Target.com magánál az ügyfélnél is hamarabb tudta meg az új fejleményt, a hatalmas adatmennyiségből olyan termékeket tudtak azonosítani, amik az első trimeszterben levő kismamák figyelmét önkéntelenül felkeltik.

Az eset hirtelen rávilágított azokra a kérdésekre, meddig felelős egy elemző az általa végzett elemzésért, mettől felelős az elemzési eredményekre támaszkodó üzleti oldal, mennyiben kell odafigyelni az elemzésünk lelkiismereti vonatkozásaira?

Napjainkban még csak a dilemmát látjuk, nem annyira a megoldást. Jogos igényünk, hogy legyenek világos szabályok, amik alapján mindig meg lehet mondani, hogy amit teszünk, az etikus (függetlenül attól, hogy a jog mit mond a dologról). Személyes véleményem szerint nem alkotható meg a jó szabályrendszer, minduntalan fogunk pro és kontra ellenpéldákat találni. Ez azonban nem azt jelenti, hogy nem kell próbálkozni a kérdés tisztázásával.

Az én felelősségem abból a szempontból is nagyobb, mert mind a Műegyetemen, mind a cégeknél folyó on-site képzések kapcsán sok ember tőlem hall először erről a dilemmáról, az etikai aggályokról. Egyenlőre nem tudok többet tenni, mint néhány konkrét esetet felvázolva elgondolkodtatom őket arról, hogy ők hogyan döntenének hasonló esetekben, elmondom az én személyes állásfoglalásomat - de nem gondolom, hogy ezt kellene mindenkinek követnie. Ezekkel a sztorikkal szembesítem őket:

  • Régi amerikai hitelbírálati esetek, mikor a hitelfelvevő bőrszínét, majd ennek tiltása után a szomszédban lakók bőrszínét kérdezték meg a jelentkezőtől
  • Megkérdezem, mi a véleményük a keresés tényétől változó repülőjegyárak mechanizmusáról
  • Felvázolom nekik a már említett Target.com történetet az elemző és a marketinges aspektusából
  • Végigbeszélünk egy egészségügyi adatelemzős esetet, mikor műtéti kockázatok számításáról és felhasználásáról gondolkodunk
  • A társkereső oldalakba épített adatelemzési algoritmusok sajátosságai kapcsán feszegetjük a kérdést, hogy ezen oldalak célja a hosszú előfizetési időszak elérése, ami egy idő után már ellentétes lehet azzal, hogy hamar megtalálja a hozzá passzoló lehetséges partnereket.

Tudtok olyan sztorikat még, ami ezen a területen érdekes lehet? 

 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Féléves nyitott data science kurzus a BME-n

Féléves nyitott data science kurzus a BME-n

Az előző félév ismételten bizonyította, hogy nagyon népszerűek a BME-n futó, külsősök számára is megnyitott data science és big data képzéseink. Előző félévben közel 50 külsős szakember jelentkezett be a tárgyainkra, az Ericssonnal kötött megállapodás kapcsán például az onnan érkező kollégák közül 27-en a zárthelyit is megírták.

a.jpgFolytatjuk a hagyományt, ebben a félévben a data science világába bevezető tárgyunkat nyitjuk meg. Hetente csütörtökön reggel 8h15-től és minden második szerdán 10h15-től lesznek ezek az órák megtartva. Az első alkalom február 17.-én, szerdán, 10h15-kor kezdődik.

Téma szempontjából az adatelemzés alapjait vesszük át: adatmodell, CRISP-DM, felügyelt és nem felügyelt tanulási eljárások, adatbányászati modellezés, és sok alkalmazási példa: elvándorlás-előrejelzés, kockázatbecslés, szegmentáció, idősorok előrejelzése. Az első hetekben RapidMiner 6-tal dolgozunk, majd a python adatelemzős alapjait sajátítjuk el gyakorlati alkalmak keretében. Mindenkitől azt kérjük, hogy a gyakorlati órákra majd hozzon saját számítógépet, amire a megfelelő programcsomagokat telepítette (az ingyenes verziókkal dolgozunk).

A tárgyhoz házifeladat is tartozik, ami egy felügyelt tanulási feladat lesz valós adathalmazon - sőt a kaggle.com rendszerén keresztül egy zárt adatbányászati versenyen is megversenyeztetjük majd a házifeladatra adott megoldásokat. A helyszínről és a pontos beosztásról a jelentkezés után, annak elfogadása esetén tájékoztatunk. 

Már most látszik, hogy elég sok külsős hallgató jelentkezése várható, ezért némi korlátozással is élnünk kell majd. Egyrészt a szokásosnál nagyobb kooperációt kérünk majd tőletek, hogy továbbra is az egyetemi hallgatók körül foroghasson ez a tárgy, ténylegesen rájuk tudjunk koncentrálni a munka során - a külsős hallgatók az ő vendégeik, tartsuk ezt tiszteletben. A külsős hallgatók létszámát korlátozzuk, illetve ugyanazon cégtől csak kivételes esetben fogunk nagy számú jelentkezést befogadni. 

Várunk benneteket!

Jelentkezés az "Adatelemzési platformok" című tárgyra - Jelentkezési form

Egyedi tematikájú képzések

a_3.jpgFelhívjuk a figyelmet arra, hogy szívesen dolgozunk ki személyre vagy cégre szabott tematikát is, ha gyorsabb haladásra és hatékonyabb tanulásra van szükség. Itt sokkal jobban tudunk igazodni a már meglévő kompetenciátokhoz, a képzést gyakorlatai során akár a saját adataitokon végezzük az elemzést. Ezúton más technológiákat is szívesen tanítunk, Python, R, RapidMiner, SPSS Modeler, SAS, Oracle, KNime környezetben is szívesen oktatunk, de big data technológiákhoz is vannak jó képzési javaslataink. Az elmúlt évben több mint tíz ilyen képzést tartottunk, keressetek meg bátran, ha ilyen kérdés merül fel benneteket, a tematika rögzítése után gyorsan tudunk árajánlatot adni, a speciális igényeitekhez igazodni.

Ha érdekes, írj néhány sort: Gáspár Csaba - gaspar.csaba@dmlab.hu

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Az első hazai sportanalitikai konferencia

Az első hazai sportanalitikai konferencia

a_1.jpgTanszékünk volt kollégái által gründolt U1 Research csapata a sportanalitika területén tart konferenciát 2016 február 25.-én. Ismereteim szerinte ez az első hazai ilyen típusú kezdeményezés, érdemes rá odafigyelni, a belépő ára is igen kedvező. 

Kedvcsinálónak idemásolom a konferencia felvezetőben megfogalmazott kérdéseket - azt hiszem ez nemcsak az adatelemzők, hanem a sport után érdeklődők szívét is megdobogtatja majd:

  • Mennyiben járult hozzá az adatelemzés a foci Eb-re való kijutáshoz?
  • Vajon segített volna több sportolót az olimpiára való kijutásban az adatelemzés?
  • Hogyan lehet a rendelkezésre álló adatokat a sport szolgálatába állítani?
  • Hogyan lehet maximalizálni a teljesítményt?
  • Hogyan lehet minimalizálni a sportsérüléseket?
  • Hogyan lehet növelni a bevételeket?

U1 Sport Data Analytics Summit - 2016

2016 február 25. - Boscolo Hotel, Budapest

Csak remélni tudjuk, hogy a hazai sport is nyitni fog az analitika iránt, és a hazai szakmai közegnek is jut ebből feladat. Az első fecskék már megjelentek, de én még sok élő példát nem ismerek. A BME-n levő tanszékünkön squash ütőkbe rejtett szenzorok elemzésébe folyik, külföldön élő hallgatóm a munkahelyén folyó munka kapcsán kanadai hoki csapatok mozgását elemezte, és nemrég találkoztunk egy nagy tanácsadó céggel, aki itthonról szolgáltat sportanalitikát európai futballcsapatoknak. Ha tudtok más hazai sportanalitikai projektről, bátran osszátok meg velünk kommentben.

(Kép forrása)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Év eleji újratervezés

Év eleji újratervezés

A világ állandóan változik, és Darwin óta tudjuk, hogy nem a legokosabb, nem a legerősebb, 
de nem is a legügyesebb lesz az, aki ezekből a változásokból a legjobban jön ki. 
Hanem az, aki legjobban 
alkalmazkodik a változáshoz.

Az évzáró megbeszélésünk elején közösen összegyűjtöttük, hogy melyik hónapban mi történt velünk az elmúlt évben. Ezt a táblázatot nézegettem a napokban, és azon morfondíroztam, hogy mennyivel léptünk előrébb egy év alatt, mi az amivel többet állíthatunk magunkról 2015 januárjához képest. A legkiemelkedőbb pontként a gyors tanulási görbe és az adaptációs képesség jelent meg idén.

comp_norb.pngAzért is érdekes ez, mert míg minden csapattagunktól ezt a tulajdonságot  magától érthető módon elvárjuk, addig egy cégtől általában azt követeljük meg, hogy egy-egy témához felkészülés nélkül értsen. Egyszerűen sután hangzik, ha azt mondom egy bemutatkozó találkozón magunkról, hogy gyorsan meg tudunk tanulni egy-egy új területet: ugyanis nehéz megkülönböztetni magunkat a mindent bevállaló fiatal lelkes srácoktól, miközben a gyors tanulás tulajdonsága mégiscsak az egyik legerősebb dolog ebben a gyorsan változó, napról-napra új technológiákat hozó data science világban. 

Természetesen személyesen önmagunkra lebontva is érdemes rácsodálkozni, miben jutottunk előre egy év alatt. Tapasztalataim szerint ezen az úton a legmesszebbre az Éviránytű mozgalom remek kis füzetével lehet  eljutni, javaslom ezt mindenkinek függetlenül attól, milyen területen tevékenykedik. Ez egy ingyenesen letölthető, több kb. húsz oldalas munkafüzet jópofa feladatokkal az előző és a következő évre vonatkozóan. A korábbi évek tapasztalatai alapján mindenki le volt nyűgözve, aki belefektetett ebbe a belső munkába, és rászánt két óra nyugodt időt a kitöltésére. Az igazi kísérletezőknek pedig javaslom, csinálják meg a kérdőívet a saját cégükre is vonatkoztatva.

Változásokban gazdag Új Évet mindenkinek!

Éviránytű - www.yearcompass.com

"Zárd le 2015-öt. Tervezd meg 2016-ot."

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Startup || Kultúra – Meghívó egy szokatlan előadásra

Startup || Kultúra – Meghívó egy szokatlan előadásra

A startup szó sajátos csengést kapott a szakmai közösségekben. Egyszerre az egyik legmenőbb dolgok egyike, és egyszerre érezzük egyes esetekben kínosan magunkat egy-egy startup képviselőjének megnyilvánulásaitól. Csodálattal olvassuk a nagy felvásárlások után kiálló alapítók izgalmas sikertörténeteit, míg máskor fanyalogva értetlenkedünk azon, hogyan tudtak egy-egy ötlet mögé annyi tőkét bevonni. 

startup.jpgA startupokkal magam is sajátos viszonyt ápolok. A Radoop és az Enbrite.ly valóságát igen közelről láthathatom - egy irodában ülünk -, a szárnyaik bontogatásában közvetlenül nekem is volt szerepem, jó barátaim, kollégáim ülnek ezekben a csapatokban, így mindkettőben van üzletrészem. Kicsi ez a hazai szakmai közeg, mint egyetemi ember sok-sok volt hallgatót, egyetemi kollégát ismerek, kik szerencsét próbáltak és olykor megcsinálták a szerencséjüket a startupok világában. Nem utolsó sorban egy új startup kezdeményezésbe próbálunk a Dmlabbal életet lehelni, szóval nem vagyok nevezhető kívülállónak - de startupernek sem.

Ezért is volt elsőre (és sokadszorra) furcsa, hogy felkértek a Tanszékünk szervezte eseménysorozat kapcsán arra, hogy a startupokról alkotott véleményemről meséljek előadásban. Kétségkívül BME szűkebb berkein belül az egyik legtöbbet látott ember vagyok a területen, de a hazai startup közösségben egyáltalán nem vagyok egy véleményadó szereplő.

Hetek óta gyűjtöm a gondolataimat arról, mit lehetne egy rövid esti előadásban elmondani. Ma állt talán össze a fejembe minden ahhoz, hogy bátran hívjam meg a blog közösségét is erre a nyilvános előadásra, amit most csütörtökön, november 26.-én 18 órai kezdettel tartok a Műegyetem "I", mint Informatika épületébe, az IB019 terembe (belépve az épületbe jobbra, a porta mögötti klubterem). 

51014460282176d94aeaf544b8050ac3ef53c4d5ea0d9.pngHogy mire számíthattok tőlem? A startup világ és a kultúra világának párhuzamára fogom felfűzni azokat az erős véleményeket, melyeket összemazsoláztam az elmúlt években erről a területről. Sok sztorit és néhány elfogadott mondás mögött megbúvó féligazság leleplezését várhatjátok tőlem. Egyszerre leszek lelkesítő és kijózanító, izgalmas és unalmas - kicsit attól függően, hogy te mennyire merültél eddig ebben a világban. Egy biztos, én ezzel az előadással nagyon ki fogok lépni a komfortzónámból, és egy kicsit Téged is erre akarlak majd rávenni. 

Várlak szeretettel.

BME-TMIT Szeminárium: 

Gáspár Csaba: Tech startup kultúra sajátosságai

2015. november 26. csütörtök    18h-19h15

Budapest XI. kerület - Magyar tudósok körútja 2. BME I. épület IB019

Facebook esemény (köszönjük, ha itt jelzed érkezésed)

(Első kép forrása)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Mindeközben – A Kürt Akadémia nyílt napja – Pókfoci

Mindeközben – A Kürt Akadémia nyílt napja – Pókfoci

[LIVE]

a_1.pngÉppen a Kürt Akadémia Data Scientist képzésének nyílt napján adunk elő Nagy István kollégámmal. Egyfajta pókfocira készülünk: élményt akarunk adni a data science világából a jelenlévőknek. A szakma eredeti szabályait egy kicsit megkavarjuk úgy, hogy mindenki csatlakozni tudjon a közös munkához: csak webes technológiákat használunk, a résztvevők gépére nem installálunk semmit, nem kell ismernie a résztvevőknek a gépi tanulási eljárásokat, sem programozási nyelveket - és 70 perc alatt megoldható feladatot keresünk. Szóval olyan lesz ez, mint a pókfoci.

Az első feladatban azt feszegetjük, hogy a Budapest és a data közösség egymásra találása mennyire érhető nyomon a Twitteren. Összehasonlítjuk ebből a szempontból Európa nagyvárosait, és az egészből gyártunk egy grafikont. Utána ingatlanárakban keresünk majd anomliákat.

A két feladat résztvevőinek az alábbi feladatleírást adjuk ki:

1. feladat - Hasznos információk

2. feladat - Hasznos információk

Ha lement a képzés, akkor felrakjuk az első elemzés eredményét, tanulságos lehet. 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Crunch Konferencia – Mérföldkő a hazai big data világban

Crunch Konferencia – Mérföldkő a hazai big data világban

Jövő héten lesz a Crunch Practical Big Data Conference a Millenáris Parkban, a hazai események közül egyértelműen ez lesz az idei év legnagyobb durranása. Most nem is a konferencia programját vagy a szervezőcsapatot szeretném méltatni, bár mindkettő megérdemli a dicséretet és az őszinte elismerésem. Gondolatmenetemet a konferencia hatalmas méretéből szeretném elindítani.

a.pngKezdetben ezzel volt a legnagyobb gond: nyár elején megvolt már a program, de még nagyon kevesen jelentkeztek az eseményre. Mikor nyár derekán regisztráltam, egy ebédnél rákérdeztem az egyik szervezőnél, hogy mennyien vagyunk már: nem árulta el a valós számokat, de annyit kikotyogott, hogy a RapidMiner, Enbritle.ly, Dmlab cégeket befogadó irodánkból, a RED-ből van a regisztráltak több mint 50%-a. Ez a szám még akkor is kicsi lett volna, ha mindenki jött volna a konferenciára az irodából. 

Nyár elmúltával beindult a marketing, és a hazai szakmai közösség önmagát felülmúlva hirtelen rádőlt a konferenciára. Először a helyszín variálásával növelték a befogadható jelentkezők számát, majd 450 főnél lezárták a jelentkezést. Azóta tudtommal több mint 100 érdeklődőt kellett elutasítani helyhiányra hivatkozva.

Ezek a számok hatalmasak. Emlékszem néhány éve mennyire elámultunk, mikor az akkori BI közösségből 300 főnyi érdeklődő összejött az ingyenes IQSymposiumra. Nyilván az is magyarázhatja a jelenséget, hogy a big data technológiák világa tágabb, mint üzleti intelligencia területe, de akkor is azt kell mondjam, hogy az siker mögött több van, mint pusztán a marketing ereje.

Az én olvasatomban mostantól tekinthetjük nagykorúnak Budapestet big data szempontból. Eddig az előretörést láttuk, a különböző nagy cégek megjelenését itthon, megosztottuk a különböző big data startup sztorikat, gombamód szaporodtak a meetupok a területen. Látható volt, hogy valami nagy dolog készülődik itthon, hogy többről van szó minthogy a big data világszintű előretöréséről. Ha ránézünk Európa szakmai térképére jól látszik, hogy Budapest és a big data egymásra találtak.

Mi következik ebből? Semmi hirtelen és egetrengető. Mint mikor az ember 18 éves lesz: tart egy hatalmas partit, aztán az élet megy tovább - de mégsem teljesen ugyanúgy. Már nem csak várjuk az nagybetűs életet, hanem benne élünk. A hazai big data valóság sem fog teljesen megváltozni, de mégis más lesz. Ahogy most az egész big data világát kicsit egységben tekintjük, úgy fog ez egyre jobban specializálódni, a szakmai közösség újra fregmentálódni. Ezért is lesz nagy ünnep a most csütörök-péntek, mikor ennyien fogunk egy térben tanulni, inspirálódni, kapcsolatokat építeni. 

Ha lemaradtál, ajánlok figyelmedbe egy másfajta új kezdeményezést: BData - Business és Big Data Konferencia 2015. november 4.-én lesz megtartva. Ez az egynapos buli azoknak az üzleti oldalról érkező nyitott embereknek szól, akik big data szemléletével megfertőzni magukat. Nagy István kollégánk is az előadók között van, egy remek interjút is közölnek a szervezők vele, ezt külön ajánlom figyelmetekbe)


BData - Business és Big Data Konferencia
2015. november 4.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Budapest BI Forum Konferencia – Ma, holnap, holnapután

Budapest BI Forum Konferencia – Ma, holnap, holnapután

a_4.jpgA workshopokkal indult ma az idei Budapest BI Forum konferencia, Kazi Sanyi kollégánk vitte a délelőtti Python bevezető tanfolyamot. Holnap, holnapután lesznek a különböző előadások, én csütörtök délutáni adatbányászati szekcióban és a hozzá kapcsolódó kerekasztalban kapok szerepet, én leszek ennek a résznek a házigazdája. Ebből kifolyólag régebb óta figyelem a konferencia ívének kialakulását, erről osztanék meg veletek néhány gondolatot. 

Training Day

Zseniálisnak tartom, hogy egy konferenciához workshopok formájában lényegében tanfolyamokat is párosítsunk. A legtöbb esetben akkora szakadék van a hétköznapok és az előadásokban kicsit túlhangsúlyozott jobb jövő és jobb technológiák között, hogy érdemes tenni azért, hogy ezt a távolságot áthidaljuk. Egy workshop arra ad lehetőséget, hogy egy-egy új terület, technológia területén az első lépésekben segítséget kapjunk, megkapjuk a kezdőlökést. Ha megnézitek az idei év kínálatát, azt látjátok, hogy ezt több irányból is meg lehet kapni: tanulni lehetett Python, R és RapidMiner környezetben történő adatelemzést, adatbányászatot.

Előadói gárda, előadások

Arató Bence szereti a programot az utolsó napokig finomítani, igazgatni, így hagyományosan nagyon későn kerül bemutatásra, mi is fog történni pontosan. A teljes program is eléggé rejtetten van jelen a honlapon, itt találjátok. Most újra átolvastam, átrágtam magamat rajta, és tovább erősödött bennem az érzés, hogy a data science világa mennyire gyorsan tágul. A programból kimaradtak a big data technológiai vonalak - erre idén ősszel a Chrunch koncentrál -, így is elég széles spektrumból kapunk főleg külföldi előadókat. Van is egy-két "ezt nem szabad kihagyni" típusú előadás, másoknál csak Bence szelekciós technikájában bízhatok, hiszen nem volt időm mindenkinek utánanézni.

Adatbányászati szekció a nagyvállalatok szemszögének bemutatására

Kicsit kakukktojás jelleggel a konferencia végén külön szekcióban foglalkozunk majd azzal, hogyan reagálnak az új kihívásokra a nagyvállalatok. Miben változott a technológiai stack, hogy áll a helye az adatelemzésnek egy szervezeten belül, hogyan találják meg a megfelelő szakembereket a belső csapatokba. A két előadás előadóját egy OTP-s kollégával kiegészítve tartunk egy záró kerekasztalt, ahol kicsit feszegetjük majd, hogy mi is a valóság ennyi előremutató megoldás után. Külön örülök Főző Csaba jelenlétének, aki a Lloyds londoni központjában dolgozik, és betekintést enged majd abba, hogy ott hogyan működnek a dolgok. Csaba a Dmlabot 2007-ben megalapító  triumvirátus tagja, aki később az USA-ban, most Angliában dolgozik adatelemzési területen. Sok évvel ezelőtt Csaba beszámolóira alapozva kezdtünk el hinni abban, hogy van helye új elemzési eszközöknek, konkrétan az R nyelv használatának a nagyvállalati környezetben, megtörhető az akkori SAS-SPSS uralom az adatbányászat világában.

A korábbi években twitteres közvetítést adtunk egy-egy konferenciáról, idén erre most nem vállalkozunk. Egyszerűen annyira felbolydult ez a ma már data science világnak hívott terület, hogy a 160 karakteres kiemelések helyett arra akarok koncentrálni, hogy az új területeket egy nagy egységes világképbe tudjam helyezni. Annyira tágul ez az adatelemzési "univerzum", hogy ez egyre nehezebben megy. Hogy teljes képzavar: a big data jelenség mint ősrobbanás, mint egyfajta big bang mindent annyira átrajzolt a BI az adatbányászat körül, hogy ember legyen a talpán az a szakértő, aki ezt a világot most egészében átlátja. Pedig erre egyre nagyobb az igény....

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Első hazai adatbányászati verseny

Első hazai adatbányászati verseny


a_3.jpgNyár óta vártuk, hogy elinduljon az első hazai szervezésű nyílt adatbányászati verseny, a MOL Bubi Challenge 2015. A verseny nevében ott a témája, a méltán népszerű városi közbringa rendszer adatai felett lehet versenyezni három külön kategóriában. A versenyt a hazai data science közösség egyik zászlóshajója, a SZTAKI Adatbányászat és Keresés Csoportja szervezi a BKK-val kooperálva. A verseny mindenki számára nyitott, de a pénzdíjat csak felsőoktatásban résztvevő hallgatók vihetik el.

Néhány szó a három feladatról:

  1. task - Jelezzük előre, melyek lesznek a legnépszerűbb kiindulási-érkezési párok a rendszerben
  2. task - Becsüljük meg, mely állomásokon mekkora igény alakul ki a bringákra a nap során, azaz hol fognak sokkal több kerékpárt kivenni, mint amennyit bevisznek oda
  3. task - Az adatok nyílt felhasználásra adott ötleteket, megoldásokat várnak - például ki tudja a legjobb vizualizációt készíteni az adatokhoz kapcsolódóan

Mi már belenéztünk az adatokba, mondjuk azt, hogy a feladatok igen furfangosak. Ez azt is jelenti, hogy kevésbé a gépi tanulási eljárások ismerete az előny, sokkal inkább az analitikus gondolkodás, az adatok jó átlátása és manipulálása áll a feladat középpontjában. Persze talán az jár majd a legjobban, aki mindkettőben kiemelkedő.

Külön üdvözöljük az első hazai verseny meghirdetését, remélem kellően nagy sajtónyilvánosságot kap majd ahhoz, hogy kicsit tágabb körben lássanak rá a hazai cégek, szervezetek, hogy így is érdemes keresni a kapcsolódási pontokat a hazai data science szakmai közönséghez. 

Ha vannak már tapasztalatod az adatok világából, bátran ajánlom neked a versenyt - még akkor is, ha eddig még nem ültél a Bubi bringáin.

Az elmúlt 5 hétben egy zárt hazai versenyen is részt vett csapatunk Műegyetemhez kapcsolódó oldala. Egy hazai nagyvállalat indított egy meghívásos adatbányászati versenyt, hogy ezúton válassza ki a neki megfelelő együttműködő akadémiai partnert. Jó feladat, izgalmas adatok, és a versenyfeladatot ügyesen fogalmazták meg, így igazán kreatív megoldások is belefértek a feladat megoldásába.

Bármelyik órában megkaphatjuk a választ, mi kapjuk-e a verseny kapcsán a megbízást. Szerintem már megvan a döntés, csak nem kaptunk még róla értesítést, emiatt már mindenki tűkön ül a csapatban.

Meglátásom szerint más üzleti szereplőnek is érdemes lehet hasonló módon tendereztetni a partnereit. Én például el tudnék képzelni olyan szituációt, mikor valamilyen vizualizációs eszköz bevezetését lehetne megalapozni egy ilyen megmérettetéssel. Bízunk benne, hogy egyre többeknek lesz ilyen kreatív kiválasztási ötlete - és bízunk benne, hogy a Dmlabot is meghívják majd ezekre.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Őszi inspiráció – Budapest legfontosabb konferenciái az adatok világából

Őszi inspiráció – Budapest legfontosabb konferenciái az adatok világából

aa.pngA nyári pihenés után felmerül az igény, hogy a szakterületünkön is kapjunk újabb inspirációkat - erre az egyik legalkalmasabb lehetőség egy színvonalas szakmai konferencián való részvétel. Erre ezen az őszön sok lehetőségünk van, én most kettőt szeretnék kiemelni nektek Később kicsit részletesebben is írunk róluk. 

 

 

Crunch Practical Big Data Conference
Időpont: október 28-30.           Honlap: crunchconf.com

A Prezi egyik előremutató szokása, hogy nemzetközi szinten is kimagasló előadókkal hoz össze szakmai konferenciákat Budapestre. Az első big data konferenciájukat ősszel tartják olyan előadókkal, melyeket a nemzetközi adatos világban nagyágyuk. Ilyen előadókat hallgatni eddig leginkább a youtube-on tudtunk, nagyon erős élmény lesz őket egyben, ennyire koncentráltan találkozni velük. Egyenőre még csak az előadók listáját tudjátok böngészni, javaslom nézzétek át; ezt látva azok fognak lelkesedni, kik nemzetközi technológiai környezetben, startupokban, technológiai cégekben ülnek, de nyilván mindenki számára nyitott a konferencia.

Budapest BI Fórum
Időpont: október 13-15.          Honlap: budapestbiforum.hu

A komoly hagyományokkal bíró Budapest BI Fórumot már nem kell bemutatni, évek óta szoktunk közvetíteni róla. Amíg itt sincs fent a teljes program érdemes a korábbi évek felhozatalán ellenőrizni, mennyire illik hozzánk a konferencia szellemisége. Az a szakmai összejövetel kifejezetten a hazai data science világát célozza - ehhez hazai és nemzetközi előadókat vonultat fel. Külön kiemelném a kapcsolódó workshopokat, képzéseket is. 

Mivel mindkét konferencián részt fogunk venni, így várhatóan némi közvetítésre is számíthattok majd a szokásos formában, illetve mindkét esetben részletesen írunk az adott konferenciáról a következő napokban. 

Ráadás - ApacheCon

Az Apache: Big Data európai szintű konferenciát tart szeptember 28-30 között - már a program átlapozása is tanulságos és magában inspiráló. 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Őszi oktatás nem BME hallgatóknak

Őszi oktatás nem BME hallgatóknak

a_1.jpgEbben a félévben is lehetőség van a Dmlab csapata által oktatott egyetemi órákra külsősként is bejárni. Az előző félévben ez a lehetőség nagyon népszerű volt, összesen 31 ember jelezte, hogy szívesen csatlakozna egy-egy óránkhoz. Jelentős részük be is járt az órákra, a visszajelzések nagyon jók voltak. 

Idén egy kicsit más a kínálatunk, és a jelentkezést is megújítjuk. Már most látszik, hogy az egyik tárgyunkra nagyon sok külsős jön, így a regisztrációt mindenkitől kérjük. Fontos, hogy a tárgyhoz bármikor csatlakozhattok, be lehet kapcsolódni a félév felénél is. Mivel általában gyakorló szakemberekről van szó, így az első néhány hét kihagyása egyáltalán nem gond.

És akkor a tárgyak:

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Terem: Kedd - Q épület QB104, Csütörtök I. épület IL105 (Lágymányosi Kampusz, Magyar tudósok körútja 2.)
Tárgy hivatalos tematikája

Az iteratív módon fejlesztett adatfeldolgozó eljárások vannak a középpontban, az adatelemzés programozási nyelveit tanítjuk nektek. A témát a reguláris kifejezésekkel, illetve az awk szövegfeldolgozóval kezdjük, majd SAS programozási nyelvet, Pyhon és R programozást tanítunk úgy, hogy közben a legfontosabb gépi tanulási feladatokat is röviden áttekintjük. A félév során három kisházit adunk a hallgatóknak, majd vizsgával zárul a tárgy. Ezek ugye nem kötelezők a külsős hallgatóknak, de ha valaki meg szeretné méreti magát, annak adunk lehetőséget.

 

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Kedd 12-14h
Terem: Kedd - Q épület QBF13 (Lágymányosi Kampusz, Magyar tudósok körútja 4.)
Tárgy hivatalos tematikája

Itt a Dmlab big data szakemberei adnak betekintést a területen kialakult technológiai stack felépítésébe. A Mapreduce, Hadoop alapoktól indulunk, és a legújabb technológiákig jutunk el. Nyilván mindben teljesen nem fogunk tudni elmélyedni, de aki ezt a kurzust végighallgatja, az könnyen el fog tájékozódni a bigdata technológiák között. A félév végén egy ZH és egy házifeladat alapján kapnak jegyet a hallgatók, külön kérésre a külsős kollégák is megmérettethetik magukat ezeken a számonkéréseken.

Ha a webes adatbányászat alapjai érdekesek számodra

Tárgy neve: Szöveg- és webbányászat
Szerda 10-12h, Csütörtök 8-10   - október elején két héten keresztül - pontos időpont még egyeztetés alatt 
Terem: egyeztetés alatt
Tárgy leírása a tanszéki honlapon

Ez a tárgy az előző félévben futott Adatelemzési platformok folytatása, ahol a mellékspecializációs hallgatók a szövegelemzés, -bányászat, illetve a webes adatbányászat alapjait sajátíthatják el. Mivel ebben a tárgyan a Dmlab csapata csak ez utóbbi részt oktatja, így meghívni is csak erre a részre tudunk titeket. A téma önállóan is értelmezhető, és a webes adatbányászat alapjaival foglalkozik majd. Fontos, hogy a webanalitikával, vagy például a Google Analytics mélységeivel ebben a tárgyban nem foglalkozunk - a fókusz arra vetül, hogy a webes világból származó adatokkal mit tud kezdeni egy adatelemző.

(kép forrása)

 Jelentkezés

Kérünk, hogy az alábbi form segítségével jelentkezzél. Néhány napon belül visszajelzünk a jelentkezésedről, de a szeptember 8-10 időszakban a visszajelzés nélkül is bátran gyere az órára el.

Jelentkezés form

 

 

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

BME Választható tárgyak a big data világából

BME Választható tárgyak a big data világából

a.jpgEz a kedvcsináló direktben a Műegyetem hallgatóinak szól, szeptember első hetében nekik kell ugyanis döntenie arról, milyen tárgyakat hallgatnak az adott félévben. Most ősszel két olyan választható tárgyunk indul, amit bátran ajánlok mindenkinek, akit a data science világa, vagy a big data területe érdekel.

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Tárgy hivatalos tematikája


Az elmúlt évek technológiai trendjei kapcsán egyre nagyobb az igény az olyan adatelemzésben járatos szakemberek után, akik nemcsak értik és használják a különböző adatbányászati eljárásokat, hanem komplex adatfeldolgozó megoldások implementálásával is megbízhatók. Egyre nagyobb szerepet kapnak ma a különböző adatelemzésre szakosodott programozási nyelvek, ezekre koncentrál a választható tárgyunk is. Foglalkozunk az alapszintű adatfeldolgozó megoldásokkal, a SAS programozási nyelvel, majd az R illetve a python nyelv adatfeldolgozásra specializált részeit ismertetjük meg. Sok gyakorlati példa, valós adathalmazok, veterán adatelemző kollégák, értelmes házifeladat és követelmények. Ezt az új tárgyat most másodszorra hírdetjük meg, nagyon szeretnénk, hogy idén is összejöjjön az indulásához szükséges létszám.

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Szerda 12-14h
Tárgy hivatalos tematikája

Azt hiszem a big data jelenséget senkinek sem kell bemutatnunk, átszövi a teljes IT világát. De milyen technológiák azok, amelyek tényleg nagy adatmennyiségeket képesek megmozgatni, amik sokgépes klaszterekek között osztják el a számításokat, amikre rábízhatjuk nagy adattömegeket. A tárgy fókuszában a Hadoop és a köré évről-évre egyre nagyobbra duzzadó big data technológiai stack áll. A hazai big data szakma legjobbjai tartják az órákat, a követelményekben szerepel egy kisebb Hadoop alapú rendszer felépítése, mint házifeladat - egy fiatal mérnökkel kevés jobb dolog tud történni, mint ennek vagy a fenti tárgynak az elvégzése.

(Kép forrása)

Külsős hallgatók fogadása


A hagyományoknak megfelelően a fenti két tárgy a külsős kollégák előtt is nyitva lesznek de az ő jelentkezésüket a csak egy héttel később, a hallgatók után várjuk. Mivel a választható tárgyakon túl más előadást is tartunk, így számukra egy kicsit szélesebb körből tudunk ajánlani órát - ami azért is fontos, mert a választható tárgyak kötelezően délben kezdődnek, így munkahely mellett azokat nehezebb végezni.

A részletekkel hamarosan jelentkezünk itt a blogon.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Péntek esti Villanások

Péntek esti Villanások

Első alkalommal ajánlok figyelmetekbe a blogon tévéműsort - a Spektrum készített egy saját gyártású műsort Barabási Albert László egyik központi gondolatából kiindulva: az legtöbb emberről nagy bizonyossággal megmondható, hol lesz egy nap, egy hét múlva. A filmben a Villanások című könyv alapgondolatát járják körbe ismeretterjesztő aspektusból, itt láthatjátok a műsor beharangozóját.A

Akik már olvasták Barabási könyveit, azok szakmai oldalról sok meglepetésre nem számíthatunk ebből a szélesebb közönséghez szóló műsorban, de azért mindenképpen érdemes lehet megnézni, milyen módon kerül bemutatásra a data science területének ez az ága a hétköznap emberének. Mondjuk adatokkal dolgozó szakemberként talán ezzel a műsorral tudod a legjobban bemutatni a rokonságnak, milyen kérdésekkel foglalkozol. 

A műsor igazi tartalmáról csak nagyon kevés információm van. Az biztos, hogy Barabásin túl néhány hazai szakember is megszólal majd a sorozatban, ezek között várhatóan én is meg fogok jelenni. Erre igen büszke vagyok, de valójában fogalmam sincs, mi is lesz végül berakva a velem készült interjúból, így most inkább lámpalázas vagyok - ilyen ez a popszakma...

Villanások - Spektrum 
2015. február 27.   20h30
További részek: március 6., 13., 20. - ugyanúgy 20h30

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Tavaszi data science óráink

Tavaszi data science óráink

Hagyományosan szívesen várunk titeket a Műegyetem tartott óráinkon. A hagyomány annyira erős, hogy már most kilencen jelezték, hogy részt vesznek a tárgyainkon, pedig lehetőségről a blogon még csak most írunk.

edu.jpgIdén két tárgyat tartunk, az első órákat ezen a héten tartottuk, de nem kell aggódni, ezek nélkül is könnyen be lehet kapcsolódni. 

Adatelemzési platfomrok - Bevezetése a data science világába

Előadás: szerdánként 8h15-10h - BME Q. épület - QA240
Gyakorlat: minden második csütörtökön 10h15-12h - BME Q. épület - QBF10 (első alkalom: február 12.)

Az új mellékspecializációnk (mellékszakirányunk) első tárgya, nagy lelkesedéssel futunk neki, most tartjuk először. Az adatbányászati alapfeladatokon, az adatelemzési alapgondolatokon futunk végig, beletanulunk a RapidMiner és a python nyelvű adatelemzésbe, illetve betekintést adunk a big data technológiák világába. Nagyon sok témát tettünk bele a tárgyba, talán többet is, mint ami egy ekkora óraszámba belefér, ezért számítunk a hallgatók aktív befogadó munkájára. Szerdánként beszélünk az elméletről, csütörtökön egy-egy gyakorlatot tartunk, ahova mindenképpen érdemes saját laptopot is hozni, hogy együtt tudjunk dolgozni.

Customer Analytics - Ügyfélanalaitika

hétfőnként 12h15-14              BME - I. épület - I.L.105 
csütörtökönként 14h15-16     BME - I. épület - I.L.105

A gazdaságinformatikusi képzésünk angol nyelvű tárgya, fókuszában az ügyfélanalitika áll. Kisebb közönségnek adunk elő, kicsit több időnk van az egyes témák átrágására. Technológiai oldalról itt kicsit változtatunk a hagyományos esetekhez képest, előtérbe jön itt is a RapidMiner és a python nyelv.

Az órákhoz bárki csatlakozhat, függetlenül attól, hogy BME hallgató-e, vagy sem. Egyetlen kérésünk van, hogy ha külsősként, nem a tantervi keretek között csatlakoznál hozzánk, kélek vedd fel előtte velünk a kapcsolatot mailben (Írj nekem - gaspar@tmit.bme.hu). Ennek kapcsán a belső anyagokat is meg tudom majd veled osztani. Várunk benneteket. Ha pedig úgy érzed, nekem nem a legjobb, ha 14 héten keresztül hetente csak egyszer-egyszer ülsz be egy órára, akkor keress meg minket, jelentős tapasztalatunk van személyre szabott oktatási programok összeállításában és megszervezésében is.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Big data évértékelő

Big data évértékelő

2014 egyértelműen a big data jelenség diadalújta volt. Egy ennyire gyorsan növő hype kifejlődésének egyik sarokpontja, mikor elkezdenek arról cikkezni, mikor fog az őrület lecsengeni, mikor pukkad ki a felfújt marketingbuborék. Már neve is van a kiábrándulás utáni kornak, a jól ismert vészjósló mondat jól körülírja a félelmet: "Big-data winter is comming".

2015newyear.pngSzerintem azonban a big data jelenség más természetű, nem egy lecsengő, majd konszolidált szinten visszatérő buzzwordként fog mindez a fejünkben maradni. A big data ma már olyan szinten áthatja a széles tömegek, cégek gondolkodását, hogy sokkal inkább fog hasonlítani ez a görbe a mobiltelefonok körüli technológiai hullámra.

A mobil világ gyökeresen változtatta meg globális szinten az emberek mindennapjait, és ez a hatás nem múlik, tovább fokozódik. Nyilván a mobil világon belül vannak lecsengett témák, vannak kifutott technológiák, épp hogy életben levő, korábban fényes napokat megélt cégek és márkák. De a mobil, az okostelefonok világa csúcssebességgel tör előre - még akkor is, ha ma már nem abban van az üzlet, amiben az őrület kirobbanásakor sokan megtalálták a számításukat.

Hasonló forgatókönyvet várok a big data, az adatelemzés, az adatok felhasználásának új útjainak irányában is. El fog tűnni egy-egy korábban elpusztíthatatlannak tűnő technológia, vállalat, de a big data szelleme, az eköré felépíthető világ bővülése továbbra is jelentős marad. A sok-sok egymáshoz adódó kisebb hype ciklusból egy folyamatosan, bár később egyre lassabban növekvő big data trendgörbe fog kirajzolódni.

Hogy mikor térünk át a jelenlegi exponenciális szakaszról a lineáris növekedési pontba? Nem gondolom, hogy ezt a pontot 2015-ben fogjuk elérni, vagy legalábbis nem fogjuk észrevenni. 2015-ben inkább a korrekciók éve lesz: az első big data projekek tapasztalatai most épülnek be azoknak a gondolkodásába, akik az elmúlt 1-2 évben hallottak erről a területről először. Egyszerűbben bölcsebben, tapasztaltabban fognak hozzáállni a big data ígéretéhez.

2015nw.jpgDmlab számára is nagyon erős volt a 2014-es év. Nagy projekteket zártunk, új partnerekkel kezdtünk el dolgozni, és berobbantunk a startupok világába is, hogy csak a sikeres próbálkozásokat említsem: a dmlabból induló Radoopot a nyáron felvásárolták, a technológiánkat felhasználó Enbrite.ly megnyerte Európa egyik legnagyobb startup versenyét. Új data science szakirányt indítunk éppen a BME-n, és soha ilyen sokat nem oktattunk még céges kihelyezett tanfolyamokon. Őszintén megmondom, az év dmlab évének áttekintése kapcsán azt éreztem, hogy a 2014 számunkra két évnyi eseményt hozott.

2015 a data science világában dolgozók cégeknek, így a dmlabnak is felrobbanó big data világához való alkalmazkodásról kell hogy szóljon. A növekedés ugyanis a korábban fixnek hitt struktúrákt szakít szét, minden ami működött ebben a világban az elmúlt években, nem biztos, hogy életképes lesz a jövőben. Az adaptivitás, a megújulás képessége ebben az időszakban éppolyan fontos lesz, mint a legújabb technológiák gyors befogadása. Ez alapján ahogy 2014 a "big data" éve volt, úgy 2015 az "reorganizáció" éve lesz.

Minden kedves olvasónknak boldog Új Évet, sok változást, és mégtöbb adatot kívánok!

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Miért jó data scientist-ként dolgozni?

Miért jó data scientist-ként dolgozni?

Erre a kérdésre kell majd válaszolnom hamarosan olyan hallgatóknak, akik az új Adat- és Médiainformatika mellékspecializációnk (más néven szakirányunk) után érdeklődnek. A jól összeállított tárgytematikán túl arról is beszélni szeretnék neki, hogy miért is érdemes ezt a szakmát választani. Nekem szenvedélyem ez a szakma, de nagyon szívesen meghallgatnám az olvasóközönséget arról, ő miért szeret az adatelemzés, az adatbányászat vagy az üzleti intelligencia területén dolgozni. 


ilovebd.jpgArra kérlek benneteket, töltsétek ki az alábbi form-ot, írjatok nekem néhány ötletet , gondolatot - a nagyon hosszú történeteket mailben várom a gaspar.csaba@dmlab.hu címre. Nem követelmény, hogy data scientist legyél, elég ha egyszerűen szereted az adatok világában való munkádat. A kitöltés teljesen anonim, csak annyit teszünk nyilvánossá, amennyit a form végén megadott válaszaidban engedsz nekünk.

 

Miért jó dolog az adatok világában dolgozni? - Kérdőív

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Közvetítés a HVG Big Data a marketingben konferenciájáról

Közvetítés a HVG Big Data a marketingben konferenciájáról

A mostanában önállóvá vált HVG "Big Data a marketingben" című konferencián ülök, a Twitter közvetítésnek van már nálunk hagyománya, most is érdemes néha benézni erre a posztra.

 

Hamarosan ugyanitt kirakom az Prezi.com előadásomat is, érdemes lesz visszanézni.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Ha nem tanulsz belőle, nem érdemes hibázni

Ha nem tanulsz belőle, nem érdemes hibázni

A hosszú hétvégén tartják meg az első hazai Kudarckonferenciát. Előzetes terveimmel ellentétben nem tudok ott lenni, de maga a gondolat nagyon izgalmas - halljunk arról, hogy ki mit csinált rosszul, tanulhassunk belőle. Emlékszem többször nekifutottunk, hogy erre a tematikára építsünk egy Data Science Meetup alkalmat (akkor még ez Adatbányász Meetup volt), de végül nem jött össze: a kudarcokról mindenki szívesen meghallgat másokat, de csak nagyon biztonságos környezetben kezd el beszélni saját történeteiről. Ráadásul a magyar mentalitás kiemelkedően kudarckerülő, nagyobbra értékeli a társadalom azokat, akik el sem indultak, mint akik nekiveselkedtek, de elbuktak.

aaaa_blog-photo-failure-success.jpgAz alap attitűdök megváltoztatása nem célunk, de a igyekszünk jó példával elől járni: két esetet felvázolok egy-egy kudarcunkról, amiket nemrég követtünk el, és utólag elég mókásak voltak.

1. epizód

Az Amazon felhőjében csináltunk nemrég egy új projektet, ahol a bankkártya adatok megadásával práhuzamosan a konfigurációt végző kollégánk bejelölte enterprise support checkboxot. Bár óránként néhány dolláros szerverbérlésként indult a dolog, csak ez az opció évente 25 000 USD költséget jelentett volna. Nagy pánik volt, mikor kiderült a hiba. A dolog szerencsésen zárult (hamar felhívtak, hogy tényleg komolyan gondoljuk-e a kérést), de kellett idő hozzá, hogy a konfigurációt végző kolléga is nevetve emlékezzen vissza erre az esetre.

2. epizód

Az egyik üzleti ötletünk validálására készítettünk egy angol weboldalt, ahol az egyes opciók iránti igény felmérését tűztük ki célul. Felsoroltuk a lehetőségeket, és egy linket adtunk meg, ahol további információk jelentek meg. Egy nagyobb AdWords kampány után izgatottan néztük a látogatási adatokat, vajon a termék melyik opciójának linkjét kattintották szívesebben a potenciális felhasználóink.
Az eredmények ismeretében kiderült, hogy a felsorolás első elemét olvasták a legtöbben; a második lehetőség lett a ranglista második helyén; és így tovább - lényegében az egyhónapos tesztidőszakból megtudtunk, hogy az emberek a felsorolásokat tipikusan az elején kezdik elolvasni. Kihagytuk az ilyen validációs lépés egyik alapfeladatát: nem véletlen sorrendben mutattuk be az opciókat, hanem mindenki ugyanabból a listából választhatta ki, melyik opcióról olvasna szívesebben. 

Aki számára mégsem érdekes a most szombati Kudarckonferencia, azoknak ajánlani másik lehetőséget is a jövő hétre: október 29.-én lesz a HVG Big Data a marketingben című konferenciáját, ennek a plenáris szakaszában én is meg fogok szólalni.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Data science választható tárgyaink a BME-n

Data science választható tárgyaink a BME-n

A most szeptemberben a Műegyetemen oktatott tárgyainkat szeretnénk a figyelmetekbe ajánlani. Ebben a félévben két választható tárgyunk indul két kurrens témában.

Az "Adatbányászati alkalmazások" című tárgyunk különlegessége, hogy műhelymunkával egybekötve tanítjuk meg a hallgatókat az adatelemzés, az adatbányászat fortélyaira: az előadásokat és a gyakorlatokat összekeverve mutatjuk be, hogyan lehet megoldani egy-egy valós adathalmaz felett definiált adatbányászati problémát. A fókuszban az egyes szoftverek vannak, RapidMinertől, a SAS Guide-on át végül még a Python alapú megoldásokig is eljutunk. 

education.pngEzt a tárgyat azért szeretem nagyon, mert izgalmas végignézni, hogyan formálódik egy-egy hallgató szemlélete a hetek során, hogyan tud a végén egy házifeladat keretei között megoldani egy teljes adatelemzési problémát. Sokat tanulok ebből arról, hogyan érdemes tanítani ezt a szakmát.

A másik gyöngyszemünk a "Big Data eszközök nyílt forráskodú platformokon" nevű tárgy, ahol a teljes Hadoop stack-et, a hozzá kapcsolódó kihívásokat és projekteket mutatják be a kollégák. Bizton veszem, hogy ez az egyik legjobb hazai big data tárgy, nem hiába van akkora érdeklődés is rá. 

A BME hallgatói (függetlenül attól, milyen karon tanulnak) még jelentekezhetnek ezekre a tárgyakra, de ha valaki külsősként akar bejelentkezni, azok jelentkezését is várjuk (mail: gaspar@tmit.bme.hu).

Itt jegyezném meg, hogy egyre több olyan megkeresés is érkezik hozzánk, hogy az adatelemzési, adatbányászati vagy big data technológiai kihelyezett kurzusokat tartsunk náluk - ha van nyitottság bennetek, szívesen egyeztetünk tematikát, adunk árajánlatot. A tapasztalatok azt mutatják, hogy a végzett szakemberek tanulási tempója és szemlélete annyira más, hogy egy-egy ilyen külön alkalmon jelentősen többre lehet jutni, mint egy tantervi órán a hallgatók között. 

Adatbányászati technológiák:   szerda-péntek 12h15 - BME. I. épület - (terem egyeztetés alatt)

Big Data elemzési eszközök nyílt forráskódú platformokon: szerda 12h15 - BME. I. épület - (terem egyeztetés alatt)

A kép forrása egy blogposzt, ahol a hallgatók kikopásának előrejelzéséről elmélkednek: Unlock the Secrets of Education with Big Data

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Aranyhal egy kívánsággal

Aranyhal egy kívánsággal

Egy nagyon kedves újságírónak meséltem a napokban arról, milyen nehézségei vannak a hazai üzleti életben az adatelemzés terjedésének. Felidéztem, hogy néhány éve viccesen azt mondtuk, hogy ha egy kívánságunk lehetne ezen a piacon, akkor az lenne, hogy a megrendelői oldal felső vezetői számára tarthassunk egy tréninget az adatközpontú gondolkodásról.

goldfish.JPGArra próbáltam utalni ezzel akkoriban, hogy technológiailag, kompetencia szempontjából jóval komplexebb és jobb rendszereket tudunk létrehozni, mint amit be tudna fogadni a legtöbb hazai megrendelő. Most tekintsünk el attól a ténytől, hogy a változást nem magunkon akartuk kezdeni, de ezt elhárítom azzal, hogy az aranyhaltól olyan dolgokat szoktak kérni, amit amúgy önmagunktól nem feltétlenül tudunk véghezvinni.

Az újságíróval való beszélgetés akkor kapott plusz csavart, mikor - jó kérdezőhöz méltóan - azt firtatta, hogy miről beszélnék ezeknek a felsővezetőknek. Bevallom férfiasan a kérdés letaglózott, és nagyon nehezen tudtam érdemi dolgokat kinyögni. Ha kifognám az aranyhalat és ott ülne velem szemben ez a sok ember, mit lenne érdemes elmondani nekik?

Azóta sokat törtem a fejemet erről, és most a menü körülbelül így néz ki:

  • Adatokban rejlő érték kiaknázásának korát éljük - mesélnék sok-sok példát, esettanulmányt, ahol valami fontos szerepet kapott az, hogy az adatokat felhasználták.
  • Mesélnék arról, hogy az adatvezérelt gondolkodás mit jelent, hogy mekkora ereje van első lépésben az egyszerű riportoknak is, később milyen komoly hatása lehet egy prediktív analitikai megoldásnak.
  • Azt hangoztatnám, hogy az üzleti intelligencia folyamatai mentén a cégkultúrának is változnia kell, és ezt első lépésben a legjobban a vezetőn érdemes elkezdeni. Kikérdezném őket, ők mit kérnének a saját cégükkel kapcsolatban egy olyan aranyhaltól, aki csak adatelemzési, adatfelhasználási kívánságokat teljesít.
  • Végül elmondanám, hogy milyen lehetőségei vannak arra, hogy ezen az úton lépjen. Mit érdemes csapaton belül megoldani, hogyan juthat olyan szakemberhez, aki a témában jártas, hol lehet oktatásban részesíteni a kollégákat, melyik tanácsadó csapatokkal érdemes együttműködni. Elmondanám, hogy szerintem a piacon mi most a marketing-lufi és mi a tényleges értéket teremtő irány.

Nem vagyok meggyőződve, hogy ez a helyes csomag, de azt hiszem lelkesen, csillogó szemmel tudnám képviselni, hogy az adatok szintjére is érdemes alámerülni, ha fejlődni akarunk. Azt hiszem egyre több hiteles szakemberre, sikertörténetre, hazai pozitív és negatív példára van szükség ahhoz, hogy ez az ügy a felsővezetőkig eljusson, hogy hatást keltsen. A big data jelenségnek köszönhetően sosem látott módon berobbant ez a téma a köztudatba, fontos lenne, hogy ebből a szempontból is ki tudjuk aknázni ezt a lehetőséget.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Az adat, mint társadalmi erőforrás

Az adat, mint társadalmi erőforrás

Az adatok értékével kapcsolatban sok frappáns megfogalmazást olvastam már: az adat az új olaj, ma már nem “az idő pénz”, hanem “az adat pénz”. De csak mostanában gondolkodtam el mélyebben az adatról, mint egy ország, egy társadalom erőforrásáról.

Kétségtelen, hogy napjaink digitális technológiájával átszőtt világában egyre több adat kerül rögzítésre. Az adatokat a legritkább esetben rögzítik adatelemzés céljából, általában a szolgáltatások operatív biztosítása, vagy azok számlázása, elszámolása kapcsán rögzítik őket (vagy azokat). Ugyanakkor minden rögzített adattag lényegében érték, gyakran kincs, ha adatelemzési, adatbányászati szempontból nézünk rá. Ez az érték tehát elsődlegesen magától keletkezik és kiaknázható.

bigdata_megujuloeroforras.pngUgyanakkor a kiaknázás kapcsán felmerül a kérdés, hogy ezen adatok újrahasznosítása ténylegesen érdeke-e a társadalomnak. Az egyén oldaláról gyakran a privacy védelme, féltése ad korlátot ennek, üzleti oldalról pedig gyakran a valós üzleti mechanizmusok felfedésének az akadályozása gátolja ezt a kiaknázási folyamatot. Ez utóbbira erős példa, hogy az adatok tételes feltárásából a egyes korrupcióval érintett vagy hibás üzleti döntéseire is fény derülhet. 

Az adatok gyűjtésével és feldolgozásával kapcsolatban végül is háromfajta kérdésre kell választ adnia egy-egy szervezetnek, társadalmi csoportnak:

(1) El tudjuk-e fogadni az adatokban látható, valós tényeken alapuló igazságot, vagy ragaszkodunk a tényeket kisebb részben tartalmazó, de számunkra gyakran rövid távon előnyösebb, általunk generált magyarázatokhoz?

(2) Az adatokban rejlő tények elfogadása után képesek vagyunk-e változtatni, hogy az adatok ismételt elemzésével láthatóvá váljanak erőfeszítéseink hatásai

(3) Képesek vagyunk-e megálljt parancsolni akkor, mikor az adatokban rejlő összefüggések etikus felhasználásának határához érünk. 

Mindhárom kérdés jellemzője, hogy nem technológiai korlátokról szól. Az üzleti életnek, a társadalomnak kell megadnia az egyes kérdésekre a választ, az első ponttól eljutni a harmadik pontig. Hogy egy szervezet számára melyik téma okoz nagy nehézséget, jól leírja, hol tart az adatelemzés területén. A nagy, nemzetközi webáruházaknál inkább a harmadik kérdésre adott válasz körül vannak gyakran problémák, míg tipikusan a közigazgatási, állami rendszerekben az első pont környékén akadnak gondok.

Talán a fenti gondolatmenet után nem meglepő, hogy az adatokhoz való viszonyt inkább társadalmi, mint technológiai kérdésnek gondolom, az adatot társadalmi erőforrásnak tekintem. Ez azt is jelenti, hogy nem annyira technológiai kérdés mennyire fogjuk felhasználni kihasználni az adatok mélyén rejlő értékeket, sokkal inkább ez a kérdés az emberek témához való viszonyán múlik. Ezért érezzük mi is a Dmlabban kiemelkedően fontosnak az oktatást, a hazai szakmai közélet fejlesztését, az adatok értékének képviseletét a társadalom felé. Ez több, mint üzleti érdekünk, ez az identitásunkat meghatározó missziónk kiemelkedő része.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Új oldal a hazai R közösség összefogására

Új oldal a hazai R közösség összefogására

A hazai blogszféra egyfajta lenyomata annak, hogy mennyi lelkes és szenvedélyes szakember van a magyar szakmai életben. Most egy új oldal indult R-projekt.hu néven, ami a Hírek fül alatt nemcsak blogtartalmat, hanem segédanyagokat, eseményeket szeretne aggregálni az adott témában. Az oldalra az R nyelvet érintő, a blogunkra írt cikkek is átkerülnek majd.

logo-tryr-home-68e548262b848831c5da792b29c66b18.pngIde vág, hogy idén szeptemberben másodszorra kerül majd meghirdetésre a BME-n az Alkalmazott adatelemzés című tárgyunk, ahol R nyelv, SAS és Python ismereteket lehet szerezni. Tavaly nagyon sikeres volt az a kezdeményezésünk, hogy ne csak a hallgatók jöjjenek be ezekre a tárgyakra, hanem - összhangban az egyetemek szabad előadáslátogatási gyakorlatával - külsősök is tanulhassanak nálunk. Mindhárom meghirdetett témára (big data technológiák, adatbányászati szoftverek, adatelemzésre használható nyelvek) egyenként 2-3 lelkes külsős kolléga járt be rendszeresen. Várhatóan idén is felajánljuk ezt a lehetőséget, a részletek augusztus végére lesznek majd láthatók - írunk róla majd itt is az Adatbányászat Blogon.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Adatbányászati eszközök népszerűsége

Adatbányászati eszközök népszerűsége

Már-már hagyományos módon a KDNuggets idén is felmérést indít, melyik adatbányászati, analitikai eszközt használják olvasói. Az eredményeken hagyományosan jól szokott szerepelni a RapidMiner és az R is, aminek magyarázatára sok-sok jó narratíva létezik - attól függően ki magyarázza az adatokat. Ebbe a parttalan vitába nem is mennék bele.

Sokkal érdekesebb most számomra az, hogy a felmérésben mennyire kevesen szavaztak a Pythonra. Az elmúlt néhány évben a Python jelentős előretörést könyvelhetett el a data science területén dolgozók között, a Kaggle versenyeket is általában ezen a platformon megírt megoldások nyerik meg. Ennek ellenére a ma leadott szavazatom után meglátott részeredményekből az tűnt ki, hogy nagyon kevesen jelölték meg ezt az eszközt. 

post-inflectionPoint.jpgHa korábban nem akartam számháborúzni, akkor itt sem lenne tisztességes. Csupán azt a gondolatomat szeretném felvillantani, hogy az elmúlt időszakban egy jelentős változás történt abban a tekintetben, hogy ki dolgozik az adatok analitikai feldolgozásán. A hagyományos adatbányász szakmán kívülről érkező új data scientist-ek világa egyrészt sokkal programozósabb vagy más esetekben sokkal üzletibb, vizualizáció-központúbb. Az teljes szakmai közösség úgy nőtt meg, hogy a középpontjában nem teljesen ugyanazok a szakembercsoportok állnak, mint korábban.

Ezt az új világot pont nekünk szükséges jobban megérteni, akik már dolgoztak a régebbiben is, hiszen mi emiatt sokkal kevésbé vesszük észre, ha koncepcióváltás történik. Márpedig minden jel arra utal, hogy éppen egy ilyen inflexiós ponton léptünk át nemrég.

Bátorítok mindenkit, hogy a KDNuggets.com-on szavazzon arra, milyen eszközt használ. A szavazást itt lehet megtenni egy mailcím segítségével:

Analytics, Data Mining, Data Science Software Used? 

Ha szavazol, utána láthatod a felmérés aktuális állapotát is.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Big data adatvizualizáció az EP választás kapcsán

Big data adatvizualizáció az EP választás kapcsán

Korábban írtunk róla, hogy a közgondolkodásban a big data jelentése nem egy technológiai vonal leírására használatos, sokkal inkább a trendi adatfelhasználás, adatkiaknázás irányába mutat. Ezért helyes megközelítésnek tartom, hogy a vs.hu oldalon megjelent EU Parlamenti szavazásokat feldolgozó vizualizációs megoldást big data adatvizualizációnak tartják. A csak böngészőből látható ábrákon megláthatjuk, hogy az egyes képviselőcsoportok mikor és hogyan támogattak egy-egy ügyet az Európai Parlamentben (vs.hu: Az együttszavazó bolygók harca - Kik a legnagyobb ellenfelek az EP-ben? Big data vizualizáció az Európai Parlament összes szavazásáról az elmúlt ciklusból). 

A vs.hu formai megközelítésben legelől jár a hazai hírportálok között, nekem különösen tetszenek a kiemelt cikkei, melyek egyaránt koncentrálnak a tartalomra és azt különleges design elemekkel is megtámogatják. A most hivatkozott cikk vizualizációs háttere különösen sokat hozzáad ahhoz, hogy a tartalmat érdekesnek tartsuk, sőt egyfajta új megértést, új rálátást is ad. 

epabra.pngAz üzleti intelligencia számára kiemelten fontos, hogy a tényadatok feldolgozásával, újszerű megjelenítésével az eredeti adatokon túlmutató információt adjon a felhasználónak. A vizualizáció is nagyon sokat hozzáad az adatokhoz, megérthetővé teszi, milyen erőviszonyok, milyen harcok folynak az EU-ban, plasztikussá teszi, összefüggésekbe helyezi a történteket. Engem a megoldás lenyűgözött, és mint választópolgárt, sokkal mélyebb rálátáshoz juttatott - remélem később is nyomon lehet majd így követni az európai eseményeket a vs.hu oldalon.

Mint szakembert az a kérdés, is foglakoztat, hogyan csinálnék meg én egy hasonló megjelenítést. A mostanában forgatott általános hálózatanalitikai és -megjelenítő eszközökön túl egy startup cég, az cx-ray.com megoldása jutott eszembe, akik cégen belüli kommunikációs kapcsolatokat térképeznek fel automatikusan a dolgozók által hagyott digitális lenyomatok alapján. Náluk is azt láttam, hogy azon túl hogy összeszedték ezeket a kapcsolati adatokat, úgy tudták megjeleníteni azokat, hogy az önmagában hozzáadott értéket, mélyebb megértést adott.

A konklúzióm az, hogy a vizualizáció egyre kevésbé a hab a BI tortáján, hanem egyre gyakrabban a produktum szerves része. A jó vizualizáció készítésének módja azonban még kevéssé tanulható. Ti milyen eszköz használatát javasolnátok? 

(Kép forrása: vs.hu)

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Big data képzést készül indítani a CEU

Big data képzést készül indítani a CEU

Az elmúlt hetekben járta be a sajtót a hír, hogy a Közép-európai Egyetem (CEU) big data képzés akkreditálásával bővíti oktatási kínálatát. Az IBM-mel közös együttműködésben Master of Science in Business Analytics néven indítanak 2015-től képzést, ahova elsősorban közgazdászokat, de természettudósokat, mérnököket és statisztikusokat is várnak. Az említett híreken kívül még semmi érdemlegeset nem lehet tudni a képzésről, ha valaki rábukkanna a tárgyak neveire, tematikájukra, az ossza meg velünk, igazán kíváncsiak vagyunk. 

HiResGraph300.jpgA hwsw.hu oldalon is közölt hír mögötti kommentek külön tanulságosak voltak. Egyrészt méltán vetették fel a kérdést, hogy egy ilyen irányú képzés mennyiben informatikai jellegű képzés, és ha az, abban mennyire erős a CEU. Egy dolgot azonban bizton állíthatunk: nagyon jó a marketing gépezete.

Sok komment szólt arról, hogy mennyire be van savanyodva a hazai akadémiai oktatási kínálat (ez valóban igaz), és hogy máshol nem is lehet ilyet tanulni, pedig nálunk a BME-n egyre több lehetőség van erre. Ugyan nem lett országos hír annak idején belőle, de nálunk is fut angolul egy Business Analytics szakirány a gazdaságinformatikai képzésen, de ennél is üdvösebb, hogy várhatóan a napokban fogja az egyetem befogadni az új műszaki informatikus képzési rendszert, amiben egy egész MSc mellékszakirányt fel tudunk majd építeni az adatok elemzésének kérdéskörére. Ha átmegy az akkreditáción, egyből írni fogunk itt is erről.

Találtam egy jó összeállítást arról, hogy a tengerentúlon milyen big data és analitikai képzések vannak, érdemes megnézni mit kínálnak az amerikai egyetemek. 

Data Science Central - Data Science programs and training currently available

 

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Egy éve az új Dmlab irodában

Egy éve az új Dmlab irodában


lyticslab_radoop_iroda_2.jpgNapra pontosan egy éve vagyunk a Dmlab új, Ipar utcai irodájában. Jelentős lépés volt ez tavaly februárban: mind fizikailag, mind képletesen nagyobb teret adtunk a Dmlabnak. Egy év távlatából bölcs döntésnek látszik, hiszen az új teret mindkét értelemben egy év alatt be is laktuk. 

Évekig úgy gondoltam, hogy a körülöttem levő épített környezetnek nincs hatása a munkámra, kinyitom a laptopom, és úgyis a képernyőmre tapad a tekintetem. Néhány éve azonban szárnyra kapott a Prezi irodájának legendája, a beszámolókból kitűnt, hogy egy jó környezet inspiráló a szakmai közösség számára. Ennek megfelelően mikor tavaly év elején új irodát alakítottunk ki, kísérletképpen külön hangsúlyt fektettünk erre a vonalra is. Kevésbé akartunk formabontók lenni, de egy belsőépítész lány segítségével mégis hozzá tudtunk tenni a Dmlab irodához egyfajta többletet.

irodamenyito1.JPGMa ha írhatnék egy mailt néhány évvel ezelőtti Dmlab vezetői önmagamnak, mindenképpen beleírnám az irodai környezet fontosságáról szóló tanácsaimat. Látom, hogy a monitoromon túli inspiráló világ hogyan ad lendületet, fókuszt a munkámnak - és ha valami nincs hatással rám, ahelyett hogy előre repítene, az lényegében hátráltat.  

A képek a Dmlab irodából valók - az első István kollégám munkaállomása, a második egy életkép a "farmeres" irodamegnyitó játszott öko-társasjátékról

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

2013 – Ami tényleg történt – A nagy változás

2013 – Ami tényleg történt – A nagy változás

Big data. Sokat olvashattunk, hallhattunk róla, és akárhogy nézzük, 2013 erről a technológiáról, jelenségről szólt. Hogy mennyire berobbant tavaly ez a szópár, százféle módon bizonyítható, most csak egyet ragadnék ki. Az alábbi ábrán az látható, hogy a Google Trends hogyan mérte az elmúlt években az "business intelligence" (kék), a "cloud computing" (sárga), és a "big data" (piros) szavakat. 

Screen Shot 2014-01-16 at 9.24.25 PM.png

Részletes elemzést a Google Trend ezen linkjén láthatod


A big data térnyerése egyértelmű, de ne álljunk itt meg. Egy olyan gondolatot, mémet szeretnék itt bemutatni nektek, melyre az elmúlt hetekben jöttem rá, és ami alapjaiban változtatta meg a szemléletemet nemcsak a big data világával kapcsolatban. A blog több mint 6 éves fennállásának legfontosabb üzenetének tartom ma ezt a gondolatot - izgulok is, mennyire tudom ezt röviden megfogalmazni, illetve mi lesz róla a véleményetek.

Gondolatmenetemet egy látszólag lényegtelen észrevétellel kezdem: egyre több helyen hallani, olvasni arról, hogy a szakmai közösség vitatkozik arról, hogy mit jelent a "big data". Gondolom nektek is megvan a saját verziótok, sokat hallottunk már, mégis érdekes kérdés, miért vitatkozunk még ezen ennyit, miért nincs konszenzus. Véleményem szerint a megegyezés hiányát egy paradoxonnak köszönhetjük, aminek megértése, feloldása után teljesen máshogy fogunk akár az egész szakmánkra tekinteni.

A paradoxont az adja, hogy a Hadoop és más kapcsolódó technológia megjelenésével az üzleti intelligencia, a BI egy új, gyorsan fejlődő technológiai megoldásegyütteshez jutott. Az adatelemzéssel, adatkezeléssel foglalkozó szakemberek számára így elég gyorsan körvonalazódott, hogy milyen esetekben érdemes használni ezeket a megoldásokat, mikor érdemes egy-egy big data technológiát bevetni, így joggal érezhettük úgy, hogy a big data valójában a BI egy gyorsan fejlődő részének tekinthető. Azt hiszem 2011-ig szerintem ezzel lényegében senki sem szállt volna vitába.

A tavalyi év során azonban a technológiai robbanáson túl publicitási robbanás is történt. A big data hulláma kitört a szakmai berkek közül, és elérte a mainstreamet, a hétköznapok médiáját. Gondoljunk csak bele, hogy nincs olyan hét, mikor nem olvasunk néhány big data témájú cikket a HVG-n, az Indexen, vagy más újságokban. Rádióknak adunk interjúkat, a technológiai fejlődést taglaló bárminemű hírnek kötelező eleme már a big data. Korábban ha ismeretlenek között beszéltünk arról, hogy adatbányászok, adatelemzők vagyunk, furcsa szakembereknek néztek az idegenek, ma egyre gyakrabban gyúl világosság a szemükben néhány mondat után, majd csak ennyit mondanak: "Ja igen, big data".

big_data_paradoxon_2014__radoop.jpgA közgondolkodásba való betörése miatt azonban a big data elvesztette minden eredeti technológiai aspektusát, a hétköznap emberének annyit tesz: céljaink elérése érdekében sok-sok adatot feldolgozni. Tovább megyek: a nyilvánosságba való beépülésből származó letisztulási folyamatban a big data elhagyta a sok ügyféllel rendelkező nagyvállalatokra vonatkozó exkluzivítását is, ennek megfelelően szélesebb területet ölel fel ma a nyilvánosság big data fogalma, mint a klasszikusnak mondható "üzleti intelligencia" világa. Big data alá sokkal természetesebb módon tartozik az egészségügyi, sport és fitness adatok feldolgozása, az ipari gyártósorok és az energetika adatainak kiaknázásaának lehetősége. A korábbi adattárház-riporting-OLAP-adatbányászat világból kilógva, gyakran ad-hoc módon, technológiától és komplexitástól függetlenül mindenfajta adatelemzést jelent ma a "big data" sok százmillió embernek, függetlenül attól, hogy mit gondol, mit tanult, vagy mit vall erről néhány százezer szakértő. 

A közgondolkodás természetesen visszahat a szakmai közegre is. Talán mindannyian emlékszünk kínos pillanatokra, mikor egy-egy hazai konferencián az előadó big data megoldásnak nevezte saját rendszerét, miközben technológiailag semmi olyat nem tartalmazott, aminek köze lenne ehhez a körhöz. Én is gyakran a fanyalgók között voltam, megvallom. De ahogy az elmúlt hónapokban többet volt időm olvasni a nemzetközi szakmai közösség írásait, rá kellett jönnöm az általánosabb megfogalmazás létjogosultságára is.

Egy szó mint száz: 2013-ra a big data nagyobb, átfogóbb fogalom, aminek csak részterülete a BI. Aki nem hisz ennek az állításnak, az javaslom nézze meg hány big data konferencia indult az elmúlt években, de az is árulkodó hogy egy normál BI témánál mennyivel többen mozdulnak meg egy hazai meetup alkalomra is, ha a big data témája jön elő. Csupa új arc, kiket a BI alig érintett meg korábban.

A BI területénél nagyobb big data világ kihívásai nagyon mások, mint amit a BI korábban hozott. Nem lesz sokra elég, ha a hagyományosnak mondható szemléletben vagyunk képesek működni, ha ehhez a kiugróan nagy kihíváshoz nem növünk fel, nem változunk meg. Aki nem gondolja újra önmagát, az egy olyan társkereső-társközvetítő iroda vezetőjéhez fog hasonlítani, aki azt gondolta tíz évvel ezelőtt, hogy az internet nem lesz képes megszorongatni az ő személyes tanácsadásra alapozott, világ végezetéig piaccal rendelkező bizniszét.

Mennyiben lesz más 2014-ben adatbányászattal, adatelemzéssel, big datával foglalkozni, mint 2013-ban? Erről írok majd a következő posztban.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

2013 – Ahogy tavaly januárban gondoltam rá

2013 – Ahogy tavaly januárban gondoltam rá

Év elején azt írtam, hogy a 2013 adatbányászati és BI szempontból a hazai startup-ok éve lesz. Nem így lett. Pedig nagyon igyekeztem minden informális csatornámat felhasználni, hogy rátaláljak minél több induló vagy futó statupra, ami valami módon használja az adatelemzést. Egyelőre 16 cég van a listámon, ami startup-nak tekinthető, és vagy az alapszolgáltatásában vagy annak támogatásában ismereteim szerint valamilyen adatelemzési megoldást használ. Ez elsőre soknak tűnik, de a valóság az, hogy a legtöbb cég, akire ráakadtam, az már több éve létezik, és nem 2013-ban kapott szárnyra.

success_failure_opp_large.jpgA 2013-ra vonatkozó tévedésem hátterében a statup-világ fejlettségével kapcsolatos naivitásom állt. Az elmúlt évben nem váltam igazi startup veteránná, de azért egy jó tucatnyi sztorihoz volt közöm, mert a Dmlabbal próbálkoztunk, vagy befektetőkkel tárgyaltunk, vagy egy-egy hallgatóval beszélgettem hosszasan az új cége indítása kapcsán. Ha a sikertelen sztorikat nézem, akkor az a tapaszatalatom, hogy legtöbbször valaki másra szeretjük kenni a dolgot: (1) nem jó Magyarországról indulni, (2) szűklátókörűek a befektetők, (3) hisztisek a technológiai emberek, (4) a piac még nem készült fel a zseniális ötletünk befogadására. Amennyire én látom egyik sem, illetve mindegyik igaz. 

Nem megyek bele a fenti négy indok sok-sok más blogon megénekelt bizonygatásába, inkább egy olyan aspektust szeretnék felvázolni, ami talán ritkábban kerül megfogalmazásra. Ez az egész startup világ annyira gyerekcipőben van még itthon, hogy jelentős tudásbeli, tapasztalatbeli különbségek vannak a szereplők között. Sok a totál kezdő, aki a divat kapcsán pillanatok alatt projektgazda, befektető vagy technológiai leader akar lenni. Aztán vannak akik már nem kezdők, nagyon meg vannak győződve róla, hogy értik ezt a világot, és iszonyú nagy hangerővel tudják mondani a butaságot. Utána vannak, akik nagyon meggyőzően tudják mondani a számodra le nem ellenőrizhető állításokat. És persze vannak a horror sztorik, ahol például a befektető a technológusok lakására jelzálogot akar bejegyezni a befektetett pénz biztosítására.

Ezen különbségeknek az a következménye, hogy nagyon nehéz egy új kezdeményezés köré új partneri kapcsolatokat kiépíteni, hiszen a szereplők bizalmi szintje a más területről jövők felé hihetetlenül alacsony. Ha nincs bizalom, akkor pedig általában inkább nyögvenyelős meetingsorozatok, újabb és újabb biztosítékok és kikötések születnek, nem új vállalkozások. Egyfajta startup Vadnyugatként működik az ország, amiben még kell kettő-három-négy év ahhoz, hogy az aranyláz lecsengjen, és kiderüljön mit érdemes tenni, és mi az ami csak a könyvekben / a tengerentúlon / a többieknél működik, nálunk nem. Addig pedig türelem kell, és bizony alázat, hogy bármit is értünk el ezen a területen, egyszerűen nem tudhatunk még annyit, mint amennyit el tudunk hitetni magunkról.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Évindító

Évindító

I-LOVE-DATA.pngMár-már hagyomány a blogunkon, hogy év elején egyfajta szakmai számadást teszünk az elmúlt évvel kapcsolatban, és némi találgatásokba bocsátkozunk a következő évre vonatkozóan. Az ilyen blogbejegyzések formája mostanra kristályosodott ki bennem, és most van a legtöbb mondanivalóm is az ügyben. Így aztán az évértékelő-évindító posztokat három egységbe foglalva fogom a következő napokban publikálni, ám közben érkezik még egy beszámoló Nagy Gábor kollégánk új és talán az eddigieknél hatalmasabb adatbányászati versenyekhez köthető sikeréről is.

A három téma az alábbi lesz:

  • Mennyiben volt igaz az, amit 2013 elején vártam az elmúlt évről. Akkor a startupok évének harangoztam be 2013-at, amit ma sem tartok rossz tippnek, de valójában nem erről szólt ez az év.
  • Miről szólt 2013 adatbányászati szempontból? Az első felbukkanó kulcsszavak a big data, data science, válság vagy annak vége. A közhelyeken túl azonban van egy(-két) fontos fordulat, ami 2013-ban ténylegesen utolért minket, és ami annyira nyilvánvaló illetve triviális, hogy talán észre sem vettük megtörténtét.
  • Merre tovább 2014-ben? Evolúció vagy revolúció? Nehéz tényleges előrejelzésekbe bocsátkozni, de próbálkozni fogok, legyen mire refrektálnom jövő év januárjában.

Addig is boldog Új Esztendőt kívánok mindenkinek!

Az adatok szerelmeseinek a Google Trends szolgáltatása által figyelt "Christmas" és "New Year" ünnepek mutatóit raktam be a poszt végére. Nekem meglepő volt, hogy a Karácsony népszerűsége a lassuló tendencia után újra erősödött, de hogy az idei újév miért lett ennyivel erősebb, mint korábban, azt nem tudom megmagyarázni. Szívesen fogadok tippeket.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Mekkora a torta?

Mekkora a torta?

A napokban volt olvasható Kovács Gyula tollából egy elemzés arról, mennyiben a tanácsadóké és mennyiben az egyetemi gyökerekkel induló szakembereké a hazai adatbányászati piac (Andego Blog: Kié a torta?). Érdekes és értékes írás - mondom ezt úgy, hogy én nagyon más szemléletben figyelem ezt a világot. Így egy másik aspektust vennék elő: júniusban indítottunk egy felmérést a blogon, hogy megbecsüljük mekkora a hazai BI és adatbányászati piac mérete (Adatbányász Blog: Hazai adatbányász piac mérete - Felmérés), így most inkább a torta méretére szeretnék fókuszálni.

suti.jpgKorábbi írásunkban azt kértük tőletek, hogy egy kérdőív segítségével adjatok választ néhány kérdésre, hogy azok felhasználásával a tömegek bölcsességére támaszkodva adjunk pontosabb becslést a hazai piac méretére. Az eredmények ilyen kései ismertetésében közrejátszott, hogy rajtam kívül összesen három szakember töltötte ki a kérdőívet. Hogy mégis érdemes foglalkozni az eredményekkel az azért van, mert a megadott elérhetőségekből kitűnik, hogy a szakma nagy "öregjei", legnagyobb nevei osztották meg a felmérésen keresztül véleményüket velünk (az ő jutalmuk, hogy nekik a nyers adatokat is elküldöm).

A kapott eredmények alapján az alábbi eredmények összegezhetők (az egyszerűsített piacméret becslési metodikánkat a felmérést indító posztban olvashatjátok)

Piacméret a cégek forgalmáról alkotott vélemények alapján 

  • BI piac mérete: 11,9 MrdFt
  • Ezen belül az adatbányászati piac mérete: 1,57MrdFt

Piacméret a szektorban dolgozó szakemberek számára adott vélemények alapján

  • BI piac mérete: 27MrdFt
  • Ezen belül az adatbányászati piac mérete: 4MrdFt

Az eredményeket figyelve elég szembetűnő, hogy a második módszer két és félszerese az első számítási módszerből adódónak, amit talán az indokol, hogy az egy főre jutó éves árbevétel becslése (16MFt) túl nagy szám. Én most valahol a két becsült érték között félúton sejtem az igazságot.

Ez tehát a torta mérete, és most ennek ismeretében beszéljünk arról is egy kicsit, hogy mekkorák a szeletek. A volt IQSysben, ma T-Systemen belül működő, Sipos Ferenc távozása után erősen átalakult BIT csapatot szoktuk hagyományosan a legnagyobb hazai szereplőnek tekinteni. Az ő éves forgalmukat ma már nagyon nehéz megbecsülni, de úgy vélem, hogy nem tévedünk ha az ő súlyukat az egész piacból 10-20%-ra tesszük. A következő szereplőt jó ha az ő méretük felére taksálhatjuk. A piac nagyon fregmentált, nagy részére rá sem látunk, inkább érzeteink vannak azokról a szereplőkről, akik aktív jelenléttel hírt adnak magukról, ahova kapcsolataink vannak.

Az eredmények értelmezésekor vegyük azt is figyelembe, hogy a BI, az adatbányászat világa az elmúlt években nagyon sokat változott. Azzal, hogy a határait ma egyre kevésbé technológiai, sokkal inkább üzleti szempontból határozzuk meg, egyre kevésbé egyértelmű, ki is foglalkozik ezzel a területtel. A tortán belüli arányok átalakítása helyett ezért is fontos inkább a piac növelésével, a piac építésével foglalkoznunk. Mi, a Dmlab ebbe az irányba köteleztük el magunkat.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Új embereket keresünk

Új embereket keresünk

Sokan tudjátok már, hogy nagy lelkesedéssel szoktunk segíteni azoknak, akik BI vagy adatelemzési feladatra keresnek új munkatársat, kollégát. Évről évre jönnek ki új hallgatók a kezünk alól, tartjuk a kapcsolatot a korábbi tanítványokkal, így elég nagy rálátásunk van arra, hogy ki az, aki szívesen mozdulna, váltana közülük. 

lyticslab_radoop_iroda_2.jpgA napokban mi is toborzásba kezdtünk, főleg programozásban járatos, fejlesztésre koncentrálni tudó tehetségeket keresünk új csapattagnak a Dmlabba, de szövegbányászati irányban is jól jönne egy kis bővülés. A kiírt állásajánlatokat a Dmlab Karrier aloldalán találjátok meg.

Egy érdekes tapasztalatunkat szeretném megosztani veletek. Több irányba is elkezdtük terjeszteni a hírt, hogy új kollégákat toborzunk, kíváncsiak voltunk az egyes csatornák hatékonyságára. Az első tapasztalatok leszűrés után engem meglepett, hogy az adott pozíciókra a Twitter milyen hatékony megoldásnak bizonyult. Több olyan tehetséges fiatallal kerültünk kapcsolatba, akiket Twitter nélkül szinte biztosan nem tudtunk volna elérni. Ki gondolta hogy ez már Magyarországon is működik.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Élőben a Budapest BI Fórumról

Élőben a Budapest BI Fórumról

Mint Nagy István kollégám tegnapi adatvizualizációs bejegyzésében már megemlítette, ma és holnap fut az év hazai BI konferenciája, a Budapest BI Fórum, legyenek itt külön kiemelve, összegyűjtve a twitter lenyomatai ennek az eseménynek.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Jön az év legjobb Data Science Meetupja

Jön az év legjobb Data Science Meetupja

Legalábbis én így értékelem a jövő heti találkozó alkalmát, mikor arról fogunk hallani, hogy milyen tapasztalatai vannak azoknak, kik data science témájú startup-okkal indultak el. Prezi, Radoop, Gravity R&D. Jelentkezzetek gyorsan, mert alig hírdettük meg, máris elfogyott a legtöbb hely.

Budapest Data Science Meetup - 2013. október 30. -  Entrepreneurship in Data Science

Az év elején azt gondoltam, hogy idén a BI - adatelemzős közegben a startup-ok időszaka fog beköszönteni. Talán még korai lenne ítéletet mondani arról, hogy igazam volt-e, de az tagadhatatlan, hogy a startup-ok (és a meetup-ok) jelenléte a hazai szakmai közéletben nagyon meghatározók lettek. Itt az idő, hogy kicsit ők kerüljenek a középpontba, talán el tudunk csípni néhány olyan gondolatot, amit sehol máshol nem fognak kikotyogni nekünk.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Privacy Policy

Copyright © 2017 BBBT - All Rights Reserved
Powered by WordPress & Atahualpa
X