Hands-On Training – Datastax – March 19th – Cassandra Essentials Day – Hilversum

Email not Displaying correctly, visit the DataStax Home Page
DATASTAX.COM

Hello Philippe, Hello members of the Brussels Data Science Community,

Please join this DataStax Cassandra Essentials Day for a full day of learning and hands-on training on Apache Cassandra™ — free of charge. Learn from Cassandra experts while you roll up your sleeves and dive into real-world applications. You will gain exclusive insights to Cassandra architecture and application development through varied exercises and collaborative networking.

On Thursday 19th March 2015 in Hilversum, a guest Cassandra user will share why the company chose Apache Cassandra and how this choice has transformed their business applications.

Please register so we can save your seat. Space is limited.

IMPORTANT: Please bring your laptop to this event! You will need it to participate in the Cassandra training.

AGENDA

09:30am – 10:00am  |  Coffee and Registration 
10:00am – 10:15am  |  Welcome and Introduction 
10:15am – 10:45am  |  Guest Speaker GoDataDriven – Andrew Snare,  
                                    Cassandra, Engineering 
10:45am – 11:15am  |  Customer Case – Wehkamp, Gerhard van der Bijl, Head  
                                    of Digital Development
11:15am – 12:00pm  |  Cassandra Data Structure & Replication 
12:00pm – 01:00pm  |  Lunch
01:00pm – 02:00pm  |  Multi-DataCenter Concepts, Tunable Consistency 
02:00pm – 03:15pm  |  Cassandra Data Modeling Architecture 
03:15pm – 03:30pm  |  DataStax Enterprise Overview
03:30pm – 04:00pm  |  Wrap up and Q&A

We look forward to seeing you there. 

Thanks,

-The EMEA DataStax Team

News – Neelie Kroes maakt 2,5 miljard euro vrij voor #bigdata

Neelie Kroes

Neelie Kroes

Neelie Kroes van de Europese Commissie maakt geld vrij om van Europa naar een leider rond big data te maken. Een deel komt van het innovatiebudget, de rest komt uit de privésector.

Met het geld wil Kroes investeren in initiatieven rond big data, specifiek met de focus op research en innovatie rond energie, manufacturing en gezondheid. Daarnaast komt er ruimte voor zogenaamde innovation spaces: een soort incubators of hubs waar kan geëxperimenteerd worden met eigen gegevens of open datta.

Wel is het bedrag van 2,5 miljard euro nog niet finaal. Aftredend Eurocommissaris Neelie Kroes haalt voor de investering een half miljard uit het innovatiebudget Horizon 2020. Daarbij verwacht ze dat privéspelers dat budget nog zullen verviervoudigen. De investeringen lopen over vijf jaar, van 2016 tot 2020.

Het is al het zesde partnerschap dat Kroes op deze manier afsluit. Daarmee hoopt ze dat Europa op een aantal digitale vlakken het voortouw kan nemen. “Geen enkele van de grootste big data bedrijven zijn Europees. Dat moet veranderen en dat is waarom we geld op tafel leggen. We hebben een geweldige infrastructuur, zowel algemeen als in telecom, maar we gebruiken het niet voldoende.”

 

TU/e en TiU willen opleidingscentrum voor data science en big data opzetten

TU/e en TiU willen opleidingscentrum voor data science en big data opzetten | Dutch IT-channel | News – Technology – Business – Network.

 

De Technische Universiteit Eindhoven (TU/e) en Tilburg University (TiU) willen samen een academisch opleidingscentrum opzetten met drie mastertracks: Data Science, Entrepreneurship en Governance. De universiteiten stellen dat data science en big data van cruciaal belang zijn voor de samenleving en het bedrijfsleven. Door hun krachten te bundelen in de Graduate School willen de universiteiten hierop inspelen.

De Graduate School moet internationaal opleidingen gaan aanbieden voor phd’s, masterstudies en ondernemers. De twee universiteiten voeren de komende maanden een haalbaarheidsstudie uit om de groeiende behoefte aan academisch gevormde data scientists, ondernemers en bestuurders in kaart te brengen. Eind 2014 moeten de partijen een definitief besluit nemen over het plan.

Krachten bundelen
TiU geeft les op het gebied van recht, overheids- en economische aspecten en ondernemerschap. De TU/e richt zich juist op de IT-kant van data science en ervaring in ondernemerschap. Door hun krachten te bundelen hopen de universiteiten de ontwikkeling van data science en big data te bevorderen. De opzet van de nieuwe studie wordt gesteund door de gemeente ’s-Hertogenbosch en de provincie Noord-Brabant. De Graduate School moet worden gevestigd in het uit 1899 daterende historische klooster Mariënburg van de Zusters Jezus, Maria en Jozef (JMJ) in ’s-Hertogenbosch.

Naar verwachting gaat de nieuwe opleiding ruimte bieden aan enkele honderden studenten. Dit is geen overbodige luxe. Stakeholdersonderzoek in de regio Brainport toont namelijk aan dat het bedrijfsleven jaarlijks naar schatting behoefte heeft aan 300 nieuwe ‘data scientists’. Ook is een groeiende behoefte aan multidisciplinair opgeleide professionals die zowel ondernemend als leidend zijn en data als innovatieve kracht kunnen inzetten.

Internationaal aanbod
“Onze universiteiten bundelen de krachten voor de ontwikkeling van Data Science, Big Data, van cruciaal belang voor onze samenleving. Er komt een internationaal aanbod voor phd’s, masterprogramma’s en ondernemers.”Rector Magnificus Hans van Duijn van de TU/e wijst erop dat professionals steeds breder opgeleid moeten zijn. “Deze studie heeft echter een zeer specifiek curriculum en dat vereist maatwerk, onder meer op juridisch, bestuurlijk en economisch vlak. Deze samenwerking met de Tilburg University is hierin een logische stap en een uitgelezen mogelijkheid om deze nieuwe Masteropleidingen te ontwikkelen”, legt Koen Becking, voorzitter van de TiU, uit.

Waar is de Data Scientist? door Edwin van Unen

Orriginal Version: http://business-analytics.biz/analytics/761#comments
Waar is de Data Scientist?
Waar is de Data Scientist?

Het is veelvuldig te lezen in diverse media: “Data is de nieuwe olie van de 21-e eeuw”, “De Data Scientist is het beroep van de toekomst”. Big Data is hot. Voor het ontginnen van die Big Data en er daadwerkelijk waarde voor de business uit te halen zijn mensen nodig met vaardigheden en tools. Veel bedrijven stoeien echter met de vraag hoe te beginnen: hoe verkrijg ik nieuwe inzichten door data uit social media en websites, maar ook door het combineren van sensordata en transactionele data? Wat is daar voor nodig en waar haal ik de mensen vandaan die dat kunnen?

Wat is een Data Scientist?
Als je mensen vraagt naar de definitie van een Data Scientist, dan krijg je geen eensluidend antwoord. Accenten worden verschillend gelegd, maar een rode draad is: iemand die in staat is data uit verschillende (on)gestructureerde bronnen, intern en extern, te verwerken, deze te analyseren met geavanceerde algoritmen, de resultaten te interpreteren en te vertalen naar een business context en hierover ook te communiceren met (hoger) management. Hij combineert kennis van wiskunde/statistiek met hands-on computerkennis en goede communicatievaardigheden. Dat klinkt als het schaap met de vijf poten. Een wizzkid met vlotte babbel en gouden handjes? Of een onderzoeker die vernieuwend denkt en altijd op zoek is naar nieuwe structuren en onverwachte verbanden. Waar halen we die vandaan?

Vernieuwende opleidingen
Aankomend studenten wordt geadviseerd een studie te kiezen waarin data-analyse centraal staat. Ook op hogescholen en universiteiten is hier steeds meer aandacht voor. In het afgelopen jaar heb ik diverse groepen studenten kennis laten maken met SAS om in te zetten voor datamining en visualisatie. Ik ervaar daarbij veel enthousiasme; studenten geven aan dit graag in te zetten bij hun stage of afstudeeropdracht. SAS biedt daarvoor diverse mogelijkheden. Maar er is ook een gat tussen de theoretische kennis van de student en de vaardigheden om dit toe te passen in praktijk. Soms ontbreekt het aan affiniteit met bedrijfsprocessen of is juist de wiskundige diepgang niet voldoende. Universiteiten spelen hier gelukkig wel steeds beter op in. Zo is vorig jaar het Data Science Center in Eindhoven gestart, een goed voorbeeld van hoe de toekomstige behoefte ingevuld kan worden.

Wie vult dit gat?
Hoewel Big Data en de Data Scientist gezien worden als iets van de laatste jaren en staan beide begrippen hoog in de Gartner Hype Cycle, is het deels ook oude wijn in nieuwe zakken. SAS analyseert al meer dan 38 jaar data en vaak ook in grote hoeveelheden. Functies als data- of business analist, dataminer of gewoon statisticus bestaan al vele jaren. Nieuw voor hen is wellicht wel de grote hoeveelheid beschikbare data, uit meerdere bronnen en vaak ook ongestructureerd. Dit vergt nieuwe vaardigheden, zoals het omgaan met Machine Learning-technieken of Hadoop, maar zij zijn vaak goed in staat zich deze aan te leren. Authentieke interesse in de nieuwste technieken en deze zelf kunnen toepassen is belangrijk.

Daarnaast kan data science ook goed als team worden opgepakt, waarbij specialisten op hun gebied effectief worden ingezet. Het schaap met de vijf poten is immers geen gemeengoed. Het inzetten van software waarmee goed kan worden samengewerkt is dan cruciaal. Het is van belang op elkaars resultaten voort te bouwen en bevindingen snel met elkaar te delen. Zoek uw nieuwe Data Scientist dus niet alleen buiten uw organisatie. In een analytisch gedreven organisatie, met de juiste processen, middelen en cultuur komt de echte Data Scientist vanzelf tot bloei.

Masterclasses Data Science
Wilt u weten wat Data Science voor uw organisatie kan betekenen? Of wilt u zich verder ontwikkelen als Data Scientist? SAS organiseert dit najaar een reeks masterclasses aan waarin u in een paar maanden volledig up to date bent van de ontwikkelingen op het gebied van Data Science. Voor meer informatie hierover: afdeling SAS Opleidingen, 035-699 6999/ opleidingen@sas.com.

8 trends die de rol van de analist veranderen – deel 2 door Jan Kuper

Orriginal Version here

8 trends die de rol van de analist veranderen – deel 2

8 trends die de rol van de analist veranderen – deel 2

De macro-ontwikkelingen die ik in mijn vorige blog omschreef hebben mijns inziens geleid tot 8 trends die zorgen voor een verandering van de rol van de analist:

Trend 1: Opkomst van Big Data vraagstukken
Niet alleen is de omvang van bestaande bronnen in de laatste paar jaren toegenomen, maar ook het aantal bronnen van waaruit we informatie halen is nog nooit zo veelzijdig geweest. Data is all around us. Gegeven het feit dat het verzamelen van data tegenwoordig bijna geen kostenpost met zich meebrengt leidt dit tot een andere wijze van inzet van data. Waarom bijvoorbeeld marktonderzoeken uitvoeren naar imago terwijl de klant zijn bevindingen blogt? Waarom gegevens over concurrenten handmatig verzamelen terwijl hij deze via het internet prijsgeeft? Waarom prijsanalyses via mystery shoppers uitvoeren terwijl we via scraping de prijzen kunnen achterhalen? In tegenstelling tot het verleden waarin we data ‘fijnknepen’ via allerlei statistische technieken om informatie te distilleren, is het nu zaak patronen te herkennen uit de grote hoeveelheid data. Deze ontwikkeling vraagt echter om nieuwe vaardigheden van de analist.

Trend 2: Ontwikkeling nieuwe data tools
Tot enige jaren geleden kenden we grofweg een aantal tools om data te bewerken en vervolgens te analyseren. De belangrijkste waren SAS, SPSS, Excel. Tegenwoordig is er een groot scala aan nieuwe tools op de markt, die via open source worden onderhouden. Denk hierbij aan tools als R, Python, Octave. Kenmerkend voor deze tools, is het feit dat ze snel allerlei nieuwe technieken kunnen implementeren. Deze tools zijn namelijk niet afhankelijk van releases. Nadeel is echter dat ze met name stand alone kunnen worden gebruikt en niet kunnen worden inzet als business solutions. Het zijn geavanceerde speeltjes van de hedendaagse data analist. Echter free sourcing heeft ertoe geleid dat met name start-ups snel intelligence afdelingen draaiende kunnen hebben zonder hoge investeringskosten.

Trend 3: Kennis van programmeren/algoritmen wordt steeds belangrijker
Doordat de omvang van de data als input voor analyses explosief toeneemt, neemt ook de verwerkingstijd exponentieel toe. Denk alleen aan het sorteren van een bestand.
Kennis van algoritmen is dan ook van essentieel belang, om analyses uit te kunnen voeren. Analisten eisen steeds meer van tools ten aanzien van de flexibiliteit om inputparameters te kunnen tweaken. Eigenlijk gaat de hedendaagse analist/scientist meer terug naar de uitgangspunten van de analyse en wil de analist niet een kant en klare knop. Standaard software heeft hier nogal eens moeite mee. Maar ook voor de analist betekent dit, dat beheersing van algoritmen tot de vaardigheden moet gaan behoren.

programmeren1

Trend 4: Gebruik web intelligence
Als er een bedrijfstak is, die geconfronteerd is met dataproblemen, zijn het de organisatie die zich hebben beziggehouden met zoekmachines en sociale netwerken. Dit zijn de frontiers van nieuwe technieken. Over het algemeen kun je zeggen dat ze met allerlei big data problemen zijn geconfronteerd. Hiervoor hebben deze organisaties oplossingen bedacht, denk aan map-reduce of het herintroduceren van parallelle computing. Analisten in andere bedrijfstakken kunnen leren van deze bedrijfstak. Opvallen is echter dat juist web-organisaties oplossingen delen. Zie ook trend 8.

Trend 5: Opkomst van machine learning/Natural Language Processing
Met de mogelijkheid van meer rekencapaciteit, hebben we de mogelijkheid gekregen om antwoorden op vraagstukken via iteraties te achterhalen. Met name binnen de Machine Learning is dit essentieel. Analisten hoeven zich niet meer in allerlei bochten te wringen op zoek naar antwoorden. In het verlengde van machine learning ligt Natural Language Processing (afgekort tot NPL). Dit wordt met name toegepast bij DNA onderzoek, maar ook in het geval van sentiment analyse. Steeds meer zullen deze technieken antwoorden gaan geven op bestaande vraagstukken, waar ‘conventionele technieken’ deze moeilijk kunnen beantwoorden.

Trend 6: Social netwerk analyses/graphs/gaming theorie
Met de opkomst van sociale netwerken heeft ook de netwerktheorie wederom een enorme boost gekregen. Sociale netwerktheorie kijkt naar de onderlinge relaties tussen de objecten.
Doordat netwerken verschillen in structuur zijn ook de effecten verschillend. Denk bijvoorbeeld aan de wijze hoe informatie door een netwerk vloeit, of de kans op infectie binnen een netwerk.
Een belangrijk voordeel van het gebruik netwerkanalyse is dat we kijken naar de onderlinge samenhang. Hierdoor geven deze technieken steeds vaak inzichten die we via individuele targeting niet kunnen beantwoorden. Met name telco’s maken gebruik van netwerk modellen om churn te verklaren. In het verlengde van netwerk nalyses, ligt gaming theorie. Gaming theorie voegt dynamiek toe aan een netwerk. Met name als het gaat om de dynamica van een concurrentie-analyse. SNA als gaming theorie zouden dan ook wel eens kunnen worden toegevoegd aan het pallet van een intelligence afdeling. Vanwege de hyperconcurrentie op bepaalde markten zou dit vakgebied wel eens tot de kerntaken van een MI-afdeling kunnen gaan behoren.

socialnetworkanalysis

Trend 7: Storytelling en het belang van data products
Dat managers niet meer geïnteresseerd zijn in dikke rapportages, met veel grafieken is al lang bekend. Als er namelijk een kenmerk is van een manager, is het feit dat deze weinig tijd heeft. Alle informatie moet kort en bondig zijn. Men wil maximale informatie via een minimum aan input (lees sheets). Kant en klare data producten, die 5 of misschien zelfs 6 variabelen in één overzicht tonen, zijn gewenst. Daarnaast wil men het liefst ook nog simulaties kunnen uitvoeren.
Storytelling is van essentieel belang. Hoe dit er in de toekomst moet uit gaan zien. Misschien heeft Hans Rosling in de video, Hans Rosling’s 200 Countries, 200 Years, 4 Minutes – The Joy of Stats, een voorzet gegeven. Analisten moet tijd gaan besteden aan het presenteren van data. De tijdsbesteding moet misschien wel als volgt worden: 40% datamanipulatie, 30% analyses en 30% presentatie. Misschien moeten wij analisten meer gezamenlijk gaan optrekken met communicatiespecialisten.

Trend 8: Peer-to-peer/leren van andere(n) disciplines
Als er een vakgebied is waarbij leren centraal staat, is het wel het vakgebied van de data analist. Hedendaagse oplossingen zijn morgen achterhaald. Het vakgebied is enorm in beweging.
Wat opvalt is de mate waarin informatie wordt gedeeld. Is het via LinkedIn-groepen, netwerkgroepen als stake overflow dan wel via MOOC als via omgevingen als de Github. In Nederland kent men ook de meetings van de Data scientist groep Nederland of Utrecht, the applied machine learning group, etc. Maar ook tussen verschillende vakgebieden vindt kennisuitwisseling plaats. Zo wordt technieken uit de biologie in de economie toegepast.
Een ander fenomeen zijn de Kaggle cups. Analisten strijden onderling op zoek naar het beste antwoord. De positie die je als groep inneemt wordt gezien als een ranking van kennis.

Conclusie
De voorgaande trends geven duidelijk aan dat de invulling van de rol van de hedendaagse analist sterk aan veranderingen onderhevig is. Dit betekent niet dat bestaande functies zullen verdwijnen. Wel zullen nieuwe vaardigheden moeten worden toegevoegd. Alleen zo kun je als analist de toegevoegde waarde kunnen blijven leveren waarmee de organisatie zich uiteindelijk kan onderscheiden van de concurrentie.

8 trends die de rol van de analist veranderen – deel 1 door Jan Kuper

Orriginal Verion

8 trends die de rol van de analist veranderen – deel 1

8 trends die de rol van de analist veranderen – deel 1

Steeds vaker verschijnt de term big data op de strategiekaart van een organisatie. Big Data is immers hot. Gebruik van Big Data leidt namelijk tot concurrentievoordelen. Kijk naar bedrijven als Facebook of Google. Deze gedachtegang leidt ertoe dat steeds meer bedrijven intelligence-afdelingen uitbreiden. Het gevolg is dat de vraag naar analisten/data scientists steeds groter wordt. Als data analist ben tegenwoordig zelfs hot, sexy en wanted. Maar is nu de dataexplosie nu de belangrijkste aanleiding geweest voor deze toename, of zijn er andere bewegingen gaande? Vanuit een technisch (IT) perspectief zou je de vraag naar informatie graag willen toewijzen aan de dataexplosie. Het biedt namelijk vele mogelijkheden voor ontwikkeling van nieuwe tools. Volgens mijn visie is er echter meer gaande. De rol van de analist is namelijk aan het veranderen.

Voordat ik de 8 trends beschrijf die naar mijn mening leiden tot een verandering van de rol van de analist, is het relevant stil te staan bij waarom data/analyse/informatie steeds belangrijker wordt. Deze zijn zowel gelegen in de veranderingen van het consumentengedrag als de wet van Moore.

Trends en veranderingen in consumentengedrag
Nog nooit is het consumentengedrag dermate aan veranderingen onderhevig als de laatste decennia. Wie had 5 of 10 jaar geleden bijvoorbeeld de razendsnelle ontwikkeling en groei van mobiel devices, het internet, of social networks kunnen voorspellen. Gevolg is dat iedereen tegenwoordig met elkaar is verbonden. Er wordt zelfs gesproken over ‘the internet of all things’. Daarbij komt het fenomeen dat mensen gebeurtenissen of informatie met elkaar willen delen. Is het een bezoek aan een concert of het gebruik van een product. Wij willen delen.

Een tweede trend is het feit dat consumenten eenvoudig en snel zonder veel ongemak goederen/diensten willen afnemen. Mean and clean. Het liefst digitaal. Zo wordt verwacht dat in 2020 meer dan 70% van de verkopen van retail producten via het web zal verlopen. Daarbij wil de huidige consument graag de juiste aanbieding op het juiste moment. Recommendation is zeer gewenst, gezien vanuit de wens van de consument.
online shopping

Een derde trend is de opkomst van duurzaamheid maar ook collaborative consumption. Consumenten willen meer met elkaar delen. Ook verspillen van natuur, resources wordt niet meer geaccepteerd. Sharing staat centraal, maar hoe richten we dit in. Ook hier speelt analyse een belangrijke rol. Een vierde trend is het feit dat bestaande apparaten volkomen nieuwe functionaliteiten krijgen. Zo staan we aan de vooravond van zelf rijdende auto’s, google, etc. Algoritmekennis is hier van essentieel belang.

Een vijfde trend is dat consumenten de producten het liefst zodanig willen dat deze voldoen aan al hun individuele verwachtingen. Individualisering ten top. Ik betaal voor hetgeen ik vraag. Kijk naar de individuele wensen die men wil in de reismarkt, verzekeringsmarkt, of retail producten. Bedrijven als Nike en Adidas maken het zelfs mogelijk je eigen schoenen te ontwikkelen. Anderzijds groeperen consumenten zich steeds meer middels de gedachte ‘mind us’. Kijk naar de afname van energie door grote verenigingen als VVE of United Consumers. Kortom de wereld is enorm dynamisch geworden, waar bedrijven goed ontwikkelde sensoren of voelsprieten moeten hebben om dit te kunnen monitoren. Deze voelsprieten zijn de intelligence- afdelingen.

De wet van Moore
Moore (een van de oprichters van Intel) voorspelde dat de capaciteit van transitoren/chips iedere 2 jaar verdubbelt. Kijk bijvoorbeeld naar de mogelijkheden die PC’s en mobiel devices bieden. Tegenwoordig heeft een smartphone meer rekencapaciteit dan een PC 5 of 10 jaar geleden. Gegeven deze wet zou dit betekenen dat we in 2045 zelfs het menselijke brein kunnen benaderen. De verbeterende rekencapaciteit betekent voor analisten dat complexere problemen met nieuwere technieken kunnen worden opgelost. Deze kunnen we gebruiken om aan de consumentenbehoefte te voldoen.

In deel 2 van deze blog zal ik de 8 trends beschrijven die zorgen voor een verandering van de rol van de analist.