Otvorene prijave za radionicu "Big Data Analytics and Stream Processing on Apache Spark"

05. 05. 2023.

Radionica "Big Data Analytics and Stream Processing on Apache Spark" održati će se 22. svibnja 2023. s početkom u 10:00 sati u organizaciji Hrvatskog centra kompetencije za HPC uz tehničku podršku Fakulteta elektrotehnike, računarstva i informacijskih tehnologija Sveučilišta Josipa Jurja Strossmayera u Osijeku, a u suradnji sa Znanstvenim centrom izvrsnosti za znanost o podatcima i kooperativne sustave (ZCI ACROSS-DataScience). Radionica se može pohoditi uživo (u prostoriji T3-27, FERIT Osijek, Kneza Trpimira 2b, Osijek) i on-line.  Radionica se organizira u sklopu projekta „Nacionalni centri kompetencija u okviru EuroHPC faze 2 – EuroCC 2“, financiranog iz programa Digitalna Europa. Voditelj radionice je Krešimir Pripužić, redoviti profesor Fakulteta elektrotehnike i računarstva Sveučilišta u Zagrebu (FER).

Svoj interes za sudjelovanje na radionici možete iskazati putem prijavnog obrasca najkasnije do 18. svibnja 2023. (EoD).

Poziv na radionicu s poveznicom za sudjelovanje biti će dostavljen na vrijeme prije radionice.

Za sva dodatna pitanja možete se obratiti prof. dr. sc. Goranu Martinoviću: goran.martinovic@ferit.hr.

O radionici: Tvrtke prikupljaju velike količine podataka o svojim kupcima, dobavljačima i poslovanju, dok pojedinci i milijarde povezanih uređaja na Internetu stvari (IoT) proizvode ogromne količine podataka. Svjedoci smo eksponencijalnog rasta količine novonastalih podataka koji traje više od desetljeća. Velike skupove podataka (Big data) definiramo kao podatke koji su vrlo raznoliki, velikog obujma, te nastaju i pojavljuju se velikom brzinom. Nedavno su razvijene mnoge različite platforme otvorenog koda za rješavanje spomenutih izazova korištenjem klastera računala, kao što su Apache Hadoop YARN (MapReduce2), Apache Spark, Apache Flink, Apache Storm, itd. Vjerojatno najpopularniji među njima su Apache Hadoop YARN i Apache Spark. Ova radionica ukratko predstavlja platformu Apache Spark i demonstrira njezine mogućnosti analitike i obrade toka podataka. Nakon toga, tijekom praktične sesije polaznici će naučiti koristiti Apache Spark za obradu nestrukturiranih i strukturiranih velikih skupova podataka.

Biografija voditelja: Krešimir Pripužić redoviti je profesor na Fakultetu elektrotehnike i računarstva Sveučilišta u Zagrebu, Hrvatska (FER), gdje vodi Laboratorij za tokove podataka. Na Zavodu za telekomunikacije na FER-u je od 2003. godine. Titulu inženjera elektrotehnike, smjer telekomunikacije i informatika stekao je na FER-u 2003. godine. Godine 2005. započeo je doktorski studij na FER-u,  koji uspješno završava 2010. godine. U sklopu svog doktorskog studija, akademsku godinu 2006.-2007. proveo je u Laboratoriju za raspodijeljene informacijske sustave na EPFL (Ecole Polytechnique Fédérale de Lausanne) u Švicarskoj, kao stipendist Švicarske vlade za sveučilišne, likovne i glazbene škole za strane studente. Koautor je više od 40 radova u znanstvenim časopisima i izlaganja na znanstvenim konferencijama. Njegovi glavni istraživački interesi su raspodijeljeni sustavi velikih razmjera, algoritmi i strukture podataka, analitika velikih skupova podataka, obrada toka podataka i internet stvari.