Tartu ülikooli teadur on üks maailma parimaid suuremahulise infohulga analüüsijaid
Tartu ülikooli bioinformaatika teadur Konstantin Tretjakov võitis ülemaailmsel suuremahulise infohulga ehk big data analüüsi võistlusel „TEXATA“ enam kui 2000 konkurendi hulgas III koha.
Tänavu esmakordselt toimunud „TEXATA“ on innovatiivne ja väljakutsuv rahvusvaheline võistlus üliõpilastele ja valdkonna professionaalidele, mis võimaldab osalejatel arendada ja testida oma big data analüüsioskusi. Finaali pääsemiseks pidid võistlejad läbima kaks online-kvalifikatsiooni vooru. Texaseses Austinis toimuvasse finaali pääsesid 12 parimat.
12 parima hulka jõudis ka Tartu ülikoolis doktoritööd kirjutav, bioinformaatika teadur Tretjakov. Esimeses voorus, kus osales enam kui 2000 inimest üle maailma, pidi noormees nelja tunni jooksul vastama online-keskkonnas 50-le valikuvastustega küsimusele ning lahendama kümme praktilist ülesannet kasutades Hadoop-nimelist paralleelarvutustehnoloogiat.
Teises online-voorus, kuhu pääses 200 võistlejat, pidid osalejad taaskord nelja tunni jooksul vastama kümnele mõistatuse-stiilis küsimusele ning lahendama peaülesande. Ülesandeks oli antud ~60GB Thomson-Reutersi tekstiandmeid ja üldine suund lahenduseks – leida tuli, millal üks firma ostab teise.
„Oma lahenduses tõdesin, et signaali, mida otsitakse, tegelikult ei leidu. Aga arvatavasti tänu mõistlikule ja praktilisele lähenemisele pääsesin ühena 12st finaalüritusele Austinisse,“ rääkis teadur.
Finaalüritusel kohapeal oli võistlejatele antud ette Cisco Support foorumi diskussioonid. „Enda lahenduses realiseerisin prototüübina seotud diskussioonide otsingu ning diskussioonide sildistamine (tag-imise),“ sõnas Tretjakov.
Lõpuks oli igal finalistil oma lahenduse esitamiseks aega kolm minutit. Pärast seda pidid võistlejad veel 10 minutit privaatselt ühele kohtunikule tehnilisi detaile näitama. „Iga kohtunik andis enda arvamuse järgi punktid mitmes kategoorias, hinnates näiteks praktilisust, väärtust, teostuse kvaliteeti ja tehnoloogiate kasutust jne, ning selle järgi otsustati võitja,“ sõnas kolmanda koha ja „Top Student“ tiitli võitja.
Arvutiteaduse instituudi juhataja professor Jaak Vilo lisas, et suurte andmete analüüs nõuab korraga head mitmekülgset ettevalmistust algoritmide, andmekaeve, masinõppe, visualiseerimise ja rakendusvaldkondade poolt.
„Meetodid on tihti ühest rakendusvaldkonnast teise üle kantavad ning see on võimaldanud ka Tretjakovil demonstreerida oma mitmekülgseid oskuseid. Tartu ülikool on just mahukate andmete analüüsi alal teinud viimasel ajal jõupingutusi, seda mitmetes eri uurimisrühmades, õpetamisel kui ka koostöös ettevõtetega – näiteks Tarkvara TAK keskendub üha enam just andmeanalüüsi lahenduste loomisele. Tretjakovil on tänu sellele olnud ka piisavalt mitmekülgne ettevalmistus,“ rääkis Vilo.
Rohkem infot võistluse kohta leiab http://www.texata.com/.