Spark-jargonia aloittelijoille
Tässä blogissa selvitetään joitakin aloitusvaikeuksia, kun aloitteleva koodaa Spark-hajautettua tietojenkäsittelyä. Sen lisäksi, että oppii API:t, täytyy varustautua klusterin yksityiskohdilla saadakseen parhaan mahdollisen hyödyn Sparkin tehosta. Aloituskohta olisi Cluster Mode Overview . Ja joitain yleisiä kysymyksiä, jotka saattavat tulla esiin, ovat: Et vieläkään ymmärrä Spark Standalone -klusterin eri prosesseja ja rinnakkaisuutta. Johdatit bin\start-slave.sh:n ja huomasit, että […]