Spark - проект, устроенный сложнее внутри, чем Hadoop, а в использовании намного проще и эффективнее. Этим он и интересен для меня.
Когда на работе возникла задача создать в Spark SQL табличку, залить туда данные и с помощью какого-нибудь BI Tool подключиться и построить репорты, я даже примерно не мог оценить, сколько времени это займет и какое количество литературы мне предстоит поднять и страничек на stackoverflow посетить.
Но в действительности все оказалось проще - запустил Spark SQL, выполнил две команды, запустил odbc server, подключился через odbc driver из BI Tool. Все!
Изучение Spark и его экосистемы пугало до прочтении этих вводных глав - всю сложность спрятана внутри, а тебе даются простые и понятные рычаги управления этой машиной. А эта книга - понятное и дружелюбное руководство к ней.
Вообщем я воодушевлен дальнейшим погружением в Spark. К тому же я для себя как-то отметил, что изучение и использование Spark - это своеобрзная черта для меня между Junior Big Data и Middle Big Data (к тому же, на данный момент эта технология является стандартом на рынке), которую хотелось бы перейти к концу этого года.
Podemos ayudarle a lograrlo!
310 000
ideas afines
instrumentos
para un logro emocionante