Spark - проект, устроенный сложнее внутри, чем Hadoop, а в использовании намного проще и эффективнее. Этим он и интересен для меня.

Когда на работе возникла задача создать в Spark SQL табличку, залить туда данные и с помощью какого-нибудь BI Tool подключиться и построить репорты, я даже примерно не мог оценить, сколько времени это займет и какое количество литературы мне предстоит поднять и страничек на stackoverflow посетить.

Но в действительности все оказалось проще - запустил Spark SQL, выполнил две команды, запустил odbc server, подключился через odbc driver из BI Tool. Все!

Изучение Spark и его экосистемы пугало до прочтении этих вводных глав - всю сложность спрятана внутри, а тебе даются простые и понятные рычаги управления этой машиной. А эта книга - понятное и дружелюбное руководство к ней.

Вообщем я воодушевлен дальнейшим погружением в Spark. К тому же я для себя как-то отметил, что изучение и использование Spark - это своеобрзная черта для меня между Junior Big Data и Middle Big Data (к тому же, на данный момент эта технология является стандартом на рынке), которую хотелось бы перейти к концу этого года.

Signup

Sign in.Allowed.

[email protected]

Maxim Malikov

Sergey Zakharov

Sign in.
Allowed.