1

Этап 1

WEEK 1

2

Этап 2

WEEK 2

3

Этап 3

WEEK 3

4

Этап 4

Cloudera. Introduction

1

Этап 1

WEEK 1

2

Этап 2

WEEK 2

3

Этап 3

WEEK 3

4

Этап 4

Cloudera. Introduction

02 октября 2016 31 октября 2016
Цель завершена 5 ноября 2016

Автор цели

Образование

Big Data. Introduction to Big Data

Interested in increasing your knowledge of the Big Data landscape? This course is for those new to data science and interested in understanding why the Big Data Era has come to be. It is for those who want to become conversant with the terminology and the core concepts behind big data problems, applications, and systems. It is for those who want to start thinking about how Big Data might be useful in their business or career. It provides an introduction to one of the most common frameworks, Hadoop, that has made big data analysis easier and more accessible -- increasing the potential for data to transform our world!

At the end of this course, you will be able to:

* Describe the Big Data landscape including examples of real world big data problems including the three key sources of Big Data: people, organizations, and sensors.

* Explain the V’s of Big Data (volume, velocity, variety, veracity, valence, and value) and why each impacts data collection, monitoring, storage, analysis and reporting.

* Get value out of Big Data by using a 5-step process to structure your analysis.

* Identify what are and what are not big data problems and be able to recast big data problems as data science questions.

* Provide an explanation of the architectural components and programming models used for scalable big data analysis.

* Summarize the features and value of core Hadoop stack components including the YARN resource and job management system, the HDFS file system and the MapReduce programming model.

* Install and run a program using Hadoop!

This course is for those new to data science. No prior programming experience is needed, although the ability to install applications and utilize a virtual machine is necessary to complete the hands-on assignments.

 Критерий завершения

все сабтаски закрыты

 Личные ресурсы

базовые навыки математики и программирования

 Экологичность цели

за большими данными будущее

  1. WEEK 1

    Welcome

    Welcome to the Big Data Specialization! We're excited for you to get to know us and we're looking forward to learning about you!

    2 видео, 3 материалов для самостоятельного изучения

    1. Видео: What's in Big Data Applications and Systems?
    2. Материал для самостоятельного изучения: By the end of this course you will be able to...
    3. Материал для самостоятельного изучения: Optional: Watch this fun video about the San Diego Supercomputer Center!
    4. Видео: Tell us about yourself and learn about your classmates
    5. Вопрос для обсуждения: Let's Discuss: Why are you taking this class?
    6. Материал для самостоятельного изучения: FAQ

    Big Data: Why and Where

    Data -- it's been around (even digitally) for a while. What makes data "big" and where does this big data come from?

    13 видео, 13 материалов для самостоятельного изучения

    1. Видео: What launched the Big Data era?
    2. Видео: Applications: What makes big data valuable
    3. Вопрос для обсуждения: Let's Discuss: What application area interests you?
    4. Видео: Example: Saving lives with Big Data
    5. Видео: Example: Using Big Data to Help Patients
    6. Видео: A Sentiment Analysis Success Story: Meltwater helping Danone
    7. Материал для самостоятельного изучения: Did you know?: 25 facts about big data
    8. Материал для самостоятельного изучения: Slides: What Launched the Big Data Era?
    9. Материал для самостоятельного изучения: Slides: Applications: What Makes Big Data Valuable?
    10. Материал для самостоятельного изучения: Slides: Saving Lives With Big Data
    11. Материал для самостоятельного изучения: Slides: Using Big Data to Help Patients
    12. Видео: Getting Started: Where Does Big Data Come From?
    13. Видео: Machine-Generated Data: It's Everywhere and There's a Lot!
    14. Видео: Machine-Generated Data: Advantages
    15. Видео: Big Data Generated By People: The Unstructured Challenge
    16. Видео: Big Data Generated By People: How Is It Being Used?
    17. Видео: Organization-Generated Data: Structured but often siloed
    18. Видео: Organization-Generated Data: Benefits Come From Combining With Other Data Types
    19. Видео: The Key: Integrating Diverse Data
    20. Вопрос для обсуждения: Let's discuss: Who are you providing data to?
    21. Материал для самостоятельного изучения: Extra Resources
    22. Материал для самостоятельного изучения: Slides: Machine-Generated Data: It's Everywhere and There's a Lot!
    23. Материал для самостоятельного изучения: Slides: Machine-Generated Data: Advantages
    24. Материал для самостоятельного изучения: Slides: Big Data Generated By People: The Unstructured Challenge
    25. Материал для самостоятельного изучения: Slides: Big Data Generated By People: How is it Being Used?
    26. Материал для самостоятельного изучения: Slides: Organization-Generated Big Data: Structured But Often Siloed
    27. Материал для самостоятельного изучения: Slides: Organizaton-Generated Big Data: Benefits
    28. Материал для самостоятельного изучения: Slides: The Key - Integrating Diverse Data

    Оцениваемый: Why Big Data and Where Did it Come From?

    1. Welcome

    2. Big Data: Why and Where

  2. WEEK 2

    Characteristics of Big Data and Dimensions of Scalability

    You may have heard of the "Big Vs". We'll give examples and descriptions of the commonly discussed 5. But, we want to propose a 6th V and we'll ask you to practice writing Big Data questions targeting this V -- value.

    7 видео, 9 материалов для самостоятельного изучения

    1. Видео: Getting Started: Characteristics Of Big Data
    2. Видео: Characteristics of Big Data - Volume
    3. Материал для самостоятельного изучения: What does astronomical scale mean?
    4. Видео: Characteristics of Big Data - Variety
    5. Видео: Characteristics of Big Data - Velocity
    6. Видео: Characteristics of Big Data - Veracity
    7. Видео: Characteristics of Big Data - Valence
    8. Видео: The Sixth V: Value
    9. Материал для самостоятельного изучения: A Small Definition of Big Data
    10. Вопрос для обсуждения: Practice: Writing Big Data questions
    11. Вопрос для обсуждения: Let's Discuss: Improving the Flamingo Game
    12. Материал для самостоятельного изучения: Slides: Getting Started - Characteristics of Big Data
    13. Материал для самостоятельного изучения: Slides: Characteristics of Big Data - Volume
    14. Материал для самостоятельного изучения: Slides: Characteristics of Big Data - Variety
    15. Материал для самостоятельного изучения: Slides: Characteristics of Big Data - Velocity
    16. Материал для самостоятельного изучения: Slides: Characteristics of Big Data - Veracity
    17. Материал для самостоятельного изучения: Slides: Characteristics of Big Data - Value
    18. Материал для самостоятельного изучения: Slides: Characteristics of Big Data - Valence

    Оцениваемый: V for the V's of Big Data

    1. Characteristics of Big Data and Dimensions of Scalability

    2. Data Science: Getting Value out of Big Data

  3. WEEK 3

    Foundations for Big Data Systems and Programming

    Big Data requires new programming frameworks and systems. For this course, we don't programming knowledge or experience -- but we do want to give you a grounding in some of the key concepts.

    4 видео, 4 материалов для самостоятельного изучения

    1. Видео: Getting Started: Why worry about foundations?
    2. Видео: What is a Distributed File System?
    3. Видео: Scalable Computing over the Internet
    4. Видео: Programming Models for Big Data
    5. Материал для самостоятельного изучения: Slides: Getting Started-Why Worry About Foundations?
    6. Материал для самостоятельного изучения: Slides: What is a Distributed File System?
    7. Материал для самостоятельного изучения: Slides: Scalable Computing Over the Internet
    8. Материал для самостоятельного изучения: Slides: Programming Models for Big Data

    Оцениваемый: Foundations for Big Data

    Systems: Getting Started with Hadoop

    Let's look at some details of Hadoop and MapReduce. Then we'll go "hands on" and actually perform a simple MapReduce task in the Cloudera VM. Pay attention - as we'll guide you in "learning by doing" in diagramming a MapReduce task as a Peer Review.

    11 видео, 7 материалов для самостоятельного изучения

    1. Видео: Hadoop: Why, Where and Who?
    2. Видео: The Hadoop Ecosystem: Welcome to the zoo!
    3. Видео: The Hadoop Distributed File System: A Storage System for Big Data
    4. Видео: YARN: A Resource Manager for Hadoop
    5. Видео: MapReduce: Simple Programming for Big Results
    6. Материал для самостоятельного изучения: MapReduce in the Pasta Sauce Example
    7. Видео: When to Reconsider Hadoop?
    8. Видео: Cloud Computing: An Important Big Data Enabler
    9. Видео: Cloud Service Models: An Exploration of Choices
    10. Видео: Value From Hadoop and Pre-built Hadoop Images
    11. Материал для самостоятельного изучения: Slides for Getting Started With Hadoop
    12. Материал для самостоятельного изучения: Downloading and Installing the Cloudera VM Instructions (Mac)
    13. Материал для самостоятельного изучения: Downloading and Installing the Cloudera VM Instructions (Windows)
    14. Материал для самостоятельного изучения: Copy your data into the Hadoop Distributed File System (HDFS) Instructions
    15. Видео: Copy your data into the Hadoop Distributed File System (HDFS)
    16. Материал для самостоятельного изучения: Run the WordCount program Instructions
    17. Видео: Run the WordCount program
    18. Вопрос для обсуждения: Let's Discuss: Map Reduce in your life
    19. Материал для самостоятельного изучения: How do I figure out how to run Hadoop MapReduce programs?

    Оцениваемый: Intro to Hadoop

    Оцениваемый: Understand by Doing: MapReduce

    Оцениваемый: Running Hadoop MapReduce Programs Quiz

    1. Foundations for Big Data Systems and Programming

    2. Systems: Getting Started with Hadoop

  4. Cloudera. Introduction

    1. Get Started

    2. Analyze Your Data

    3. Manage Your Cluster

  • 1370
  • 02 октября 2016, 19:46
Регистрация

Регистрация

Уже зарегистрированы?
Быстрая регистрация через соцсети
Вход на сайт

Входите.
Открыто.

Еще не зарегистрированы?
 
Войти через соцсети
Забыли пароль?