Пост 7. Map-only задания.
В данном посте хотел бы рассказать о таком явлении как map only задании. Начав изучать hadoop и MapReduce я все больше больше задумывался о конкретной реализации различных операций в рамках MapReduce парадигмы, пытался представить что же будет делать шаг Map, а что Reduce. Задача перевода текста в верхний региср. Хорошо, на стадии Map, все вроде бы понятно, берем кажрое слово по аналогии с wordcount и возвращаем его в верхнем регистре. А что делает reduce? Ничего. Есть такие задания, где выход Map задания и есть конечный ответ. Reduce просто напросто нет.
Примером таких Map-only MarReduce job могут быть:
- Обработка изображений
- ETL (sqoop, например)
- Конвертация из одного формата в другой
Мир hadoop удивителен:)
Если у вас есть какие либо вопросы - не стесняйтесь их задавать!
No comments:
Post a Comment