Вы здесь

Amazon Mechanical Turk Integration

Интегарация с Amazon Mechanical Turk.

Модуль Amazon Mechanical Turk Integration интегрирует Друпал с сервисом Amazon Mechanical Turk (MTurk). Amazon Mechanical Turk (MTurk) — это площадка, которая помогает передавать выполнение заданий людям он-лайн. Это могут быть любые задания — проверка корректности данных, исследования, участие в опросе, проверка содержания и так далее. MTurk позволяет использовать коллектив, навыки и знания множества отдельных людей, для оптимизации бизнес-процессов, расширения сбора и обработки данных, ускорения разработки машинного обучения и так далее.

Несмотря на то, что технологии продолжают совершенствоваться, по-прежнему есть много вещей, которые люди могут делать более эффективно, чем компьютер — проверка содержания, очистка данных или исследования. Традиционно, подобные задачи выполнялись путём найма большого количества временных работников, что отнимает много времени, дорого обходится, плохо масштабируется и в итоге часто всё оказывается незавершённым. Такая площадка это хороший способ разбить ручной, трудоёмкий проект на маленькие, лучше управляемые задачи (такое известно как «микрозадачи») и раздать их выполнение в Интернете.

Возможности

  • Обращение к MTurk API, запись и показ обращений в виде
  • Создание заданий и определение их показа людям на MTurk
  • Тип содержания «Задание MTurk» и сохранение информации о доступе
  • Показ/скрытие блоков на основе того, является пользователем рабочим из MTurk
  • Интерфейс для отправки сообщений выбранным работникам
  • Интерфейс для предоставления бонусов выбранным работникам
  • Интеграция с Rules (события mturk worker login и mturk worker submit)
  • Интеграция с Webform (отправка и направление рабочих)
  • Интеграция с ThemeKey (настройка темы оформления для рабочих)
  • Поддержка режима просмотра (в зависимости является человек рабочим с MTurk)
  • Скачивание результатов с MTurk, расчёт качества, очистка результатов и сохранение данных в соответствующих полях на сайте
  • Показ таблицы лидеров, которые выполнили свои задания и качество работы

Мы (разработчики этого проекта) используем этот модуль для создания сайта redbluegray.com, на котором классифицируем политические стать как консервативные (красные), либеральные (синие) и не имеющие определённой направленности (серые). Каждый день мы выбираем несколько случайных статей для ручной классификации на MTurk, после чего используем эти статьи для обучения классификатора. Это позволяет поддерживать актуальность работы нашего классификатора и использовать новые ключевые слова для лучшей классификации.

Типичные сценарии использования этого модуля могут быть такими:

  • Пример 1: На крупном коммерческом сайте есть тысячи товаров. Владелец чайта хочет встроить на страницы с товарами подходящие видео с YouTube, которые помогут покупателям. Он может использовать этот модуль для создания задания на MTurk и сотни людей могут заняться поиском ссылок на YouTube, чтобы потом отправить их на сайт
  • Пример 2: Библиотека имеет каталог книг, но мета-данные хранятся в неструктурированном виде в содержании документов сайта, они хотят извлечь эти данные из содержания и структурировать их в формате RDF, при этом они не могут найти подходящую для этого программу. Библиотека может использовать этот модуль для создания задания на MTurk и сотни людей разметят содержание
  • Пример 3: Сообщество хочет создать начальное содержание для своего сайта, чтобы привлечь на него больше людей. Они могут использовать этот модуль для заказа статей, а в дальнейшем для фильтрации и удаления содержания низкого качества

Отметьте: в пакет входит шаблон mturk_task_summary.tpl.php.

Зависит от: 
Группа проекта: