Эффективная очистка данных с Google Refine

Эффективная очистка данных с Google Refine

Google Refine – это весьма популярная программа, предназначенная для очистки, анализа и обработки информации, поступающей из абсолютно разных источников.

Этот продукт уже успел завоевать довольно много хороших отзывов среди пользователей, и вот сейчас корпорация Google выпускает обновленную версию программы.

Инструменты Google Refine весьма полезны в случае необходимости выявления важной информации из определенных наборов данных, в которых возможно

наличие неточностей.

Процедура наведения порядка в наборах данных имеет название «нормализация» и революционным открытием не является. Однако, как правило, под нормализацией данных подразумевается написание специального кода для каждого отдельно взятого набора данных. Обновленная версия Google Refine, написанная на языке Java, позволяет без применения кода использовать широкий спектр наборов данных.

Пользователям программы предоставляется возможность сочетания уже имеющихся записей с внешними источниками информации, а также использование целого набора выражений и новейших команд трансформации.

Google Refine 2.0 уже выпущена и доступна к свободной загрузке с официального сайта производителя.