R language | Analytics Tips - блог о веб-аналитике Превращаем данные в деньги Mon, 20 May 2019 23:44:30 +0000 ru-RU hourly 1 https://wordpress.org/?v=6.0.2 https://analytics-tips.com/wp-content/uploads/2018/05/cropped-7835532-696x392-696x392-1-32x32.jpg R language | Analytics Tips - блог о веб-аналитике 32 32 Импорт данных о расходах в Google Analytics с помощью R https://analytics-tips.com/import-dannyh-o-raskhodah-v-google-analytics-s-pomoshchyu-r/ https://analytics-tips.com/import-dannyh-o-raskhodah-v-google-analytics-s-pomoshchyu-r/#respond Wed, 08 Aug 2018 20:08:39 +0000 https://analytics-tips.com/?p=194 При работе с Google Analytics очень часто необходимо импортировать какие-то данные в эту систему. Обычно этими данными являются данные о расходах в Facebook и других рекламных системах (хотя бывают и другие виды импорта). Такая необходимость возникает, как при настройке сквозной аналитики, так и в более общих случаях работы с Google Analytics. Раньше мне на помощь …

Сообщение Импорт данных о расходах в Google Analytics с помощью R появились сначала на Analytics Tips - блог о веб-аналитике.

]]>
При работе с Google Analytics очень часто необходимо импортировать какие-то данные в эту систему. Обычно этими данными являются данные о расходах в Facebook и других рекламных системах (хотя бывают и другие виды импорта). Такая необходимость возникает, как при настройке сквозной аналитики, так и в более общих случаях работы с Google Analytics.

Раньше мне на помощь приходил классный инструмент — OWOX BI PIPELINE. Инструмент очень удобный и к тому же, условно бесплатный, но в какой-то момент, когда появилась необходимость загружать исторические данные, за большой промежуток времени я встал перед выбором: использовать платную версию или же найти другое решение. Как вы уже догадались, раз читаете эту статью — я выбрал второе 🙂 Разбирать все будем на примере с Facebook, но работа с другими рекламными кабинетами очень схожа.

Итак, чтобы импортировать данные о расходах в Google Analytics нам понадобиться:

    1. Собрать необходимые данные с рекламного кабинета Facebook
    2. Создать в Google Analytics набор данных для импорта
    3. Преобразовать данные с рекламного кабинета в необходимый формат
    4. Настроить ежедневную автоматическую загрузку необходимых данных

ВАЖНО! Чтобы импорт работал корректно, рекламные кампании должны быть промечены UTM-метками.

Собираем необходимые данные с рекламного кабинета Facebook

Для сбора данных мы будем использовать пакет Алексея Селезнева rfacebookstat. Перед тем как перейти к загрузке данных нужно подготовиться и создать приложение в Facebook.

Создаем приложение в Facebook

Переходим в раздел Управление приложениями в меню Facebook и нажимаем на кнопку “Добавить новое приложение”. В открывшимся окне указываем Название приложения, электронную почту для связи и нажимаем кнопку “Создайте ID приложения”.

Стартовое окно создания приложения в Facebook

На следующем этапе добавляете продукт “Вход через Facebook” и нажимаете “Настроить”:

Добавление продукта - Вход через Facebook

Платформа в нашем случае — “Веб”:

Выбор платформы при создании приложения в Facebook - Веб

В настройках продукта в поле “Действительные URI перенаправления для OAuth” указываем “https://selesnow.github.io/rfacebookstat/getToken/get_token.html”:

Настройки продукта Вход через фейсбук для выгрузки данных

Переходим в основные настройки приложения и в поле “Домены приложений” указываем “github.com”. В полях “URL-адрес политики конфиденциальности” и “URL-адрес Пользовательского соглашения” указываем “https://github.com/selesnow/rfacebookstat”. Не забываем сохранить изменения.

Основные настройки приложения для работы с API с помощью R

На этом создание приложения закончено. Переходим ко второму пункту.

Получаем токен разработчика Facebook

В Facebook существует несколько видов токенов разработчиков:

  • краткосрочный — действует примерно 2 часа;
  • долгосрочный — действует 2 месяца.

Чтобы получить краткосрочный токен можно использовать функцию fbGetToken в пакете rfacebookstat.

Если вы используете этот пакет впервые, сначала введите команду ниже, для загрузки и запуска пакета:

#Устанавливаем пакеты devtools и rfacebookstat, если они не установлены

if(!"devtools" %in% installed.packages()[,1]){install.packages("devtools")}

devtools::install_github('selesnow/rfacebookstat')



#Подключаем библиотеку rfacebookstat

library(rfacebookstat)

Теперь можно и краткосрочный токен получить::

fbToken <- fbGetToken(app_id = XXXXXXXXXX)

где вместо XXXXXXXXXX нужно ввести идентификатор приложения, которое вы создали на предыдущем шаге:

Отображение Идентификатора приложения в Facebook

В открывшемся окне браузера кликаете на кнопку “Продолжить как …” и на следующем экране “ОК”. На последней странице вы увидите токен — примерно три строки символов:

Пример получения кратковременного токена для Facebook

Этот токен уже можно использовать для получения данных, но работать с ним постоянно не удобно, так как действует он всего 2 часа.
Чтобы получить долгосрочный токен воспользуемся командой fbGetLongTimeToken с пакета rfacebookstat:

longToken <- fbGetLongTimeToken(client_id = XXXXXXXXXX,
                                client_secret = "YYYYYYYYYYY",
                                fb_exchange_token = fbToken)

 

где вместо XXXXXXXXXX нужно ввести идентификатор приложения, вместо YYYYYYYYYYY секрет этого приложения, а вместо fbToken должно быть значение краткосрочного токена.

Отображение Идентификатора и Секрета приложения в Facebook

Теперь можно начать сбор данных.

Получаем необходимые данные с рекламного кабинета Facebook

Перед тем как начать загрузку необходимых данных с рекламного аккаунта Facebook, необходимо предоставить приложению доступ к этому аккаунту. Для этого необходимо ввести идентификатор аккаунта в соответствующее поле:

Добавление рекламных аккаунтов для выгрузки данных с Facebook

Идентификатор можно найти на главной странице Бизнес Менеджера:

Отображение идентификатора рекламного аккаунта в бизнес менеджере Facebook

После предоставления разрешений, для получения необходимых данных необходимо запустить следующую команду в R:

start_date <- Sys.Date()-1

end_date <- Sys.Date()-1



fb <- fbGetMarketingStat(accounts_id = "act_DDDDDDDD",
                         api_version = "v3.1",
                         level = "ad",
                         fields = "campaign_name,adset_name,ad_name,impressions,clicks,spend",
                         date_start = start_date,
                         date_stop = end_date,
                         interval = "day",
                         access_token = longToken)

где вместо DDDDDDDD необходимо ввести идентификатор рекламного аккаунта.

По выполнению, вы получите необходимые данные о затратах, показах и кликах, в разрезе рекламных кампаний, групп объявлений и объявлений за вчера. Если необходимо получить данные за другой период, отредактируйте соответственно значения start_date и end_date.

Создаем в Google Analytics набор данных для импорта

Теперь нам нужно создать набор данных для импорта в интерфейсе Google Analytics. Для этого переходим на вкладку Администратор и на уровне ресурса выбираем пункт “Импорт данных”:

Импорт данных в Google Analytics

Далее необходимо создать набор для импорта типа “Данные о расходах”, указать название и выбрать представления, в которые будем импортировать данные, а также указать дополнительные настройки:

Создание набора данных типа Данные о расходах

Перейдя в только что созданный набор импорта и нажав на кнопку “Получить схему” вы увидеть как должны выглядеть ваши данные для импорта.

Получение схемы для импорта данных о затратах в Google Analytics

Если вы внимательны, то заметите, что наши данные с Facebook сейчас выглядят несколько иначе. Давайте же исправим это 😉

Как преобразовать данные с рекламного кабинета в необходимый для Google Analytics формат

Чтобы наши данные, полученные с API Facebook соответствовали схеме импорта запустите следующий код:

#Группируем данные полученные с API

grp <- group_by(fb, date_start, campaign_name, adset_name, ad_name)

fb <- summarise(grp, spend=sum(as.numeric(spend)), impressions=sum(as.numeric(impressions)), clicks=sum(as.numeric(clicks)))



#Создаем отдельные вектора на каждый из необходимых столбцов и преобразуем значения в необходимый нам формат

cost <- as.numeric(fb$spend)

clicks <- as.numeric(fb$clicks)

impressions <- as.numeric(fb$impressions)

date <- format(as.Date(fb$date_start), "%Y%m%d")

campaign <- fb$campaign_name

adGroup <- fb$adset_name

criteria <- fb$ad_name



#Создаем столбцы с полями source и medium, которых нет в изначальных данных

l <- length(date)

new <- vector(mode = "character", length = l)

u_medium <- replace(new, new == "", "ppc")

u_source <- replace(new, new == "", "facebook")



#Формируем таблицу в необходимом формате

fb_data <- data.frame(date, u_medium, u_source, cost, clicks, impressions, campaign, adGroup, criteria)



#Присваиваем столбцам названия согласно схеме данных импорта Google Analytics

col_names <- c("ga:date", "ga:medium", "ga:source", "ga:adCost", "ga:adClicks", "ga:impressions", "ga:campaign", "ga:adContent", "ga:keyword")

fb_data <- `colnames<-`(fb_data, col_names)

В итоге вы получите таблицу следующего вида:

Итоговая таблица с набором для импорта затрат с Facebook

О да, это то ,что нам нужно! Давайте загрузим эти данные в Google Analytics с помощью R.

Настраиваем ежедневную автоматическую загрузку необходимых данных с помощью R

Для того чтобы работать с данными Google Analytics при помощью API нам понадобиться получить токен разработчика или же создать сервисный аккаунт. Мы пойдем вторым путем.

Создаем сервисный аккаунт для работы с API Google Analytics

Переходим в Google Developers Console, выбираем пункт создать проект и вводим название. После этого переходим на вкладку “Библиотека” и в списке доступных API ищем Analytics API:

Поиск Analytics API Google Developers Console

Теперь необходимо включить доступ в Google Analytics по API:

Включение доступа в Google Analytics по API

Создаем ключ сервисного аккаунта в формате JSON. Сделать это можно на вкладке “Учетные данные”. Название можете задать любое:

 

Создание ключа сервисного аккаунта в формате JSON

Выбор типа ключа сервисного аккаунта

В следующем окне выбираем пункт “Создать аккаунт без роли”:

Создание сервисного аккаунта Google без роли

Теперь необходимо открыть сервисному аккаунту доступ в аналитику. Для этого переходим в созданный сервисный аккаунт и на указанную почту предоставляем доступ в Google Analytics на уровне ресурса с правами редактирования. Делается это обычным способом, как будто, почта принадлежит любому другому пользователю.

После этих манипуляций, мы можем начать работу с API Google Analytics.

Настроить ежедневную автоматическую загрузку данных

Для загрузки данных в Google Analytics мы будем использовать пакеты googleAuthR и googleAnalyticsR. Сам импорт можно выполнить с помощью запуска следующего кода:

 

#Устанавливаем пакеты googleAuthR и googleAnalyticsR, если они не установлены

if(!"googleAuthR" %in% installed.packages()[,1]){install.packages("googleAuthR")}

if(!"googleAnalyticsR" %in% installed.packages()[,1]){install.packages("googleAnalyticsR")}



#Подключаем необходимые библиотеки и вводим данные сервисного аккаунта в окружение

library(googleAuthR)

options(googleAuthR.client_id = "CLIENT_ID")

options(googleAuthR.client_secret = "CLIENT_SECRET")

library(googleAnalyticsR)



#Загружаем данные о затратах в Google Analytics

ga_custom_upload_file("ACCOUNT_ID", "SOURCE_ID", "IMPORT_ID", YOUR_DATA)

Предварительно в коде нужно заменить следующие данные:

  • CLIENT_ID — Электронный адрес сервисного аккаунта;
  • CLIENT_SECRET — Идентификатор ключа сервисного аккаунта;

Отображение Идентификатора и Секрета приложения в Facebook

  • ACCOUNT_ID — идентификатор аккаунта Google Analytics;
  • SOURCE_ID — Идентификатор ресурса Google Analytics;
  • IMPORT_ID — Идентификатор набора импорта данных;

Идентификатор набора данных для импорта затрат с Facebook

  • YOUR_DATA — набор данных, который вы хотите импортировать. В нашем случае он назывался fb_data.

После успешного выполнения скрипта вы увидите следующее сообщение в консоли R:

Информация об успешной загрузке данных о затратах в Google Analytics с помощью R

Соответствующая информация также отобразится в интерфейсе Google Analytics. В наборе данных импорта:

Информация об успешном импорте в наборе данных Google Analytics

И в отчете Анализ Расходов:

Импорт данных о расходах с Facebook в Google Analytics с помощью R

Так как статья получилась не маленькой, информацию о том, как запланировать автоматическое выполнение скрипта читайте в предыдущей статье этого блога.

Мы разобрали на примере данных с Facebook, как импортировать данные о затратах в Google Analytics с помощью R, но данные способ подходит и для других рекламных систем, а также для импорта данных о затратах на такие источники, как SEO и E-mail.

 

А как вы импортируете исторические данные о затратах с различных рекламных систем в Google Analytics?

Сообщение Импорт данных о расходах в Google Analytics с помощью R появились сначала на Analytics Tips - блог о веб-аналитике.

]]>
https://analytics-tips.com/import-dannyh-o-raskhodah-v-google-analytics-s-pomoshchyu-r/feed/ 0
Как установить R на сервер и автоматизировать рутинные задачи https://analytics-tips.com/how-to-install-r-on-server-and-automate-routine-tasks/ https://analytics-tips.com/how-to-install-r-on-server-and-automate-routine-tasks/#respond Wed, 13 Jun 2018 10:17:36 +0000 http://analytics-tips.com/?p=93 При работе с большими массивами информации очень часто приходиться использовать язык программирования, в моем случае это язык R, для сбора, подготовки и последующей обработки данных. Сначала, мне вполне хватало desktop версии R-studio, и пакета taskscheduleR для автоматического запуска скриптов на моём компьютере. Но в какой-то момент количество таких скриптов стало большим и все обновления зависели …

Сообщение Как установить R на сервер и автоматизировать рутинные задачи появились сначала на Analytics Tips - блог о веб-аналитике.

]]>
При работе с большими массивами информации очень часто приходиться использовать язык программирования, в моем случае это язык R, для сбора, подготовки и последующей обработки данных. Сначала, мне вполне хватало desktop версии R-studio, и пакета taskscheduleR для автоматического запуска скриптов на моём компьютере. Но в какой-то момент количество таких скриптов стало большим и все обновления зависели от того, включен ли мой компьютер. В этот момент я и задумался об установке R на сервер. Для своих потребностей я решил использовать сервер в Google Cloud Platform.

Примечание: Справедливости ради, стоит сказать, что во время установки R на сервер Google Cloud Platform и поисков информации о том, как это сделать, я наткнулся на статью в блоге Netpeak, в которой рассказано как сделать подобное, но при работе с этой статьей у меня все равно возникли сложности, о которых не говорилось в статье.

Итак, о чем мы поговорим:

  1. Создание виртуальной машины в Google Cloud Platform (GCP).
  2. Установка R и R Studio на сервер Google Cloud Platform.
  3. Установка дополнительных пакетов на сервере.
  4. Настройка автоматического запуска скриптов.
  5. Установка локали и решение проблем с кодировкой.

Создание виртуальной машины в Google Cloud Platform

Если вы решили создать сервер на Google Cloud Platform, то первым делом нужно подобрать и настроить для этих целей виртуальную машину. И здесь Google предоставляет огромный выбор, а ко всему и бесплатный тестовый период равный одному году.

Если вы первый раз используете GCP в своей работе, то перед тем, как приступать к созданию экземпляра виртуальной машины необходимо создать проект, и включить биллинг. Даже если вы используете бесплатный тестовый период, все равно нужно будет привязать свою карту. Денег при этом Google обязуется не снимать 😉 Карта всего лишь подтверждает, что вы реальный человек.

Теперь, когда с формальностями покончено, давайте приступим.

Переходим в консоль GCP на страницу виртуальных машин и выбираем пункт “Create instance”

Create instance in Google Cloud Platforms

В открывшемся окне задаем нужные нам параметры:

Set instance in GCP

  • Name — Вводим название нашей виртуальной машины, которое может содержать цифры, буквы и символ дефиса.
  • Region&Zone — Выбираем нужный нам регион и зону. Этот пункт влияет на то, какие вычислительные ресурсы нам будут доступны и где и как будут храниться наши данные.
  • Machine type — В этом пункте собираем себе машину с необходимыми мощностями. В расширенном режиме можно выбрать до 8 ядер и 52 Gb оперативной памяти:
    Выбор типа и характеристик виртуальной машины
  • Boot Disk — Выбираем операционную систему Ubuntu 16.04 LTS или же Ubuntu 18.04 LTS.
  • Identity and API access — Мы не планируем писать приложения, которые используют учетную запись службы для вызова облачных API Google, поэтому нам достаточно стандартных настроек. Более подробно об этом пункте можно почитать в справке.
  • Firewall — В настройках брандмауэра разрешаем возможность взаимодействия с сервером как по HTTP, так и по защищенному HTTPS протоколах.

Рядом, справа, будет указана примерная стоимость за использование виртуальной машины с заданными параметрами.

Не забудьте нажать на кнопку “Create”. Через некоторое время наша машина будет создана.

Установка R и R Studio на сервер Google Cloud Platform

Чтобы начать работу с только что созданной виртуальной машиной необходимо подключиться к ней по SSH (сетевой протокол, название которого происходит от слов Secure Shell). Он шифрует весь трафик, включая и передаваемые пароли. Для этого достаточно кликнуть на соответствующий пункт в меню:

Подключение к виртуальной машине через SSH протокол

И в новом окне браузера откроется… Матрица ))

Как выглядит подключение к виртуальной машине Google Cloud Platform

Первое что я подумал, увидев это окно “вот она матрица”. Но пообщавшись с программистами и узнав у них некоторые детали, я понял, что это все не так страшно и сейчас вы в этом убедитесь.

Интересно: В большинстве команд, которые мы дальше будем использовать в начале будет указана команда “sudo”, которая позволяет запускать команды от имени суперпользователя root.

Необходимо понимать, что помимо главного репозитория, содержащего все пакеты от разработчиков дистрибутива Ubuntu, существует и масса других источников пакетов. Одним из таких является пакет R. Добавление такого стороннего пакета происходит в 4 этапа:

  1. Нужно добавить ссылку на репозиторий в файл /etc/apt/sources.list.
  2. Добавить в apt keyring публичный ключ репозитория.
  3. Обновить кэш доступных пакетов
  4. Установить необходимый пакет.

А теперь подробнее о каждом из этих пунктов:

Добавить ссылку на репозиторий CRAN в файл /etc/apt/sources.list.

Другими словами, мы добавляем в файл /etc/apt/sources.list информацию о том, откуда нужно брать файлы для установки R. Для этого, с помощью следующей команды мы откроем нужный файл через текстовый редактор nano. Вы можете использовать другой текстовый редактор, например vim.

sudo nano /etc/apt/sources.list

в открывшемся окне опускаемся в конец документа и добавляем строчку

deb https://cran.rstudio.com/bin/linux/ubuntu xenial/

Добавляем информацию о том, откуда нужно брать файлы для установки R

После этого нажимаем комбинацию Ctrl+X для выхода из редактора. В открывшемся окне вводим “Y” для сохранения изменений.

Окно подтверждения изменений в файле sources list

В последнем окне нажимаем Enter, чтобы записать данные в тот же файл, который мы редактировали.

Подтверждаем запись данных в текстовом редакторе nano

Добавить в apt keyring публичный ключ репозитория CRAN

Ключ используется для удостоверения подлинности и надежности репозитория. И добавляется с помощью следующей команды:

sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E084DAB9

которая запрашивает ключ напрямую у сервера сертификации Ubuntu — keyserver.ubuntu.com

Обновить кэш доступных пакетов

Выполняется с помощью команды:

sudo apt update

Установить необходимый пакет с R

Теперь можем установить необходимый нам пакет R с помощью  команды:

sudo apt-get install r-base

В ходе выполнения команды нужно будет подтвердить, что вы готовы установить программное обеспечение с помощью ввода “Y”. Или же можно сразу воспользоваться командой

sudo apt-get install r-base -y

Установка R Studio

Помимо установки R, для удобства работы, нам нужно установить R Studio. И первым делом для этого нужно скачать установочный файл. Делаем это с помощью команды wget

wget https://download2.rstudio.org/rstudio-server-1.0.136-amd64.deb

Теперь, для того, чтобы провести установку R Studio, устанавливаем еще один пакет — gdebi. Gdebi — программа для установки .deb пакетов.

sudo apt-get install gdebi-core -y

И последней командой устанавливаем R Studio со скачанного файла:

sudo gdebi rstudio-server-1.0.136-amd64.deb

Теперь необходимо указать порт, при обращении к которому вы будете получать доступ в R Studio. Для этого нужно внести информацию в файл /etc/rstudio/rserver.conf. Делаем это с помощью команды

sudo nano /etc/rstudio/rserver.conf

и добавляем в файл следующую строку:

www-port=80

После этого задаем пароль для доступа в R Studio командой

sudo passwd user_name

где, вместо user_name используем имя пользователя

Ищем user_name для создания пароля

При вводе пароля вам будет казаться, что ничего не происходит, но на самом деле введенные символы запоминаются. После второго успешного ввода вы увидите примерно следующее:

Установка пароля на сервер с R Studio

Осталось перезапустить серверный R Studio и можно приступать к работе.

sudo service rstudio-server restart

Чтобы попасть в привычный интерфейс R Studio нужно перейти по внешнему адресу:

Чтобы попасть в привычный интерфейс R Studio нужно перейти по внешнему адресу

Скорее всего при входе вы увидите следующую ошибку.

Попытка подключения к серверу при закрытом 443 порте

Связана она с тем, что вы пытаетесь подключиться по протоколу HTTPS, а для работы с R Studio мы открывали 80 порт для протокола HTTP. Убрав в адресной строке лишнюю букву можно заходить.

https://22.222.222.22/ -> http://22.222.222.22/

В открывшемся окне вводим логин и пароль и радуемся виду привычного R Studio, только теперь на сервере.

Окно входа в R Studio server

Установка дополнительных пакетов R на сервере

Скорее всего базовых пакетов R для работы вам будет недостаточно, и дополнительно придется устанавливать другие. Давайте разберем установку таких пакетов на примере “googleAnalyticsR”.

Если вы просто введёте в консоли R команду установки пакета

install.packages("googleAnalyticsR")

, то скорее всего получите вот такую ошибку.

Ошибка при вводе в консоли R команды установки пакета

Чтобы такого не случилось, необходимо дополнительно установить некоторые пакеты Ubuntu. Сделать это можно с помощью следующей команды в консоли сервера.

sudo apt-get install build-essential libcurl4-gnutls-dev libxml2-dev libssl-dev

После этой нехитрой манипуляции выбор остается за вами: можно устанавливать пакеты R стандартным способом в консоли R Studio или же можно все это сделать с консоли Ubuntu. Для последнего нужно ввести команду ниже, которая позволит ввести оболочку R в качестве пользователя root:

sudo -i R

Теперь с консоли Ubuntu мы можем устанавливать пакеты с помощью install.packages() также как и с консоли R Studio.

установка необходимых пакетов с помощью команды install.packages с консоли Ubuntu

Настройка автоматического запуска скриптов

Собственно теперь разберем то, ради чего лично я и ставил R на сервер — автоматический запуск скриптов по расписанию. Для этого будем использовать пакет cronR. Для начала установим пакет и загрузим соответствующую библиотеку.

install.packages("cronR")

library(cronR)

Теперь на вкладке аддоны у нас появился новый аддон “Schedule R scripts on …”

Добавление аддона Schedule R scripts on

При первом запуске у вас появится вот такое окно:

первом запуск аддона Schedule R scripts on

в котором нужно смело нажать “Yes”.

В итоге, после того как установятся все необходимые пакеты вы увидите вот такое окно:

Окно настройки автоматического запуска скрипта по расписанию

В этом окне нужно указать скрипт, запуск которого мы хотим запланировать, а также параметры этого запуска. Мы с вами разберем основные, отмеченные на скриншоте.

  1. Choose your Rscript — в этом пункте выбираем нужный нам скрипт.
  2. Selected Rscript — здесь отобразится скрипт выбранный в пункте один.
  3. Launch date — указываем дату первого запуска скрипта.
  4. Launch hour — соответственно время запуска.
  5. Schedule — настраиваем расписание запуска под свои потребности.
  6. Job description — и не забываем указать описание, чтобы потом не потеряться в огромном количеств запланированных задач.
  7. Кнопка “Create job” — которую нужно нажать в конце, здесь автоматизации еще нет 🙂

На этом с настройкой автоматического запуска скриптов пожалуй все. А хотя, нет. Чтобы увидеть, какие задачи у вас уже запланированы нужно перейти на вкладку “Manage existing jobs”

Как увидеть какие задачи у вас уже запланированы

и кликнуть на кнопку “Show current crontab schedule”:

кнопка Show current crontab schedule - Показать текущие запланированные задачи

В консоли R Studio вы увидите выполнение каких скриптов и на какое время у вас запланировано:

Отображение информации в консоли R Studio о том выполнение каких скриптов и на какое время у вас запланировано

Вот теперь все 😉

Установка локали и решение проблем с кодировкой

Еще одна особенность R с которой вы столкнетесь или возможно уже столкнулись это кодировка и локаль. По умолчанию кодировка в R соответствует настройкам локали. В случае нашего сервера, она будет следующей:

Пример кодировки в R по умолчанию

И, если вам нужно будет её изменить, вы столкнетесь со следующей ошибкой:

Ошибка при изменении локали на сервере с помощью R

Для того чтобы обойти эту ошибку, нужно добавить необходимую локаль в настройки сервера. Сделать это можно в несколько шагов следующим образом:

  • Запускаем команду переустановки языковых пакетов:
sudo dpkg-reconfigure locales

В открывшемся окне выбираем нужный нам, например ru_RU.CP1251 CP1251

Окно переустановки языковых пакетов на сервере Ubuntu

Делаем отметку с помощью нажатия кнопки “Space” и сохраняем изменения.

После этого необходимо перезагрузить сервер с помощью следующей команды:

sudo reboot now

Теперь при настройке локали в R Studio всё отлично работает:

Успешная настройка локали в R Studio

Вместо заключения: R очень мощный язык программирования, который идеально подходит для решения задач связанных со сбором, подготовкой и последующей обработкой данных. С помощью установки R на сервер эти возможности становятся поистине безграничны. А как вы используете R?

Сообщение Как установить R на сервер и автоматизировать рутинные задачи появились сначала на Analytics Tips - блог о веб-аналитике.

]]>
https://analytics-tips.com/how-to-install-r-on-server-and-automate-routine-tasks/feed/ 0