Программа позволяет получать и визуализировать данные о публикациях на стене сообщества (1) и о его участниках (2).
Команда запуска: python main.py --groups [list_of_groups_to_parse] --mode [options: wall / members].
(1) Если выбрана опция wall (публикации со стены), программа выдает четыре файла двух типов: {group_name}_wall_text.csv, {group_name}_wall_info.csv, {group_name}_wall_text.txt, {group_name}_wall_info.txt.
Файлы wall_text содержат тексты публикаций со стены сообщества с их идентификафионными номера, которые приводятся для удобства дальнейшего поиска и сравнения данных.
Файлы wall_info содержат информацию об авторе публикации, о ее типе, дате, наличии фото или видео, количестве лайков, репостов, просмотров и идентификафионном номере.
Построение облака слов производится с помощью модуля wordcloud. Список слов, которые не следует включать в облако, был пополнен вручную с учетом особенностей текстового материала. Программа получает на ввод файл {group_name}_wall_text.csv и выдает два файла: облако слов {group_name}.png и словарь слов со стены с указанием их частотности в порядке её убывания {group_name}.txt.
Файл wall_info дает доступ к авторам сообщений, позволяет выделить наиболее популярные сообщения с наибольшим количеством лайков и просмотров, а также рассортировать сообщения по дате их написания.
Сведения об общей активности сообщества визуализируются с помощью гистограмм, построенных по принципу «год публикации – количество публикаций» и «месяц публикации – количество публикаций».
(2) Анализ состава участников группы возможен при выборе опции --mode members. В этом случае система выдает файлы со списком участников {group_name}_members.txt и {group_name}_members .csv, в которые входят идентификационный номер, имя и фамилия (при наличии), пол, код рождения, город, страна.
Программа также предоставляет возможность анализировать весь комплекс рассматриваемых сообществ, выявлять их наиболее активных участников и наиболее влиятельные сообщества, на которые пописано большинство участников. Для этого, на основе данных об участниках, строятся интерактивные графы.



