Skip to content

Valentina-Fed/VK_groups_parser

Repository files navigation

VK_groups_parser

Программа позволяет получать и визуализировать данные о публикациях на стене сообщества (1) и о его участниках (2).

Команда запуска: python main.py --groups [list_of_groups_to_parse] --mode [options: wall / members].

(1) Если выбрана опция wall (публикации со стены), программа выдает четыре файла двух типов: {group_name}_wall_text.csv, {group_name}_wall_info.csv, {group_name}_wall_text.txt, {group_name}_wall_info.txt.

Файлы wall_text содержат тексты публикаций со стены сообщества с их идентификафионными номера, которые приводятся для удобства дальнейшего поиска и сравнения данных.

Файлы wall_info содержат информацию об авторе публикации, о ее типе, дате, наличии фото или видео, количестве лайков, репостов, просмотров и идентификафионном номере.

Построение облака слов производится с помощью модуля wordcloud. Список слов, которые не следует включать в облако, был пополнен вручную с учетом особенностей текстового материала. Программа получает на ввод файл {group_name}_wall_text.csv и выдает два файла: облако слов {group_name}.png и словарь слов со стены с указанием их частотности в порядке её убывания {group_name}.txt.

image

Файл wall_info дает доступ к авторам сообщений, позволяет выделить наиболее популярные сообщения с наибольшим количеством лайков и просмотров, а также рассортировать сообщения по дате их написания.

Сведения об общей активности сообщества визуализируются с помощью гистограмм, построенных по принципу «год публикации – количество публикаций» и «месяц публикации – количество публикаций».

image

(2) Анализ состава участников группы возможен при выборе опции --mode members. В этом случае система выдает файлы со списком участников {group_name}_members.txt и {group_name}_members .csv, в которые входят идентификационный номер, имя и фамилия (при наличии), пол, код рождения, город, страна.

image

Программа также предоставляет возможность анализировать весь комплекс рассматриваемых сообществ, выявлять их наиболее активных участников и наиболее влиятельные сообщества, на которые пописано большинство участников. Для этого, на основе данных об участниках, строятся интерактивные графы.

image

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages