20 мая 2017 г

Управление презентацией

  • 'F11' или 'Fn' + 'F11': включить/выключить фуллскрин. Рекомендую включить фуллскрин

  • И еще нажмите Hide Toolbars внизу справа

  • 'o' enable/disable overview mode

  • Стрелочки влево и вправо перемещают между слайдами

  • 'p': Комментарии к слайду (иногда просто котики)

  • Многие штуки кликабельны и интерактивны

Немножко графов

Граф активных участников (кто постил или комментил хотя бы раз)

Связи - наличие в друзьях. Размер кружка - betweenness centrality. Можно двигать/масштабировать. Цвета означают разные кластеры (cluster_walktrap из igraph).
Цвета кластеров (UPD):

-Зеленый: МГУ

-Оранжевый: лаба Уточкина и некоторые старшие бакалавры ВШЭ

-Фиолетовый: некоторые бакалавры ВШЭ

-Синий: в основном, Питер, РАНХиГС

-Розовый: Когнитивная магистратура ВШЭ, первый курс

Граф всех участников

На первом графе цветом помечены университеты (если эта информация доступна). - Противный темнозеленый цвет повсюду: люди, информация о вузе недоступна (или просто не получилось ее вытащить)
- Ярко розовый: МГУ
- Голубой: ВШЭ
- Оранжевый: СПбГУ
- Зеленый: РГГУ
- Бледно-розовый: МГППУ
- Синий: ЯрГУ
- Бледно-зеленый: РАНХиГС
- Коричневый: УрФУ

Граф всех участников

Тот же самый граф, только цветом помечены кластеры (cluster_walktrap из igraph). Не стоит слишком доверять этим кластерам, они очень нестабильны, к сожалению. Особенно это заметно для хабов - крупных точек, которые соединяют многих. Тем не менее, можно выделить несколько "комьюнити":
- Синий: МГУ (в первую очередь, более старшее поколение)
- Зеленый: Бакалавры психфака ВШЭ (как вы там называете это - одна большая семья, да?)
- Оранжевый: СПБГУ
- Розовый в центре справа: когнитивные магистры ВШЭ, первый курс
- Коричневый и голубой справа: УрФУ
- Бирюзовый в центре слева: РГГУ/РАНХИГС/ЯрГУ (DUNKER COMMUNITY?)
- Темно-зеленый слева сверху: скорее всего, когнитивные магистры Смольного
- Бордовый слева сверху: СамГУ
- Желтый слева: скорее всего, второкурсники бакалавриата психфака СПбГУ
- Черный слева: скорее всего, первокурсники бакалавриата психфака СПбГУ
- Бежевый внизу справа: второкрусники психфака МГУ
- Ярко-голубой внизу справа: первокурсники психфака МГУ?

Самые популярные посты

Самые популярные посты

Начнем с таймлайн картиночки. Цвет - лайки, размер - количество комментов. Можно наводить на точку и смотреть больше инфы, plotly же! При наведении указаны как текст в самом посте, так и оригинальный текст, если это был репост.

Когда публиковались посты и комменты?

Посты:

Когда публиковались посты и комменты?

Комменты:

Самые популярные посты

В табличке можно скрывать колонки, а еще СКОПИРОВАТЬ ВСЕ В ЭКСЕЛЬ НАХУЙ

P.S. …или в .pdf. И даже в буфер обмена (не знаю пока зачем)

В конце находится колонка с полным текстом поста, по ней можно осуществлять поиск.
Можно фильтровать и ранжировать по любым колонкам. Это же относится и к последующим табличкам.

Самые популярные посты

  • И абсолютный чемпион по комментам(42), лайкам(269) и репостам(25) Елена Горбунова со знаменитым комиксом Are you redukcionisti tam?.

  • Конечно, Елена Горбунова еще и автор самого большого количества постов(121), если включать те, которые были опубликованы от имени группы и без ссылки на автора.

  • Когнитивное патисеребро и патибронзу получают Артем Карабанов и Мариам Бангура c 18 и 16 постов соответственно.

  • Суммарно больше всех лайков за свои посты получили все те же патимейкеры:

fullname sum.likes
Елена Горбунова 5560
Мариам Бангура 938
Артем Карабанов 853
  • А вот самое высокое среднее количество лайков (161) собрала Юля Кожухова за всего один пост.

Как связаны количество комментов, лайки, репосты и длина постов?

Рейтинги цитируемости комментов!

Самый залайканный коммент (Иван Иванчей, 101 лайк)

Самые-самые комментаторы

Wordcloud(текст постов и комментов)

Большая финальная табличка по участникам

Небольшой бонус….

Пай-чарт по полу! Шах и мат, аметисты!

Таким образом…

Здесь были использованы только данные, доступные для просмотра всем.
Тем не менее, вы можете увидеть, что большую часть информации, например, Ваш вуз, легко можно "вытащить" по Вашим друзьям. Что немного стремненько, как по мне, ибо все это вытащить не очень сложно.
Возможно, потом можно будет продолжить анализ, пока что это было, скорее, демонстрацией возможностей R в плане визуализации.
Список использованных пакетов:

library(data.table)
library(stringi)
library(stringr)
library(igraph)
library(networkD3)
library(plotly)
library(DT)
library(pander)
library(tm)
library(vkR)
library(SnowballC)
library(RColorBrewer)
library(wordcloud)
library(ggTimeSeries)

Для визуализации большого графа была использована программа Gephi.

Мерси за рыбу и пока!