
На сегодняшний день сервис микроблогов Twitter является второй по количеству интернет-пользователей социальной сетью после Facebook. В середине прошлого года микроблоги вели свыше 50 миллионов зарегистрированных пользователей. Самыми активными из них были более пятисот тысяч. В среднем же на каждого пользователя сервиса микроблогов приходится 150 читателей. Поэтому не удивительно, что этот сервис как ни один другой отлично подходит для продвижения сайта. Однако прежде чем начать раскрутку, необходимо учесть несколько особенностей, от которых зависит распространение контента в Твиттере.
Многим известно, что в реальном мире существует теория шести рукопожатий. На Твиттер эта теория тоже распространяется, но количество рукопожатий, то есть знакомств, уменьшается до четырёх. Получается, что в Твиттере каждые два человека знакомы через четыре фолловинга.
В Твиттере информация распространяется так называемыми ретвит-каскадами. При этом необходимо учитывать, что
- ретвиты получают не все твиты, а только пять-шесть процентов из них;
- в новостных лентах может быть не более 15% ретвитов;
- в течение первого часа пользователи ставят 90% всех ретвитов.
Поэтому при продвижении сайта необходимо учитывать, что твит должен стать популярным в первый час после его размещения. Если этого не произойдёт, то ретвитов он уже не получит. Поэтому необходимо включить в стоимость создания сайта и его продвижения разработку стратегии ведения своего твиттер-аккаунта.
Предсказать популярность твита помогут три основных фактора:
- количество ретвитов, оставленных за 30 секунд;
- PageRank;
- авторитетность пользователя.
В первую очередь на популярность твита влияет авторитетность пользователя. Распространение в первые секунды определяет, удачен ли отправленный твит для пользователя. В первую очередь это поможет в продвижении бренда и в рекламе сайта, а значит повлияет и на обслуживание сайта.
Кроме этого, популярные твиты можно скомпоновать в статью. Тогда твиттер-аккаунт будет работать в качестве социального журнализма. К тому же популярные твиты влияют на свежесть выдачи и улучшение её качества.
Три модели распространения информации в Твиттере

Можно выделить три модели, в соответствии с которыми распространяется информация: эпидемиологическую, линейную и машинную.
Эпидемиологическая модель подразумевает создание таких твитов, которые будут распространяться как вирус. Каждый пользователь может заразить другого пользователя. Микроблог среднего пользователя на 50% состоит из твитов, которые написали пользователи, входящие в ТОП-20 000 по количеству читателей.
В данной модели учитывается, что заражение зависит от времени и пользователя, а также от того, что есть вероятность повторного "заражения" пользователя.
При линейной модели распространение твита зависит от суммы влиятельности сделавших ретвит пользователей. Если знать, каково распространение твита на определённый момент времени, можно спрогнозировать и его продолжение: анализ первого часа позволит прогнозировать второй и третий час.
Машинный метод позволяет применить машинное обучение. Сначала выбирается обучающая выборка и задаются факторы, на основании которых машина учится определять популярные твиты и выделять непопулярные. Стоит отметить, что Яндекс уже давно использует алгоритм, позволяющий фильтровать ботов в сервисе микроблогов.
После этого твиты распределяются на классы на основе двух групп факторов:
- социальных - среднее количество ретвитов и количество читателей;
- контентных - наличие ссылок, хэштегов, длина сообщения.
При этом популярность твита совсем не сводится только к контенту. Важную роль играет и пользователь, который оставил сообщение.
Среди недостатков такой модели можно назвать отсутствие физического смысла, нет наглядности, которой обладает линейная модель влияния и непонятно, каким образом происходит распространение твита. Но именно машинное обучение даёт хороший результат, более точные предсказания, возможность добавить новые факторы. К тому же она не слишком сложна в вычислениях.
При использовании машинной модели предсказанное число отличается всего в два - три раза от прогноза. Наиболее точны краткосрочные прогнозы на 30 секунд или несколько минут.