Спортс” изнутри: как устроены модерация, авторизация и защита ваших данных?
Как устроена авторизация и регистрация пользователей? А модерация комментариев или редактор постов? Лиды юнитов разработки Спортса” – Андрей Панисько и Максим Пеший – пришли в подкаст «Коллеги, добрый день!» и подробно рассказали, что под капотом наших блогов.
Такие детали наверняка зацепят даже читателей, которые не очень сильны в технологиях, но хотят узнать, что стоит за нашим привычным интерфейсом. А уж технических спецов тем более!
Очень советуем весь подкаст целиком на ВидеоСпортсе’’, а тут мы выбрали несколько самых любопытных деталей.
Авторизация и регистрация – это правда так просто, как кажется?
У нас классическая история: регистрация через логин-пароль или с помощью соцсетей. Но дальше уже всякие технические сложности, которые приходится решать разработчикам. Например, если раньше человек уже был зарегистрирован по электронной почте, а теперь авторизовался через соцсети, мы со 100-процентной вероятностью сможем определить, что это тот самый человек. Здесь у нас все настроено: автоматика такие вещи умеет схватывать.
Есть еще нюансы с теми, кто для разных нехороших целей заводит по несколько аккаунтов. Поэтому мы при некоторых случаях регистрации просим указать мобильный телефон, сохраняем его и, если потом кто-то придет с таким же номером – мы его не пропустим.
Скоро у наших пользователей появится возможность авторизоваться через телеграм. Идея все та же: нажимаешь одну кнопочку – и ты на Спортсе” со своей аватаркой, ником. Можешь комментировать, лайкать, дизлайкать и так далее.
Немало головной боли добавляет, что нам нужно проводить регистрацию сразу на разных доменах: кроме основного, у нас же есть еще m-домен. Условно человек авторизуется на десктопной версии сайта, нам обязательно в этот же момент нужно провести эту авторизацию и на мобильной версии. Пользователь об этом не думает, но когда зайдет с телефона, мы сможем это все связать – и нужные куки сохранятся.

Безопасность: почему нельзя менять почту или ник?
Да, у нас нет возможности заменить электронную почту после регистрации или самостоятельно сменить ник. Это ради безопасности.
Чтобы, если у вас угнали аккаунт, никто другой тоже не мог поменять ваш логин – если бы такая возможно была, нам потом было бы сложнее понять, кому аккаунт принадлежал изначально.
Уникальные ники – это еще и защита от нежелательного поведения пользователей, когда один может прикинутся кем-то другим.
Извне к нашей базе пользователей не пробраться. Мы изолированы на уровне сети: вся наша инфраструктура защищена тем, что выделена в отдельные подсети, которые обычному интернету снаружи не видны. Даже если злоумышленники получат прямой доступ к этой базе, все самые ценные и чувствительные данные все равно хранятся в зашифрованном виде. Причем зашифрованы они в один конец: расшифровать те же самые пароли мы сами не сможем при всем желании.
Модерация комментариев – что там делают люди, а что нет? И причем тут «мокрые киски»?
Модерация у нас многослойная. Людям в нее приходится вмешиваться уже на последнем рубеже, когда кто-то прорвался через все предыдущие механизмы. С человеческой модерацией все понятно: кто-то увидел непотребный комментарий, пожаловался, дальше жалоба прилетела в админку, специальные люди ее обработали.
Но чтобы нечто злое на сайте вообще оказалось, нужно сильно постараться. Первым рубежом обороны у нас работает сервис «Антихейт» на базе машинного обучения: в некоторых случаях просто предупреждает пользователя, что что-то в его комментарии может не понравиться некоторым участникам сообщества.

Если этого оказалось недостаточно, а пользователь все-таки хочет оставить подозрительный комментарий, он попадает на дальнейшую проверку в другую машинку, которая примерно по тем же правилам проверит, действительно ли коммент выглядит как что-то неприятное. Каждый такой комментарий получает оценку – если число достигает определенного порогового значения, мы формируем на него автоматическую жалобу. Дальше вступает модератор.
Есть механизм стоп-слов. Там очень много всего, не только обсценная лексика, в том числе самые разные выражения, которые считаются оскорбительными среди болельщиков. Такое мы тоже отслеживаем и отлавливаем.
Еще одна проверка связана со спамерами. Оставить коммент со ссылкой обычному пользователю нельзя – нужно нарастить свой рейтинг. Но даже если кто-то опубликует нечто рекламное или незаконное, у нас настроена проверка контента – такие вещи мы обычно не пропускаем.
Легендарная история – борьба с мокрыми кисками. Когда несколько недель была игра в кошки-мышки: наша разработка доблестно пыталась остановить спамеров, а ребята придумывали новые ходы. Пользователи очень радовались новости, что мы все-таки победили мокрых кисок.
***
На Спортсе” регулярно появляются новые команды или существующие – перестраиваются, поэтому всегда можно дорасти до тимлида. Либо стать старшим по отдельному продукту.
Для примера – донаты. Это полноценный проект, который в момент разработки вели два человека. Им лид был нужен лишь как консультант – возможно, чтобы не совершить очевидных ошибок. В остальном они делали все сами – и таких кейсов очень много.
К тому же в компании немало горизонтальных переходов. В этом смысле мы можем позволить себе большую гибкость.
А прямо сейчас мы в поиске сразу нескольких профильных IT-сотрудников:
Приходите к нам работать, чтобы вместе делать спорт и Спортс’’ лучше!
"Первым рубежом обороны у нас работает сервис «Антихейт» на базе машинного обучения" — который сносит множество годных и смешных комментариев просто потому что он обучен на такой вот выборке, но при этом антихейт полностью игнорирует откровенных провокаторов а-ля ригобер, все комментарии которого это топорный байт. Или споры о политике.
"Есть механизм стоп-слов. Там очень много всего, не только обсценная лексика, в том числе самые разные выражения, которые считаются оскорбительными среди болельщиков. Такое мы тоже отслеживаем и отлавливаем" — прекрасный механизм, когда за междометие их трех букв можно улететь в бан на три дня, а потом на главной прочитать, как один человек назвал другого словом на букву П из семи букв. Или про заднее отверстие литвина во всех подробностях.
И нет, мой комментарий не носит оскорбительный характер, ваша плашка опять ошиблась.
Про логику работы с матом рассказывали например вот здесь: https://www.sports.ru/football/blogs/3092518.html
у меня однажды удалили цитату из "Мертвых душ", Гоголь бы через "машинки" спортса не прорвался.
ага, про этот комментарий ИИ тоже пишет, что он, возможно, носит оскорбительный характер.
Я уже не говорю о том, что это все криво работает, цитируешь сообщение собеседника, а на тебя защита агрится.