1. Управляемая пользователями структура для регулирования и аудита социальных сетей (arXiv)

Автор: Сара Х. Сен, Александр Мадри, Деваврат Шах.

Аннотация: Люди формируют суждения и принимают решения на основе информации, которую они наблюдают. Растущая часть этой информации не только предоставляется, но и тщательно обрабатывается платформами социальных сетей. Хотя законодатели в основном согласны с тем, что платформы не должны работать без какого-либо надзора, нет единого мнения о том, как регулировать социальные сети. Однако существует консенсус в отношении того, что создание строгого глобального стандарта «приемлемого» контента несостоятельно (например, в США это несовместимо с разделом 230 Закона о приличии в коммуникациях и Первой поправкой). В этой работе мы предлагаем, чтобы алгоритмическая фильтрация регулировалась в соответствии с гибкими базовыми параметрами, определяемыми пользователем. Мы предоставляем конкретную основу для регулирования и аудита платформы социальных сетей в соответствии с такой базой. В частности, мы вводим понятие базовой ленты: контента, который пользователь увидит без фильтрации (например, в Твиттере это может быть хронологическая временная шкала). Мы требуем, чтобы фиды, фильтруемые платформой, содержали «похожий» информационный контент, что и их соответствующие базовые фиды, и мы разрабатываем принципиальный способ измерения сходства. Этот подход мотивирован соответствующими предложениями о том, что нормативные акты должны расширять свободу действий пользователей. Мы представляем процедуру аудита, которая проверяет, соответствует ли платформа этому требованию. Примечательно, что для аудита требуется только черный ящик доступа к алгоритму фильтрации платформы, и он не получает доступ к частной информации пользователя и не выводит ее. Мы предоставляем теоретические гарантии на прочность аудита. Далее мы показываем, что требование близости между отфильтрованными и исходными потоками не требует больших затрат на производительность и не создает эхо-камер.

2. Обнаружение сообщества с использованием пересмотренного Medoid-Shift на основе KNN (arXiv)

Автор: Цзе Хоу, Цзякан Ли, Сяокан Пэн, Вэй Кэ, Юнган Лу.

Аннотация: Обнаружение сообщества становится важной проблемой с бумом социальных сетей. В качестве отличного алгоритма кластеризации Mean-Shift нельзя применять непосредственно к обнаружению сообщества, поскольку Mean-Shift может обрабатывать только данные с координатами, тогда как данные в задаче обнаружения сообщества в основном представлены графом, который можно рассматривать как данные с матрица расстояний (или матрица подобия). К счастью, предлагается новый алгоритм кластеризации под названием Medoid-Shift. Алгоритм Medoid-Shift сохраняет преимущества среднего сдвига и может применяться к задачам, основанным на матрице расстояний, таким как обнаружение сообщества. Одним из недостатков алгоритма Medoid-Shift является то, что в области соседства, определяемой параметром расстояния, может не быть точек данных. Таким образом, чтобы лучше справиться с проблемой обнаружения сообщества, в этой работе предлагается новый алгоритм, названный Revised Medoid-Shift (RMS). В процессе поиска следующего медоида алгоритм RMS основан на окрестности, определенной KNN, в то время как исходный Medoid-Shift основан на окрестности, заданной параметром расстояния. Поскольку окрестность, определяемая KNN, более стабильна, чем та, которая определяется параметром расстояния с точки зрения количества точек данных в окрестности, алгоритм RMS может сходиться более плавно. В методе RMS каждая из точек данных смещается в сторону медоида в пределах окрестности, определяемой KNN. После итеративного процесса смещения каждая точка данных сходится в центр кластера, а точки данных, сходящиеся в один и тот же центр, группируются в один и тот же кластер. Алгоритм RMS тестируется на двух типах наборов данных, включая наборы данных сообщества с известным разделом наземной истины и наборы данных сообщества без раздела наземной истины соответственно. Результаты эксперимента показывают, что предложенный алгоритм RMS обычно дает лучшие результаты, чем Medoid-Shift и некоторые современные алгоритмы вместе с большинством классических алгоритмов обнаружения сообществ на различных типах наборов данных обнаружения сообществ.