Як відстежити маніпуляції в Вікіпедії

Незважаючи на те, що в Росії вже неодноразово брали спроби заблокувати Вікіпедію з різних причин, сама ж російська пропаганда не відмовляється від використання онлайн-енциклопедії в власних інтересах. Незважаючи на те, що в Росії вже неодноразово брали спроби   заблокувати   Вікіпедію з різних причин, сама ж російська пропаганда не відмовляється від використання онлайн-енциклопедії в власних інтересах

Скріншот Вікіпедії

Наприклад, твіттер-блог « Госправкі »Систематично відстежує зміни в статтях Вікіпедії, зроблені з IP-адрес, що належать російським державним структурам.

Наприклад, твіттер-блог «   Госправкі   »Систематично відстежує зміни в статтях Вікіпедії, зроблені з IP-адрес, що належать російським державним структурам

Саме ця ініціатива в липні 2014 року знайшла правку про відповідальність за збитий на Донбасі пасажирський літак MH-17, яка була зроблена з IP-адреси медіахолдингу ВГТРК. Фрагмент про те, що літак збили «терористи самопроголошеної Донецької народної республіки з ракетних установок« Бак », які були отримані терористами з Російської Федерації» був змінений на формулювання «літак збили українські військові».

Випадки редагування текстів у Вікіпедії з комп'ютерів державних установ відомі в багатьох країнах. Американські ЗМІ також неодноразово фіксували випадки , Коли представники Конгресу США змінювали акценти в різних матеріалах онлайн-енциклопедії, що часто викликало гучні медіаскандалів. Існує також моніторинг правок з українських держустанов, які відстежує блог « Держредагування ».

Але крім пропагандистів статті у Вікіпедії редагують ще й звичайні вандали, видаляючи фрагменти інформації, додаючи спам або неправдиву інформацію. За день Вікіпедію редагують близько півмільйона разів. Тому зберігати якість інформації і видаляти непотрібне сміття неможливо без інструментів, які сканують активність в онлайн-енциклопедії автоматично.

30 листопада Вікіпедія анонсувала запуск ORES - технології штучного інтелекту, метою якого є ідентифікувати саме шкідливі правки - акти вандалізму в онлайн-енциклопедії. Ця технологія не займається факт-чекінгом, а тільки виявленням сумнівних змін, які погіршують якість Вікіпедії.

Одним з головних завдань ORES є автоматичне розділення цілеспрямованого вандалізму і просто неякісних змін, які були зроблені недосвідченими редакторами без злого умислу.

У міру використання алгоритм системи самостійно вдосконалюється і сканує зміни в Вікіпедії більш точно. На даний момент технологія підтримує 14 мов: німецьку, англійську, іспанську, естонський, голландський, фарсі, французька, іврит, індонезійська, італійська, португальська, турецька, українська, в'єтнамська.

ORES є відкритим кодом, який кожен може використовувати в своїх інструментах. Ще до офіційного релізу його протягом декількох місяців тестували в 12 різних інструментах.

Ми розповімо про деякі інструментах, які використовують ORES для відстеження вандалізму в режимі реального часу, і можуть, на наш вигляд, бути також корисними для факт-чокерів.

Ra · un - лаконічний і зручний інструмент моніторингу правок. Практично в режимі реального часу Ra • un показує назви статей, в яких були внесені нові редагування. Праворуч від назви статті показано кількість доданого (зелений) або віддаленого (червоний) контенту.

За допомогою фільтра можна вибирати моніторинг певного типу правок, наприклад, анонімних або на нових сторінках. В налаштуваннях також є можливість зміни мовної версії Вікіпедії.

Snuggle - інструмент, який допомагає досвідченим «вікіпедистів» відстежувати нових користувачів, що роблять якісну роботу в онлайн-енциклопедії. Першочерговим завданням є розвиток вікі-спільноти. Але інструмент також відстежує користувачів, що роблять шкідливі правки.

В факт-чекінге Snuggle дає корисну інформацію про тенденції. За допомогою даного інструменту можна дізнатися, яку тематику найбільш активно редагують, де і хто найбільш часто додає шкідливі правки. Цей інструмент також можна використовувати для відстеження активності певного користувача - якого роду правки і в яких статтях він робить.

Ще одна програма, яка надає безліч функцій відстеження вандалізму - Huggle . У цьому інструменті можна створювати різні фільтри для відстеження певного типу редагувань: статті, на які варто звертати додаткову увагу; нові статті, створені користувачами не з білого списку і т.д.

Але в той же час, програма вимагає установки на комп'ютер і її використання можливо тільки для вікі-користувачів, що мають права « швидкого відкоту »(Можливість скасування правок іншого користувача без редагування самої сторінки). Для отримання таких прав потрібен певний досвід редагування статей Вікіпедії (умови різні в залежності від мовної версії).

Якщо ж нас цікавлять правки не в режимі реального часу, а наприклад старі версії конкретного користувача або статті, то це можна перевірити безпосередньо на сторінках Вікіпедії . Для цього достатньо вписати ім'я користувача або IP-адресу. Наприклад, можна перевірити активність IP-адреси ВГТРК, з якого була зроблена вже згадана правка про відповідальність за збитий Боїнг «Малазійських авіаліній».

Виявляється, що у вересні 2013 року цей же користувач робив дрібні правки в статті «Україна і Митний Союз з ЄврАзЕС», а приблизно через рік - 7 вересня 2014 року - видалив фрагмент статті про протипіхотній фугасної міни ПФМ-1 «Лепесток». За день до цього один з керівників батальйону «Азов» Захар Лавреньтев заявив , Що російські війська використовували ці міни біля селища Широкино під Маріуполем. Саме це повідомлення і було видалено зі статті у Вікіпедії. Існують також правки цього користувача в резонансних статтях інших мовних версій.

У разі конкретної статті повна історія правок доступна по посиланню над назвою статті.

Оскільки ресурс Вікіпедії доступний для кожного, цим активно користуються також зловмисники. Але саме через свою відкритість будь-яку спробу приховування фактів, дезінформації або вандалізму можна відстежити. І багато учасників цього проекту по всьому світу працюють над зменшенням впливу вандалів і пропагандистів на якість онлайн-енциклопедії. Технологія ORES також продовжує удосконалення в декількох напрямках - додавання нових мов або зменшення впливу суб'єктивних оцінок - і запрошує всіх зацікавлених до участі.

Автор: Тарас Назарук, для Stopfake.org .