Konferencja IJCAI 2025: automatyczna analiza neutralności treści w Wikipedii

Neutralny Punkt Widzenia (ang. Neutral point of view, NPOV) jest jedną z podstawowych zasad obowiązujących w Wikipedii. Zgodnie z nią treści powinny być przedstawiane obiektywnie, z uwzględnieniem wszystkich istotnych punktów widzenia, bez faworyzowania jednej perspektywy.

Ze względu na otwarty charakter edycji Wikipedii utrzymanie tej zasady stanowi istotne wyzwanie – redaktorzy mogą nieświadomie przenosić do artykułów własne uprzedzenia i emocje. W związku z tym rośnie znaczenie metod umożliwiających automatyczne monitorowanie stopnia neutralności treści.

Analiza wydźwięku

Analiza wydźwięku (ang. sentiment analysis) to technika uczenia maszynowego stosowana powszechnie w badaniach opinii w mediach społecznościowych, recenzjach czy komentarzach. Pozwala ona klasyfikować treści jako pozytywne, neutralne bądź negatywne. Najczęściej jednak stosowana jest do krótkich i nieformalnych tekstów, co utrudnia jej bezpośrednie wykorzystanie w przypadku artykułów encyklopedycznych. Teksty Wikipedii cechują się bowiem większą długością oraz bardziej sformalizowaną strukturą.

Prezentacja badań na IJCAI 2025

Podczas międzynarodowej konferencji naukowej IJCAI 2025 (34th International Joint Conference on Artificial Intelligence), która odbyła się w Montrealu (Kanada) w sierpniu 2025 roku, została przedstawiona praca zatytułowana „Cross-Topic Sentiment Analysis of Wikipedia Articles: A Comparative Study of AI Models”. Autorzy pracy: dr Włodzimierz Lewoniewski, dr Milena Stróżyna, mgr Izabela Czumałowska, mgr inż. Aleksandra Wojewoda, dr hab. Krzysztof Węcel, prof. UEP.

W ramach wystąpienia zostały wyniki analizy niemal 7 milionów artykułów anglojęzycznej Wikipedii z wykorzystaniem czterech modeli analizy wydźwięku: oparte na słownikach (TextBlob, VADER) oraz transformatorach (RoBERTa, DistilBERT).

Badania wykazały, że:

  • wydźwięk artykułów Wikipedii znacząco różni się w zależności od tematyki treści,
  • poszczególne modele generują odmienne oceny wydźwięku, co podkreśla znaczenie wyboru narzędzia w analizach tego typu,
  • możliwe jest stworzenie praktycznych narzędzi wspierających monitorowanie neutralności treści w Wikipedii w skali całej encyklopedii.

Dodatkowo badacze udostępnili na platformie Hugging Face zbiór danych zawierający wyniki klasyfikacji wydźwięku artykułów Wikipedii uzyskane za pomocą zastosowanych modeli.

Znaczenie badań

Praca wnosi wkład w rozwój metod automatycznej oceny jakości treści w Wikipedii. W odróżnieniu od wcześniejszych badań skupionych na krótkich fragmentach tekstów, zaprezentowane podejście obejmuje pełną anglojęzyczną Wikipedię. Dzięki temu możliwe jest systematyczne monitorowanie przestrzegania zasady Neutralnego Punktu Widzenia na jednej z najważniejszych platform wiedzy online.

Proponowana metodologia może być także zastosowana w ocenie jakości i wiarygodności innych zasobów internetowych, co ma znaczenie w kontekście walki z dezinformacją i zapewniania rzetelnych źródeł wiedzy w Internecie.

Polski
English
Русский