Praca doktorska o Wikipedii została wyróżniona w konkursie NTIE

W XXIII Edycji Konkursu Naukowego Towarzystwa Informatyki Ekonomicznej na najlepsze prace dyplomowe w dziedzinie informatyki ekonomicznej nagrodzone zostały osoby związane z Katedrą Informatyki Ekonomicznej Uniwersytetu Ekonomicznego w Poznaniu.

W grupie prac doktorskich trzecie miejsce uzyskał dr Włodzimierz Lewoniewski za pracę pt. „Metoda porównywania i wzbogacania informacji w wielojęzycznych serwisach wiki na podstawie analizy ich jakości„. Promotorem pracy był prof. dr hab. Witold Abramowicz, promotorem pomocniczym był dr hab. Krzysztof Węcel prof. UEP.

Źródło: Instytut Informatyki i Ekonomii Ilościowej

Ocena jakości i wzbogacanie informacji w wielojęzycznej Wikipedii

Obecnie Wikipedia posiada ponad 54 milionów artykułów w ponad 300 wersjach językowych. Mimo swojej popularności ta encyklopedia internetowa jest często krytykowana za niską jakość informacji. Jednak w zależności od tematu oraz wersji językowej można znaleźć tam wartościowe treści. Wykorzystując algorytmy uczenia maszynowego i semantyczną reprezentację Wikipedii w innych bazach wiedzy (np. DBpedia) można w sposób automatyczny porównać te informacje w różnych wersjach językowych oraz wybrać te najlepsze (o najwyższej jakości).

W ramach rozprawy doktorskiej zostały opracowane narzędzia, które wyznaczały wartości miar na podstawie danych w różnych formatach oraz z wykorzystaniem różnych źródeł. W badaniach naukowych zostały przeanalizowane dane całkowitą objętością ponad 10 terabajtów oraz wyznaczono ponad miliard wartości miar jakości w różnych wersjach językowych Wikipedii. Eksperymenty wykazały, że w tematach lokalnych informacja o najwyższej jakości jest umieszczona zazwyczaj w odpowiedniej wersji językowej. Na przykład, informacja o polskich miastach jest zazwyczaj najlepsza w polskojęzycznej wersji Wikipedii.

Na podstawie lokalnych oraz międzynarodowych tematów zostały zbudowane również modele jakości dla oceny szczególnie ważniej części artykułów Wikipedii – infoboksów, które umieszczane zazwyczaj w górnej części artykułu i zawierają najważniejsze informacje o podmiocie. W tym przypadku pomiar popularności może pomóc w ocenie jakości infoboksów. To jest związane z faktem, że pewna część użytkowników może szybko zauważyć nieaktualne lub nieprawidłowe informacje. Dlatego jeśli artykuł jest popularny w tym języku – wówczas korekty mogą nastąpić szybciej. Przedstawione w prace doktorskiej modele automatycznej oceny jakości mogą być wykorzystane do automatycznego wzbogacenia różnych wersji językowych Wikipedii. Część badań została przeprowadzona przy użyciu danych z DBpedii.

Przykład wzbogacenia białoruskiej Wikipedii o infoboks opisujący Uniwersytet Ekonomiczny w Poznaniu

Więcej informacji na temat oceny jakości i wzbogacania informacji w Wikipedii można znaleźć w publikacjach naukowych.

Polski
English
Русский