Praca naukowa na temat automatycznej identyfikacji ważnych źródeł informacji na określone tematy w wielojęzycznej Wikipedii na podstawie analizy ponad 230 milionów przypisów (referencji) została opublikowana na stronie wydawnictwa Elsevier została opublikowana. W ramach tych badań zostały przedstawione różne modele automatycznej oceny źródeł informacji, które uwzględniają częstotliwość występowania badanych źródeł, popularność treści ze strony edytorów oraz czytelników Wikipedii.
W celu przeprowadzenia badań artykuły Wikipedii zostały podzielone na 70 tematów o różnym poziomie abstrakcji, które dotyczą takich obszarów jak: kultura, geografia, historia, społeczeństwo, nauka, technologia, inżynieria i matematyka. Dysponując informacją o przypisach wydobytych z poszczególnych artykułów Wikipedii, można zbadać, na ile dobrze poszczególne tematy Wikipedii oferują weryfikowalne informacje w różnych wersjach językowych. Poniższy rysunek przedstawia wartości dotyczące gęstości referencji dla każdego z 70 tematów oraz 42 wersji językowych Wikipedii.
Dodatkowo w ramach badań zostały zidentyfikowane naukowe źródła informacji, co pozwoliło na określenie różnic pomiędzy wersjami językowymi pod kontem wartości wskaźnika Sci. Na przykład, w najbardziej rozbudowanej angielskiej wersji Wikipedii udział naukowych źródeł informacji wynosi około 2,6%, w wersji polskiej – 0,76%, w rosyjskiej – 1,19%, w niemieckiej – 1,2%, we francuskiej – 1,12%, w hiszpańskiej – 1,44%, w chińskiej – 0,74%, w japońskiej – 1,08%, w arabskiej – 2,86%.
Wyniki badań naukowych zostały przedstawione podczas konferencji KES 2022. Publikacja jest dostępna pod adresem: doi.org/10.1016/j.procs.2022.09.387