Od momentu powstania i wzrostu popularności Wikipedii pojawia się coraz więcej prac naukowych dotyczących oceny jakości jej zawartości. Jednym z pierwszych badań związanych z automatyczną oceną jakości Wikipedii jest praca pt. „Assessing information quality of a community-based encyclopedia” (autorzy: Besiki Stvilia, Michael B. Twidale, Linda C. Smith, Les Gasser).
Ta praca wykazała, że pomiar objętości może pomóc w określeniu stopnia „dojrzałości” artykułu. W artykule przedstawiono metodologię konstruowania wskaźników i wyników badań, razem z charakterystykami statystycznymi artykułów Wikipedii.
Badania przeprowadzono na artykułach angielskiej wersji Wikipedii. Badane były następujące parametry:
- Długość artykułu (liczba znaków)
- Liczba linków wewnętrznych
- Liczba niedziałających linków wewnętrznych
- Liczba linków zewnętrznych
- Liczba ilustracji
- Szum informacyjny
- Wskaźnik Flescha
- Wskaźnik Kincaida
- Liczba edycji
- Liczba przywróceń edycji
- Liczba unikatowych autorów
- Różnorodność (# liczba unikalnych autorów / łączna liczba edycji)
- Udział edycji administratorów (liczba edycji administratorów / Całkowita liczba edycji)
- Liczba edycji przez anonimowych użytkowników
- Mediana czasu przewrócenia edycji (w minutach)
- Aktualność (różnica czasu pomiędzy dniem zrzutu oraz datę ostatniej aktualizacji artykułu)
- Wiek artykułu (w dniach)
oraz miary:
- Wiarygodność/reputacja autorów artykułu
- Kompletność artykuł
- Złożoność tekstu
- Informatywność artykułu
- Spójność artykuł
- Aktualność artykułu
- Zmienność artykułu
Tekst pracy naukowej można znaleźć tutaj.
Bardziej współczesne badania na temat automatycznej oceny jakości informacji w Wikipedii w różnych wersjach językowych można znaleźć na stronie Publikacje.