Automatyczna ocena jakości Wikipedii w różnych językach

Niniejszy artykuł przedstawia przegląd prac naukowych na temat oceny jakości Wikipedii w różnych językach. Pomimo faktu, że ta ogólnodostępna encyklopedia jest często krytykowana za niską jakość informacji, nadal pozostaje jedną z najpopularniejszych baz wiedzy na świecie. Obecnie Wikipedia znajduje się na 5 miejscu wśród najczęściej odwiedzanych witryn na świecie (po Google, YouTube, Facebook, Baidu).

Wikipedia, DBpedia a polski rynek sztuki: wzbogacanie danych oraz analiza częstości występowania pojęć w opisach obrazów i artystów

Wikilinki to wewnętrzne hiperłącza w Wikipedii, popularnej internetowej encyklopedii. Unikatowy identyfikator artykułu jest ukryty pod tzw. formą powierzchniową, która jest gramatycznym dopasowaniem danego hasła do kontekstu, w jakim występuje. Tym samym każde hasło może mieć wiele form powierzchniowych.

Cechy artykułów oraz metody ich ekstrakcji na potrzeby oceny jakości informacji w Wikipedii

Celem artykułu jest przedstawienie i klasyfikacja cech pozwalających na automatyczną ocenę jakości informacji zawartych w artykułach w Wikipedii. Na podstawie analizy literatury oraz własnych doświadczeń określono miary związane z artykułami, opisujące różne aspekty jakości.

Zastosowanie regresji logistycznej w ocenie jakości informacji na przykładzie Wikipedii

Wykorzystanie regresji logistycznej w ocenie jakości danych może mieć szczególne znaczenie w dobie big data, gdzie mamy do czynienia z wieloma zmiennymi opisującymi dane zjawiska lub zachowania. Obliczenie rzeczywistej wartości informacji pozwala na wyeliminowanie tych zmiennych, które niewiele „wnoszą” do opisywanego zjawiska.
Polski
English
Русский