Jakość otwartych danych

Celem warsztatu Quality of Open Data (QOD) jest zrzeszenie różnych społeczności, które pracują w obszarze jakości informacji w Wikipedii, DBpedii, Wikidanych i innych otwartych bazach wiedzy. Warsztaty przewidują prezentacje wyników badań, dyskusje oraz wymianę doświadczeń związanych z oceną jakości otwartych danych.

Wykład o jakości Wikipedii w I LO w Poznaniu (Marcinek)

14 marca 2018 roku podczas obchodów Międzynarodowego Dnia Liczby Pi dla uczniów I Liceum Ogólnokształcącego im. Karola Marcinkowskiego w Poznaniu mgr Włodzimierz Lewoniewski przeprowadził wykład otwarty na temat automatycznej oceny jakości informacji w wielojęzycznej Wikipedii.

Automatyczna ocena jakości Wikipedii w różnych językach

Niniejszy artykuł przedstawia przegląd prac naukowych na temat oceny jakości Wikipedii w różnych językach. Pomimo faktu, że ta ogólnodostępna encyklopedia jest często krytykowana za niską jakość informacji, nadal pozostaje jedną z najpopularniejszych baz wiedzy na świecie. Obecnie Wikipedia znajduje się na 5 miejscu wśród najczęściej odwiedzanych witryn na świecie (po Google, YouTube, Facebook, Baidu).

Wikipedia, DBpedia a polski rynek sztuki: wzbogacanie danych oraz analiza częstości występowania pojęć w opisach obrazów i artystów

Wikilinki to wewnętrzne hiperłącza w Wikipedii, popularnej internetowej encyklopedii. Unikatowy identyfikator artykułu jest ukryty pod tzw. formą powierzchniową, która jest gramatycznym dopasowaniem danego hasła do kontekstu, w jakim występuje. Tym samym każde hasło może mieć wiele form powierzchniowych.

Cechy artykułów oraz metody ich ekstrakcji na potrzeby oceny jakości informacji w Wikipedii

Celem artykułu jest przedstawienie i klasyfikacja cech pozwalających na automatyczną ocenę jakości informacji zawartych w artykułach w Wikipedii. Na podstawie analizy literatury oraz własnych doświadczeń określono miary związane z artykułami, opisujące różne aspekty jakości.

Zastosowanie regresji logistycznej w ocenie jakości informacji na przykładzie Wikipedii

Wykorzystanie regresji logistycznej w ocenie jakości danych może mieć szczególne znaczenie w dobie big data, gdzie mamy do czynienia z wieloma zmiennymi opisującymi dane zjawiska lub zachowania. Obliczenie rzeczywistej wartości informacji pozwala na wyeliminowanie tych zmiennych, które niewiele „wnoszą” do opisywanego zjawiska.

Analiza porównawcza modeli klasyfikacyjnych w kontekście oceny jakości artykułów Wikipedii

W niniejszym artykule dokonujemy analizy porównawczej modeli klasyfikacyjnych (w tym CART, las losowy, wzmacniane drzewa, C4.5, C5.0, SVM, sieci neuronowe) dla automatycznej oceny jakości artykułów w 7 wersjach językowych Wikipedii (białoruska, niemiecka, angielska, francuska, polska, rosyjska, ukraińska). Przedmiotem naszego zainteresowania były modele dostępne w takich narzędziach analitycznych jak STATISTICA, WEKA oraz R Studio. Do klasyfikacji ...

Względna ocena jakości i popularności artykułów wielojęzycznej Wikipedii

W specjalnym wydaniu „Quality Management in Big Data” czasopisma Informatics, ukazał się artykuł naukowy o względnej ocenie jakości i popularości ponad 28 mln artykułów Wikipedii w 44 różnych wersjach językowych. Artykuł jest opublikowany na zasadach otwartego dostępu.

Nagroda za najlepszy artykuł

Praca pt. „Analysis of References Across Wikipedia Languages” została wyróżniona na międzynarodowej konferencji ICIST 2017 (The 23rd International Conference on Information and Software Technologies).

Konferencja ICIST 2017 (wideo)

W dniach 12–14 października w Druskienikach odbyła się międzynarodowa konferencja ICIST 2017, na której został wygłoszone referaty pt. „Relative Quality and Popularity Evaluation of Multilingual Wikipedia Articles” oraz „Using Morphological and Semantic Features for the Quality Assessment of Russian Wikipedia”.
Polski
English
Русский