Jakość artykułów Wikipedii oraz ważne źródła informacji na temat firm

Praca naukowa pracowników Katedry Informatyki Ekonomicznej UEP została opublikowana w monografii „Information Technology for Management: Approaches to Improving Business and Society” wydanej przez wydawnictwo Springer. Praca koncentruje się na automatycznej ocenie jakości artykułów Wikipedii oraz badaniu wiarygodności źródeł informacji o firmach w różnych językach.

W ramach tych badań naukowych zostało przeanalizowano ponad 500.000 artykułów na temat firm pochodzących z 310 różnych wersji językowych Wikipedii. W celu identyfikacji takich artykułów zostały wykorzystane dane z DBpedii oraz Wikidanych. Następnie zostały wyekstrahowane i przeanalizowane przypisy zawarte w tych artykułach, co pozwoliło na zidentyfikowanie ważnych źródeł informacji. W tym procesie zastosowano trzy różne modele oceny źródeł, co umożliwiło stworzenie rankingu najważniejszych źródeł informacji o firmach dla każdej wersji językowej Wikipedii.

Praca pt. „Companies in Multilingual Wikipedia: Articles Quality and Important Sources of Information” jest dostępna na stronie wydawnictwa Springer. publikacji naukowej. Autorzy publikacji: Włodzimierz Lewoniewski, Krzysztof Węcel, Witold Abramowicz.

Jakość informacji oraz wiarygodność źródeł w Wikipedii

Wikipedia, ze względu na swoją otwartą strukturę, pozwala każdemu na dodawanie i modyfikowanie treści. Choć ma to pewne korzyści, jak możliwość szybkiego aktualizowania informacji i pokrywania szerokiego zakresu tematów, które mogą nie znaleźć się w konwencjonalnych encyklopediach, wiąże się też z ryzykiem. Właśnie ze względu na tę otwartość, niektóre informacje mogą być nieprawdziwe, stronnicze lub mylące. Co więcej, jakość artykułów na Wikipedii jest zróżnicowana – niektóre są dobrze napisane i oparte na solidnych źródłach, podczas gdy inne mogą być niepełne, przestarzałe, subiektywne lub niejasne. Stąd też konieczność oceny jakości i weryfikacji źródeł informacji.

Ewaluacja informacji i źródeł nie tylko może przyczynić się do utrzymania wysokiego standardu treści na Wikipedii, ale także może być niezbędna dla firm dążących do efektywnego zarządzania swoim wizerunkiem i relacjami publicznymi. Metody przedstawione w tej publikacji mogą pomóc redaktorom Wikipedii w identyfikacji artykułów, które wymagają poprawy. Ponadto, zaprezentowane modele oceny wiarygodności źródeł mogą wskazać strony internetowe, które są wiarygodnym źródłem informacji o firmach.

Wikidane oraz DBpedia

Bazy danych o charakterze semantycznym, takie jak DBpedia i Wikidane, oferują mnóstwo możliwości, szczególnie dla osób pracujących z analizą danych, badaniami naukowymi, sztuczną inteligencją, czy tworzeniem aplikacji opartych na danych. Takie semantyczne bazy danych umożliwiają efektywne łączenie danych z różnych źródeł, co pozwala na tworzenie nowych, bogatych zestawień danych z różnych dziedzin. W dodatku, dzięki zastosowaniu semantycznych relacji między danymi, bazy te są w stanie lepiej interpretować kontekst danych. Na przykład, jeżeli dwa obiekty są połączone relacją „jest rodzicem”, baza danych „rozumie”, że istnieje pewien typ relacji między tymi obiektami.

DBpedia, Wikidane i inne semantyczne bazy danych są otwarte dla wszystkich i obejmują informacje na wiele tematów. Stanowią więc nieocenione źródło informacji dla naukowców i twórców aplikacji. Warto podkreślić, że bazy danych o charakterze semantycznym są niezwykle przydatne w dziedzinie sztucznej inteligencji, zwłaszcza w kontekście uczenia maszynowego i przetwarzania języka naturalnego. Mogą one służyć do trenowania modeli, tworzenia systemów rekomendacyjnych, rozpoznawania nazw własnych, odpowiadania na pytania, a nawet budowy chatbotów.

Polski
English
Русский