Wikipedia, DBpedia a polski rynek sztuki: wzbogacanie danych oraz analiza częstości występowania pojęć w opisach obrazów i artystów

Wikilinki to wewnętrzne hiperłącza w Wikipedii, popularnej internetowej encyklopedii. Unikatowy identyfikator artykułu jest ukryty pod tzw. formą powierzchniową, która jest gramatycznym dopasowaniem danego hasła do kontekstu, w jakim występuje. Tym samym każde hasło może mieć wiele form powierzchniowych. Wykorzystując to, można w sposób automatyczny wykrywać pojęcia (hasła w Wikipedii) w opisach dzieł i artystów udostępnianych przez domy aukcyjne, wychodząc od wyszukiwania pojawiających się w nich form powierzchniowych. W połączeniu z tradycyjnymi ilościowymi metodami badania rynku sztuki wykorzystującymi regresję liniową podejście to pozwala na wykrycie m.in. popularnych motywów i w konsekwencji zbadanie ich istotności statystycznej oraz wpływu na cenę sprzedaży poszczególnych dzieł.

Publikacja dostępna jest w następujących serwisach:

Polski
English
Русский