Pokaż źródło strony

Ostatnie zmiany Indeks

AIwiki

Strona Główna

Dla Studentów

Zima / Winter 2021:

Computer Science: Introduction to AI
ISI: Podstawy Sztucznej Inteligencji

Old specialized AI courses

SMaDA/SMaIDA/AIDA

1. semester:

2. semester:

WSHOP -- Development Workshop

Informatyka (EAIiIB)

1. rok:

2. i 3. rok:

4. rok:

Systemy i technologie wirtualizacji

Studia Dr

HeKatE

Public

The KESE workshop (EN only)
Mindstorms (archive)

To jest stara wersja strony!

SemWeb_RDFStore

Dawid Molenda dawid at molenda.info

RDF Stores - investigate the tools' functionality & possibilities
importing data from Relational Databases into RDF Triple Stores › examples, applications
importing data from various sources (spreadsheets, databases, other…) into RDF Triple Stores

Spotkania

20090521

godz. 11:00

20090513

dołożyc do porównania do tabelki: swi-prolog, cliopatria
2 przypadki użycia:
- rodzina - powiązania
- miasto - wydarzenia
o dbpedii, freebase, yago etc.(opis, linki do danych)
+ to co nie zostało wgrane z poprzedniego razu

20090421

na następny raz:
- uzupelnic tabelke por. narzędzi
- wykaz istniejacych baz RDF
- ok.3 propozycje przypadkow użycia
- pdfy, prezentacje - wgrać do wiki z krótkim komentarzem

20090327

na nast. raz:
- syntetyczne porówn narz
- poczytać o RDFS/OWL
- wybrany silnik/i (sparql→niezależny od impl)
- przypadki użycia

20090312

ogólny cel projektu: poznać metody inż.wiedzy w SemWeb, w szczególności zastosowanie RDF, RDFS, OWL w praktycznych aplikacjach
stworzyć prototyp aplikacji
- baza danych RDF
- Query Engine
- GUI
na następny raz proszę przygotować (opisać w sekcji Sprawozdanie):
- architektura aplikacji Semantic Web z bazą danych w postaci RDFStore
- dostępne RDFStore → patrz linki w sekcji Materiały oraz na stronie SemanticWeb.org

Projekt

Sprawozdanie

Konwersja SQL -> RDF

Relacyjne bazy danych pozwalają na to aby tabela miała dowolną liczbę kolumn których wiersz wyraża informację dotyczącą predykatu w logice pierwszego rzędu z dowolną ilością miejsc. Taki wiersz albo predykat musi być dekomponowany do reprezentacji jako trójka RDF. Prosta forma dekompozycji wprowadza nowy pusty węzeł odpowiadający wierszowi i nowa trójka (triple) jest wprowadzona do jego każdej komórki. Temat każdej trójki to nowy pusty węzeł, predykat odpowiada nazwie kolumny, a obiektem jest wartość wprowadzona do komórki wiersza. Nowy pusty węzeł może mieć także właściwość rdf:type, której wartość odpowiada nazwie tabeli. Stąd bardziej kompleksowy fakt wyraża się w RDF przy użyciu iloczynu logicznego (logical-AND) prostej relacji dwuargumentowej. RDF nie dostarcza środków do negacji (NOT) czy alternatywy (OR). Koncepcje i Składnia Abstrakcyjna

Trójka RDF

temat (podmiot) który jest znacznikiem RDF URI lub pusty węzeł
predykat, który jest znaczniekiem RDF URI
obiekt, który jest znacznikiem RDF URI, literałem lub pustym węzłem

RDF/RDFS/OWL

W wielkim skrócie jakie są różnice:

RDF

RDFS

OWL

OWL Lite

OWL DL

OWL Full

Serializacja danych RDF

Notation3 (N3)

Turtle

Dostępne bazy wiedzy

Wikipedia

http://www.wikipedia.org/ http://download.wikipedia.org/

Wikipedia jset olbrzymią bazą wiedzy. Może być wykorzystana do testowania systemów analizy tekstu. Artykuły zawierają duże fragmenty ciągłego tekstu o łatwej do przewidzenia tematyce i co ważne są pisane względnie poprawnym, współcześnie używanym językiem.

Bardzo szybko można bydować bazę wiedzy wykrozystująć szablony używane w Infoboksach. Informacje zawarte w tej części są uporządkowane w formie tabeli klucz → wartość i dotyczą okręślonego typu obiektu (np. miasto, polityk, roślina).

Wykorzystująć linki pomiędzy wersjami językowymi można uzyskać nazwy pojęć w wielu językach (te linki znajdują się w osobnej tabeli 'langlinks', więc nie trzeba analizować treści artykułów).

Przekierowania mogą być wykorzystane do budowy bazy równoznacznych nazw pojęć (także znajdują sie w osobnej tabeli 'redirects').

Kategorie porządkują pojęcia w zbiory dotyczące określonego tematu. Niestety panuję tu duża dowolność i wiele pojęć nie jest przypisanych do odpowiedniej kategorii. Kategorie są opisane w tabeli 'category'.

Kolejnym elementem są linki zewnętrzne, są opisane w osobnej tabeli 'externallinks'. Zazwyczaj trafnie powiązują strony internetowe z danym pojęciem, dodatkowo część posiada tytuł, który opisuje zewnętrzną stronę.

Wikipedii nie ma sensu analizować pobierając strony poszczególnych haseł, należy ściągnąć zrzuty bazy danych i załadować na lokalny serwer. Dane haseł (wraz z treścią) są dostępne w postaci pliku xml, pozostałe dane jako tabele MySQL. Problemem może być rozmiar danych, dla angielskiej wersji XML ma 21GB, a tabele SQL ponad 100 000 000 wierszy.

DBpedia

http://wiki.dbpedia.org/ http://wiki.dbpedia.org/Downloads32

DBpedia jest bazą wiedzy w formacie RDF (zawiera ponad 275 milionów trójek). Dane są tworzone na podstawie wikipedii (14 wersji językowych, także Polska). Opisuje ponad 2.5 miliona haseł (213,000 persons, 328,000 places, 57,000 music albums, 36,000 films, 20,000 companies).

Ontologia http://wiki.dbpedia.org/Ontology http://www4.wiwiss.fu-berlin.de/dbpedia/dev/ontology.htm

http://www.w3.org/2003/01/geo/ http://wiki.dbpedia.org/Downloads32

Interfejs HTML

Interfejs SPARQL

Zrzut bazy danych

yago

http://www.mpi-inf.mpg.de/yago-naga/yago/ http://uniat5401.ag5.mpi-sb.mpg.de:8180/view.html?entity=Albert_Einstein&n=5

Freebase

http://www.freebase.com/

UMBEL

http://www.umbel.org/

WordNET

http://wordnet.princeton.edu/

DMOZ

http://www.dmoz.org/ http://rdf.dmoz.org/ Publicznie dostępny dump bazy katalogu dmoz jest w formacie rdf, ale jest nie do końca zgodny ze standardami i są problemy z jego załadowaniem przez większość parserów.

Format RDF jest tu prawdopodobnie wykorzystywany ze względu na łatwiejsze opisanie drzewa kategorii niż w bazach relacyjnych. Baza nie jest ciekawa pod względem bezpośredniego wykorzystania w SemWeb. Istnieją gotowe narzędzia do konwersji pobranych plików na tabele SQL, np.: suckDMOZ.

DMOZ może być wykorzystany jako lista stron o wstępnie określonej tematyce (choć bardzo niedokładnie), jako taka baza URLi może być wykorzystany do budowy pająka.

Chef Moz

http://chefmoz.org/ http://chefmoz.org/rdf.html

MusicMoz

http://musicmoz.org/ http://musicmoz.org/xml/

RDF Stroes

Nazwa	Język	RDFS / OWL	Składowanie	Interfejs	Uwagi	Web
3store	C	-	MySQL Berkeley DB	RDQL and SPARQL (HTTP server) C API	do 100mln	http://sourceforge.net/projects/threestore/ http://www.aktors.org/technologies/3store/
Redland	C	-	Berkeley DB MySQL PostgreSQL AKT Triplestore (?) SQLite files URIs	SPARQL and RDQL Perl PHP Python Ruby	Raptor RDF Parser Library	http://librdf.org/
ARC	PHP	-	MySQL	SPARQL PHP		http://arc.semsol.org/
RAP	PHP	rdfs:subclass rdfs:subproperty rdfs:range rdfs:domain owl:sameAs owl:inverseOf	Memory Database	SPARQL RDQL PHP	ADOdb Library http://www.semanticscripting.org/SFSW2005/papers/Oldakowski-RAP.pdf	http://www4.wiwiss.fu-berlin.de/bizer/rdfapi/
AllegroGraph	Java	RDFS+ OWL DL	SPARQL Prolog	Bardzo wydajny Darmowy ma liczne ograniczenia – m.in. 50 mln trójek	http://www.franz.com/agraph/
Jena	Java	RDFS OWL	Memory Database	SPARQL	Możliwość wyboru zakresu RDFS i OWL Słaba wydajność RDFS/OWL dla baz danych (dobra tylko w pamięci) Dla samego RDF bardzo dobra wydajność	http://jena.sourceforge.net/
Mulgara	Java	-	Memory Database	SPARQL	RDFS/OWL planowany	http://www.mulgara.org/
Sesame	Java	?	?	?		http://www.openrdf.org/
Oracle 11g		RDFS OWL Full			Darmowy dla deweloperów	http://www.oracle.com/technology/tech/semantic_technologies/index.html

C/C++:

3store (100M)

3store is an RDF „triple store”, written in C and backed by MySQL and Berkeley DB. It is an optimisation and port of an older triple store (WebKBC). It provides access to the RDF data via RDQL or SPARQL over HTTP, on the command line or via a C API. strona na sourceforge

Redland

Redland is a set of free software libraries that provide support for the Resource Description Framework (RDF). The software is available under multiple licenses, namely GPL, LGPL, and Apache License, to simplify reuse.

Posiada biblioteki do PHP i innych jezyków

PHP:

ARC is a flexible RDF system for semantic web and PHP practitioners, developed by Benjamin Nowack. It's open-source, easy to use, and runs in most web server environments. The new version of ARC, ARC 2, is currently available for preview.

RAP, the RDF API for PHP, is a software package for parsing, searching, manipulating, serializing and serving RDF models.

Java:

AllegroGraph (1B)

AllegroGraph is a disk-based RDF Database, that aims at providing a solid storage layer for powerful geotemporal reasoning, social network analytics and ontology modeling capabilities for today's Semantic Technology applications.

Biblioteki do prologa.

Jena (1.7B/650M/200M)

Jena is a Java framework for building Semantic Web applications. It provides a programmatic environment for RDF, RDFS and OWL, SPARQL and includes a rule-based inference engine. Joseki is an HTTP engine that supports the SPARQL Protocol and the SPARQL RDF Query language. http://www.joseki.org/

Mulgara (500M)

Mulgara is a scalable open source RDF database written entirely in Java. Mulgara is an open source fork of Kowari.

Sesame

http://www.aduna-software.com/home/overview.view

Inne:

Virtuoso (1B)

Virtuoso Universal Server s a middleware and database engine hybrid that combines the functionality of a traditional RDBMS, ORDBMS, virtual database, Resource Description Framework (RDF), XML, free-text, Web Application Server, and File Server functionality in a single server product offering. Rather than have dedicated servers for each of the aforementioned functionality realms, Virtuoso is a „universal server”; it enables a single multithreaded server process that implements multiple protocols. The open source edition of Virtuoso Universal Server is also known as OpenLink Virtuoso.

Prezentacja

Materiały

Czyli zestaw, z którym trzeba się zapoznać…

Na początek

D.Allemang, J.Hendler - "Semantic Web for the Working Ontologist" - książka, dobra na początek, wyjaśnia idee semweb oraz dosyć wyczerpująco omawia RDF, RDFS i OWL, bardzo dużo przykładów
Semantic Web, Ontology, RDF, OWL - kilka haseł na wiki

Specyfikacje

Resource Description Framework (RDF) - strony w3c o RDF
RDF/XML Syntax Specification - specyfikacja RDF
Struktura Opisu Zasobów (RDF) - polskie tłumaczenie specyfikacji RDF
Web Ontology Language (OWL) - strony w3c o OWL
OWL Overview
OWL Guide
OWL Reference
OWL Semantics and Abstract Syntax

02-Shimizu.pdf - strona 14, logiczna reprezentacja predykatów OWL
icde_2008_inf_engine.pdf - prezentacja z Oracle na temat RDFS/OWL

Uniform Resource Identifier (URI): Generic Syntax - przed czytaniem o RDF trzeba wiedzieć co to jest URI, w RDF używane są URI niehierarchiczne
URI - w zasadzie wystarczy przeczytać na pl wiki

Narzędzia

RDF store - lista narzędzi na wiki semanticweb.org (nie wszystko aktualne - 5.2009)
LargeTripleStores - lista RDFStores z opisem wydajności różnych silników, już trochę nieaktualne, ale warto przeglądnąć
SemanticWebTools - lista narzędzi związanych z RDF

SPARQL - specyfikacja SPARQL na w3.org
SPARQL - SPARQL na wikipedii

pl/miw/2009/miw09_semweb_rdfstore.1242894942.txt.gz · ostatnio zmienione: 2019/06/27 15:58 (edycja zewnętrzna)

Pokaż źródło strony Poprzednie wersje

Menadżer multimediów Do góry