Opis

Rafał Gibas 8-)coolgibas@gmail.com

Wiki papers

wiki_papers

:!::!: Dokuwiki plugin for presenting paper statistics for given persons from number of existing sources, including the BPP the DBLP the CiteSeerX.

Explicitly describe the APIs of the above sites!

In the wiki one writes e.g.:

^Osoba^BPP:2008^BPP:2008:LNCS^BPP:2008:IF^DBPL:2008^
<papers>
Nalepa Grzegorz|http://home.agh.edu.pl/gjn, BPP:2008, BPP:2008:LNCS, BPP:2008:IF, DBPL:2008
</papers>

and gets

OsobaBPP:2008BPP:2008:LNCSBPP:2008:IFDBPL:2008
Nalepa Grzegorz142011

Spotkania

Mail2

Zmiany: Dodałem funkcjonalność pozwalającą podać adresy URL, na podstawie których będą generowane pozostałe.

Składnia:

dblpurl:http://dblp.uni-trier.de/db/indices/a-tree/o/Ogiela:Marek_R=.html;;
bppurl:http://www.bpp.agh.edu.pl/bpp-show.phtml?s=b1&aut=1088;;

Dzięki temu mamy pewność znalezienia autora w bazie, oszczędzając jednocześnie na zapisie:

BPP:2008;;
DBLP:2005;;

Zamiast

BPP:2008;http://www.bpp.agh.edu.pl/bpp-show.phtml?s=b1&aut=1088&R=2008;;
DBLP:2005;http://dblp.uni-trier.de/db/indices/a-tree/o/Ogiela:Marek_R=.html;;

Pobierz

Mail1

wiki_papers-2.tar.gz

Zmiany:

  1. rezygnacja z XML w przeszukiwaniu DBLP
  2. modyfikacja capytania cURL (ominięcie blokady safe_mode i open_basedir na serwerze php)

Mam nadzieję, że teraz to zadziała :)

090604

Wiki Papers Howto

Wiki Papers beta

Dodano:

  1. Edytowalny tytuł (title:Publikacje Pana Bolesława Brzęczysława;;)
    • w nagłówku tabeli
    • w tytule wykresu
  2. Poprawki
    • opcja EXTRASPAN dla wykresów, w których napisy pod osią nakładają się
    • Ścieżki
    • Integracja z wiki

090528

Wiki Papers beta

Dodano:

  1. Wyszuliwanie publikacji w zakresie lat (np. DBLP:2007-2008;;)
  2. Edytowalne nagłówki (headers:Nazwisko;2006;2007-2008)
  3. Poprawki

20090507

  • Time limit dla wykonywania podzapytań
    Miał być monit, że dane nie zostały prawidłowo przetworzone z powodu minięcia określonego czasu. Badanie upływu czasu, czy raczej kontrola, czy zadanie nie wykonuje się zbyt długo, wymagają moim zdaniem użycia wątków. Na chwilę obecną (moje okno nie jest na to otwarte) nie mogę tego wykonać.

Tymczasowo rozwiązałem to resetowanym limitem czasowym (set_time_limit) przy wywoływaniu każdego zapytania curl.

  • Zrezygnowałem z dodatkowej opcji wyszukiwania w DBLP (Advanced Search)
    Standardowe wyszukiwanie działa prawidłowo. Advanced Search używa JavaScript do przekierowywania na stronę z wynikami zapytania. Obejście tego interfejsu okazuje się dodatkową, niepotrzebną pracą.
  • Zaimplementowałem wyświetlanie w postaci:
    • tekstu (domyślnie)
    • tablicy
      • z użyciem nagłówków (automatyczne dopasowanie kolumn)
        • ewentualna koncepcja przemianowania nagłówków tablicy, np.:
          headers:Autor;2007;2008;2009;;
      • z pominięciem nagłówków (rozmieszczenie jak w tekście źródłowym)
        Nie ma możliwości dodania samych nagłówków do tablicy (umieszczenie ^nagłówek1^..^ wypisze osobną tablicę z nagłówkami).
    • pracuję nad wykresem słupkowym

20090423

  • Składnia Wiki Papers (przykład):
<papers>
    author:Kowalski;http://www.kowalski.com/;;
    headers:Autor;2006;2007;2008;Ogółem;;
    title:Publikacje Jana Kowalskiego;;
    options:TABLE;TEXT;CHART;CODE;HIDEAUTHOR;NOHEADERS;SHOWINFO;EXTRASPAN;;        // Zbiór możliwych opcji
    //     :  +     +     +    +     +          +          +        +              // "-" = NZJ

// ogółem:
//  BIBLIOGRAFIA:OPCJE;http://www.strona;ROK;;
//              :     ;                 ;   ;;   <- separatory
//  po określeniu rodzaju, kolejność opcji nie gra roli; liczy się natomiast typ wartości (rok (liczba), adres strony (od "http://"), opcje (pozostałe, oddzielane przez ":"))

    DBLP:2006;http://dblp.blebleble...;;
    DBLP:2008;;
//  DBLP:2006;EXTRA;; // Porzucone: Advanced Search używa JavaScript do przekierowania na stronę z wynikami. Zwyczajne wyszukiwanie działa wystarczająco dobrze.

    BPP:2006;;
    BPP:IF;2005;;
    BPP:LF;2005;;
    BPP:MNiSW;http://bpp.blebleble...;;
    BPP:LNCS;2003;;

    author:Chuck Norris;;    // Kolejny autor
    DBLP:http://www.dblp.bleble.chuck;;  // Kolejne publikacje

//  CiteSeerX:2002;; // NZJ
</papers>
  • Dodano:
    • BPP:LF;; ← twórcy bpp naprawdę nie widzą różnicy między LF a IF
    • BPP:LNCS;; (tylko wystąpienia 'LNCS')

Widać jeszcze drobne problemy, kiedy nie podamy stricte URL - nic nie stoi jednak na przeszkodzie, żeby podać URL w edytorze strony.

20090402

  • dblp ready

Pracuję nad umieszczeniem tego w Wiki

  1. nie mam jeszcze opracowanej składni
  • bpp proto

Prototyp jest, sprawdza publikacje, IF, MNiSW

  • dla bpp sumowanie punktów MNiSW dla danego roku

OK, zliczam wystąpienia.

20090319

20090305

Dotychczasowe wyniki

DBLP

Udało mi się przygotować skrypt php pozyskujący dane z DBLP. Dane o ilości publikacji pozyskiwane są poprzez zliczenie wierszy w tabeli pod danym rokiem (wersja standardowa wyszukiwania).

Trudnościami, jakie napotkałem, były:

  • Nieodpowiednio napisany kod html - konieczność odszukiwania i niwelowania podejrzanych tagów (występował niezamykany <img>, </ul> bez rozpoczęcia)
  • Nie udało mi się wywołać bardziej zaawansowanych poleceń XPath - konieczność zaimplementowania przeszukiwania danych XML.
  • Niedziałający cURL i file_get_content() na serwerze student - konieczność działania na localhoście (na przykład).

Cele

  • Integracja z dokuWiki
  • Zaimplementowanie pozostałych statystyk
  • Wykresy

Narzędzia

Przydatne, choć dla DBLP można prościej z file_get_contents($url) (mniej opcji i przekierowania domyślne).

20090219

Wpisując na stronie http://dblp.mpi-inf.mpg.de/dblp-mirror/index.php w pole formularza w nazwisko i datę „Nalepa 2008” otrzymujemy zapytanie http://dblp.mpi-inf.mpg.de/dblp-mirror/index.php#query=Nalepa%202008&qp=H1.11:F1.4:F2.4:F3.1. Odpowiedzią są publikacje w roku 2008.

Ilość publikacji zawarta jest w: span id=„autocomplete_H_boxes_1_subtitle”
zawierającym tekst: „zoomed in on 11 documents”
lub: „No hints” przy braku dopasowania.

Gotowy do współpracy.

biblioteka_agh_-_wyprawa_po_informacje

Projekt

Sprawy bieżące

Przeglądnąć źródła/podobne strony:

Wypisać spostrzeżenia/wnioski dla istniejących biuletynów.

  • jakość wykonania
  • funkcjonalności

Przestrzeń robocza

BPP

Informacje o publikacjach z BPP pozyskać można za pomocą formularza. Dla potrzeb projektu można wygenerować żądanie http odpowiadające metodzie GET wołanej z formularza.

Formularz wyszukiwania

Metoda: GET
Akcja: /bpp-show.phtml?s=c
Na: http://www.bpp.agh.edu.pl

Polenamemożliwe wartości
Nazwisko autora fsA tekst
Tytuł fsT tekst
Źródło fsZ tekst
Zakres lat od odR rok (0 wszystkie)
Zakres lat do doR rok (0 wszystkie)
Jednostka fsW nr wydziału/jedn. (0 wszystkie)
Typ publikacji fsRP nr (-1 wszystkie rodzaje)
LF fsImFa checkbox
ukryty s „c”
ukryty stf 1

Widać tutaj pewne niedociągnięcia w konwencji indeksowania - „-1”.

Pozyskiwanie liczby publikacji

Publikacje wyświetlone w wyniku zapytania pojawiają się na liście o identyfikatorze ol-opis. Aby pozyskać ich liczbę sugerowałbym użyć XPATH.

Działanie/uwagi dot. serwisu BPP

=== Autorzy systemu BPP === Jacek Kmiecik jk@uci.agh.edu.pl, Marek Wójtowicz wumarex@uci.agh.edu.pl — Uczelniane Centrum Informatyki, tel. (617-)34-77.

DBLP

CiteSeerX

Formularz wyszukiwania

Metoda: GET
Akcja: http://citeseer.ist.psu.edu/cs
ENCTYPE: application/x-www-form-urlencoded|mainform

PolenameWartość/typ
hiddencs1
Findqtext
submitsubmitDocuments
submitsubmitCitations
hiddencoCitations
hiddencm50 ← max citations?
hiddencfAny
hiddenaoCitations
hiddenam20
hiddenafAny

Biblioteka AGH - Wyprawa po informacje

LF a IF

Aby wyjaśnić wątpliwości dotyczące kwestii dostępności na liście filadelfijskiej wyłącznie publikacji posiadających impact factor, udałem się do Oddziału Informacji Naukowej Biblioteki Głównej AGH. Tam uzyskałem odpowiedź:

  • Na liście filadelfijskiej znajdują się zarówno zbiory posiadające, jak i nieposiadające impact factor.

Pozyskiwanie danych z BPP

Dodatkowo poinformowawszy, że mam zamiar pozyskiwać pewne informacje z BPP w ramach projektu z MIW, usłyszałem:

  • Biblioteka oraz odpowiednie jednostki (autorzy_systemu_bpp/właściciele BD) powinny zostać poinformowane o pozyskiwaniu z nich danych do dalszego udostępniania.

Wobec tego mam pytanie, czy musimy informować odpowiednie jednostki, skoro informacje pobrane z BPP są tylko wyświetlane w bardzo ograniczonej formie i nie są przechowywane w AiWiki.

Kolejnym pytaniem jest, czy AiWiki jest widoczne wyłącznie z sieci AGH. Jeśli tylko wewnątrz sieci, to wystarczy nam tylko uspokoić Panie z Biblioteki, że informacje nigdzie nie wypływają.

Kosz

Zauważyłem na stronie BPP co nieco błędów, które mogą przeszkadzać trochę w pozyskiwaniu informacji:

  • błędy w XHTML * nie zawsze zamknięte tagi * strony napisane na sztywno (te same fragmenty kodu wyglądają różnie w zależności od przypadku użycia)
  • formularzy jest kilka dla tego samego rodzaju zapytania
    • nazwy pól niosących te same informacje bywają różne

Sprawozdanie

Prezentacja

Materiały

Opis współczynnika Impact Factor

Współczynnik Impact Factor (IF) jest podstawowym kryterium oceny i porównania czasopism pod względem ich wartości naukowej.

IF to wskaźnik wpływu czasopisma na środowisko naukowe, świadczący o tym, jak często cytowania artykułów opublikowanych w tym czasopismie pojawiają się w pracach naukowych na całym świecie. Impact Factor dla czasopisma jest obliczany przez podzielenie liczby cytowań artykułów z danego czasopisma przez liczbę artykułów opublikowanych przez to czasopismo w tym samym okresie 2 lat.

Źródło: BPP AGH

Lista Filadelfijska

Termin lista filadelfijska oznacza wykaz czasopism i serii naukowych indeksowanych w bibliograficznych bazach danych, tworzonych przez ISI w Filadelfii (aktualnie ISI opracowuje i udostępnia kilkanaście baz danych). Wykaz ten nazwał skrótowo listą filadelfijską Andrzej Kajetan Wróblewski i nazwa ta przyjęła się w Polsce na dobre. Właściwa jednak i pełna nazwa listy to Thomson Scientific Master Journal List. (Thomson przejął ISI w 2004 roku.) Lista dostępna jest w wersji elektronicznej na stronie domowej tego instytutu pod adresem: http://www.isinet.com/cgi-bin/jrnlst/jloptions.cgi?PC=master

Źródło: BPP AGH

Lecture Notes in Computer Science

pl/miw/2009/miw09_wiki_papers.txt · ostatnio zmienione: 2017/07/17 08:08 (edycja zewnętrzna)
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0