Autor | Jacsó, P. |
Tytuł | Google Scholar duped and deduped : the aura of „robometrics". |
Tłum. tytułu | Google Scholar oszukany i odkłamany -- aura „robometrii" |
Analiza | Liczba stron i źródeł indeksowanych przez Google Scholar (GS) (zob. BABIN 2007 z. 4 poz. 253, 256) objęta jest tajemnicą, dokonywane testy przeszukiwań dowodzą jednak, że serwis ten wyszukuje znacznie więcej rekordów niż dwie największe, wielodyscyplinarne bazy danych: {Web of Scence} i {Scopus}. Jego szeroki zasięg oraz specyfika ustawień sprawiają, że jest podatny na rozmaite manipulacje, a wyniki wyszukiwania obarczone są często licznymi błędami {(por. BABIN 2010 z. 2 poz. 104)}. W omawianym artykule przedstawiono problemy związane ze spamowaniem treści i cytowań w GS i metody wprowadzania tej wyszukiwarki w błąd. Zreferowano m.in. eksperymenty przeprowadzone przez naukowców z różnych krajów i polegające na sztucznym zawyżaniu liczby cytowań testowanych prac i autorów. Polegały one m.in. na modyfikowaniu zawartości i bibliografii załącznikowych już opublikowanych dokumentów i ich ponownym umieszczaniu w sieci w celu zmiany ich pozycjonowania, tworzeniu artykułów nonsensownych bądź fałszywych (i zawierających odsyłacze do innych sfałszowanych prac nieistniejących autorów) przy pomocy programu SciGen, dodawanie niewidzialnego tekstu na pierwszych stronach referatów konferencyjnych itp. Każda z tych metod pozwalała na znaczną poprawę wskaźników cytowań testowanych „autorów" (dorobek naukowy jednego z wymyślonych przez badaczy naukowców zyskał w ciągu roku drugą co do wielkości wartość indeksu h w dziedzinie informatyki). Przeanalizowano również cechy oprogramowania GS sprzyjające tworzeniu błędnych metadanych i manipulowaniu wynikami wyszukiwań oraz wysiłki podejmowane przez twórców tego narzędzia, zmierzające do poprawy jakości pracy parserów i algorytmów pozycjonowania GS. Wg autora, korzystanie z istniejących już dla milionów dokumentów naukowych metadanych, tworzonych przez kompetentnych bibliotekarzy i specjalistów od katalogowania i indeksowania jest o wiele bardziej sensowne niż poleganie na pracy parserów GS. Wykorzystanie tych ostatnich w społeczności akademickiej warto ograniczyć jedynie do dokumentów naukowych nieposiadających metadanych. |
Hasło | Informacja naukowa technika |
Hasło | Internet wyszukiwanie informacji |
Hasło | Google Scholar (wyszukiwarka) |
Klucz | Google Scholar (wyszukiwarka) |
Klucz | Wyszukiwarki internetowe |
Klucz | Metadane |
Klucz | Informacja naukowa |
Klucz | Bibliometria |
Klucz | Naukometria |
Klucz | Autorzy publikacji naukowych |
Dział | 010 Informacja naukowa i dokumentacja (technika i metodyka) |
Cytata | // Online Information Review.- Vol. 35 (2011), nr 1, s. 154-160, il., bibliogr.17 poz. |