CERN Accelerating science

Guia de Cerca

El cercador d'aquest sistema tracta d'oferir la tecnologia més actual de cerca web, desenvolupada per cercadors tant populars com Google. La naturalesa de la cerca bibliogràfica, però, difereix considerablement de la d'una página Web. Oferim nombroses extensions que permetin una cerques estructurada complexa i precisa, incloent-ho la combinació de metadades, text complet i referències bibliogràfiques en una mateixa cerca. Aquesta pàgina ofereix una sèrie de consells útils per aconseguir una cerca més eficaç.

    Cerca simple versus avançada
    Cerca guiada
    Cerca per paraules versus cerca per frases
    Consultes booleanes
    Parèntesis
    Caràcters especials i puntuació
    Caràcters internacionals
    Truncaments i cercques per arrel
    Cerca per metadades estructurades
    Expressions regulars
    Consultes per rang
    Operadors per cercar citacions: refersto/citedby
    Combinació de metadades/text complet/referència bibliogràfica
    Preguntes freqüents
        Escollir correctament els térmes de cerca (en termes de velocitat)
        Com localitzar publicacions a partir de l'autor?
        Com ordenar d'acord a un patró d'ordenació?
        Com obtenir documents d'altres servidors? (Google, SPIRES, KEK)
        Cómo cercar a fitxers a text complet?
        Cómo cercar referències bibliogàfiques?

Cerca simple versus avançada

La cerca per defecte és la cerca simple, que fonamentalment permet escriure la consulta dins un camp de text, seguit de la possibilitat d'escollir un dels índexs comuns sobre els que realitzar la consulta. S'introdueixen les paraules clau a buscar i s'acciona la consulta mitjançant la tecla de retorn (intro). Per exemple, si interessa recuperar documents sobre standard model que han estat escrits per (o que fan esment a) Ellis, haurem d'escriure:

i a la pàgina dels resultats de la cerca podem tornar a afegir o treure paraules clau per tal d'obtenir més precisió als resultats, tal i com s'especifica més endavant.

La interficie de cerca avançada ofereix eines específiques amb les que configurar la cerca: podem canviar el tipus de cerca a realitzar per defecte (d'alguna paraula a totes les paraules, cerca per frase exacta, per expressió regular, etc.); ens permet emprar la combinació booleana a nombrosos índexs, etc. Per exemple, per localitzar tots els documents escrits per Ellis, J -transcrit exactament d'aquesta manera- i també les paraules muon o neutrino al títol de la publicació i 2001 a l'any, escriurem:

 

Observeu que si fem servir una sintaxi especial, la cerca simple ofereix pràcticament la mateixa funcionalitat que l'avançada, tal i com s'explica a les següents seccions d'aquesta guia. Aquest apartat de cerca simple-versus-avançada no es refereix tant a les funcionalitats disponibles, com a la forma de cerca que podem configurar mitjançant petites modificacions. El sistema s'ha adaptat a l'ús comú dels termes simple/avançat que podem trobar a altres cercadors.

En realitat, gran part de l'explicació que segueix a continuació, respòn a la qüestió de «com un usuari avançat pot utilitzar la interfície de cerca simple». Recordeu que en qualsevol moment és posible recórrer a l'ajuda de la cerca avanzada per aconseguir més assistència.

Ajuda a la cerca

Un cop rebuda la consulta, el cercador l'analizarà i tractarà sempre de guiar a l'usuari en cas de que no localitzi cap coincidència a la base de dades. Un exemple d'això son les llistes dels termes indexats que es troben més propers al terme introduït a la consulta en cas que no es trobin coincidències per errors ortogràfics o de transcripció:

Les opcions alternatives es mostren en vermell. El motor de cerca avisa de forma similar quan detecta que els termes de cerca no es troben, o quan detecta que si que existeixen però la fórmula de consulta booleana emprada no aconsegueix localitzar-los. Així mateix, el motor de cerca també realitza de forma oculta accions alternatives per a millorar els resultats com, per exemple, eliminar puntuació, etc.

Gràcies al sistema de cerca en múltiples etapes i a l'ajuda que es va proporcionant a cadascuna d'aquestes etapes, pel general resulta suficient teclejar l'objecte de cerca i revisar que ens retorna el sistema. Si no quedem satisfets, podem afegir/treure paraules de la nostra consulta fins aconseguir uns resultats satisfactoris.

Cerca per paraules versus cerca per frases

El mode de cerca per defecte es la cerca per paraules. Aquest mode implica que s'ignoren els espais en blanc, però també que el motor de cerca els interpreti per defecte com a «afegeix automàticament una I booleana entre les paraules introduïdes«, com fa Google. Per exemple, per recuperar tots els registres que continguin tant la paraula ellis com muon a qualsevol part del registre, haurem d'escriure:

Si volem que l'espai en blanc sigui significatiu, hem d'escriure la sentència entre cometes. Existeixen dues formes de cerca per frase:
  1. La introducció de cometes dobles indica al motor de cerca cerca la frase exacta. Aquesta forma de cerca per frase retornara resultats només en el cas que els camps de metadades localitzats siguin exactament igual al patró sol·licitat. Per exemple, per recuperar tots els documents escrits per Ellis, J escrit exactament d'aquesta manera, hem d'escriure:
  2. La introducció de comentes simples indica al motor de cerca l'acció de cercar a alguna part de la frase. A diferència de la cerca per frase exacta aquest mètode permet que existeixi text abans/desprès del patró sol•licitat. Aquest métode és similar al de «cerca per frase» que utilitzen Google i altres motors de cerca quan cerquen expressions dins del text complet de les pàgines web. Per exemple, per localitzar tots els títols que continguin l'expressió muon decay independentment de la posició que aquesta ocupi dins el títol, escriurem:
    Podem observar com s'introduiria la cerca d'un autor que de vegades apareix escrit com Ellis, J y altres com Ellis, Jonathan Richard (incloent altres autors com De Lellis, Jim) en una mateixa acció de cerca:
    (Per més informació, es recomana veure també la cerca específica per autor.)

La diferència entre cercar per frase exacta o cercar per part de la frase pot semblar poc evident a primera vista. Ara bé, mentre que la cerca per part de la frase s'equipara a la cerca per frase que acostuma a aplicar-se dins el context dels cercadors web, l'ús de la cerca per frase exacta resulta molt més efectiva i ràpida com més es coneguin i especifiquin els valors a recuperar.

Un altra forma interessant de cerca, a més de la cerca per paraula o frase, és l'ús de la cerca per expressió regular, que s'expressa entre barres inclinades en comptes de cometes. Per exemple, la cerca anterior segons el mode de cerca parcial de la frase 'muon decay' és equivalent a l'expressió regular /muon decay/. La sintaxi de les expressions regulars és molt potent, i permet construir cerques molt complexes. Per obtenir més informació, recomanem la consulta de la secció expressió regular d'aquesta guia.

Cerques booleanes

Hem vist com la inclusió d'un espai en blanc és equivalent a afegir un operador booleà a la cerca per paraules. La resta d'operadors booleans són:
+
AND
ellis +muon Recupera tots els registres que contenen ambdues paraules: ellis i la paraula muon
ellis muon ídem, simplificació sintàctica
ellis and muon ídem, simplificació sintàctica
-
NOT
ellis -muon recupera tots els registres que contenen la paraula ellis però que no contenen la paraula muon
ellis not muon ídem, simplificació sintàctica
|
OR
ellis |muon recupera tots els registres que contenen, com a mínim, una de les dues paraules
ellis or muon ídem, simplificació sintàctica

Els operadors lògics es disposen de forma automàtica d'esquerre a dreta. Per exemple, si es volen recuperar documents escrits per Ellis sobre muon o kaon, escriurem:

es realitzarà una cerca equivalent a (muon OR kaon) AND ellis. Notis també que s'obtenen resultats diferents si s'introdueix
que si s'introdueix (ellis AND muon) OR kaon.

La disposició dels elements d'esquerre a dreta permet refinar fàcilment una cerca afegint o traient paraules utilitzant els operadors AND/NOT +/-. Per exemple, per excloure els documents sobre desintegració a la cerca anterior, només cal afegir -decay:

Amb el que s'obtindria una llista més filtrada. Es poden afegir o traure tants elements com sigui convenient, fins aconseguir més precisió a la cerca.

Parèntesis

També es poden utilitzar parèntesis per agrupar les expressiones booleanes:

Aquesta cerca retorna registres que contingin bé gravity o supergravity, o bé ellis o perelstein a cualsevol part del registre.

Observeu que podeu usar qualsevol nombre de parèntesis en la cerca. També és possible incloure parèntesis dins d'altres, como això AND (allò OR (més NOT lluny)).

Caracters especials i puntuació

Quan s'indexen les paraules, es posa especial atenció en que siguin indexades amb i sense puntuació. Això fa possible la cerca de termes que contenen caràcters especials, com per exemple C++, textualment:

Per exemple, per recuperar registres que contenen l'expresió LaTeX $e^{+}e^{-}$ al títol, cal escriure:
Per exemple, per recuperar un document amb número d'informe hep-ph/0204133, cal escriure:
Observeu que aquesta cerca és sensible a les majúscules:

Caràcters internacionals

El motor de cerca es basa en l'estàndard Unicode UTF-8, que fa possible introduir cadenes de cerca en qualsevol llengua que es trobi a la base de dades. Per exemple, per recuperar documents escrits per (o sobre) Пушкин, cal escriure:

Observeu que no és necessari introduir accents per aconseguir registres que contenen paraules accentuades. Per exemple, escriurem Lemaitre para recuperar articles de Lemaître:

Truncaments i cerques per arrel

El truncament d'una paraula es realitza a través de l'ús del símbol asterisc (*). Aquest comodí indica al motor de cerca que retorni qualsevol número de caràcters en el seu lloc. Per exemple, per recuperar registres que continguin les paraules astronomia, astrònoms, astronòmics etc, cal escriure:

La cerca por comodí pot utilitzar-se tant en posició de prefix com de sufix. Per exemple, per recuperar totes les paraules que comencin per CERN-TH i acabin amb 31, cal escriure:
Notis que el comodí s'ignora si es tracta d'utilitzar-lo amb paraules massa curtes, com per exemple a*:
El caràcter comodí també pot utilitzar-se al mode de cerca per frase. Per exemple, per recuperar tots els documents el títol dels quals comenci per "Neutrino mass", cal escriure:
Recordem que a aquesta cerca hem introduït les formes de 'frase exacta' i 'part de la frase'. En realitat, el mode de cerca per 'part de la frase' ens llençarà una cerca exacta sense necessitat de fer servir els comodins: tant podem utilitzar 'foo bar baz' com "*foo bar baz*". Això ajuda a comprendre perquè la cerca de paraules a una part de la frase és lenta: degut a l'ús de dos asteriscs davant i darrera del text, tots i cadascun dels registres de la base de dades es comproven per determinar si es corresponen o no amb la cerca introduïda. Actualment no hi ha cap índex de cerca que indexi parts de frase.

Cerques estructurades

La cerca realitzada utilitzant diversos camps bibliogràfics (com títol, autor) es realitza a través d'una sintaxi similar a l'emprada per Google en les seves cerques tipus "site:". Si un terme de cerca es precedit per un nom de camp seguit per dos punts aquest terme es cerca únicament dins el camp especificat. Per exemple, per recuperar documents que contenen la paraula ellis dins l'índex d'autors, cal escriure:

Per recuperar documents escrits per Ellis que continguin paraules tals com muon, muonic, muons dins el títol, cal escriure:
Per recuperar documents escrits per l'experiment NA60 de l'any 2001, cal escriure:
Els camps d'ús comú amb aquesta tècnica són: author, title, reportnumber, abstract, keyword, year, experiment, fulltext, and reference.

Expressions regulars

L'ús del mode de cerca per expressió regular està dirigida sobretot a usuaris avançats que coneixen la sintaxi tradicional d'expressió regular Unix/POSIX. A l'interfície de consulta simple es pot forçar aquest mode utilitzant les barres inclinades enlloc de comentes:

Al mode de cerca avançada es pot seleccionar explícitament aquest mode de cerca seleccionant-lo al menú desplegable. A l'exemple anterior es recuperarien tots els títols que comencen per la lletra E, seguida de qualsevol número o qualsevol caràcter, i que acabin per la lletra s.

Un altre exemple similar és el de la cerca per autor d'un autor que ha estat introduït a la base de dades com Ellis, J o bé com Ellis, John:

La cerca per expressió regular permet formular consultes de paraules Molt específiques per proximitat. Per exemple, permet recuperar registres Els títols dels quals contenen les paraules dense i matter i que estiguin separades, al menys, per una paraula que no contingui la lletra l:

Observeu que també poden emprar-se caràcters d'interval com [a-k] i contadors de concurrència com {3}. Per ejemple, podem recuperar tots els pre-prints que no es corresponguin amb la política de catalogació AAAA per descriure anys, opcionalment seguida per ? o per altre -AAAA:

També poden emprar-se altres classe de caràcters com [:alnum:], que a l'exemple anterior seria equivalent a:

Per conèixer més sobre les expressions regulars POSIX, es recomana la Consulta de Wikipedia regexp article i MySQL regexp documentation.

Consultes per rang

La consulta por rang es realitza a través del signe ->. Per exemple, per recuperar tots els documents sobre par motor publicats entre 1983 i 1992, cal escriure:

Per recuperar tots els documents d'autors els noms dels quals estiguin dins El rang que va des de Ellis, J fins Ellis, Qqq, cal escriure:

Operadors de cerca refersto/citedby

És possible cercar en la xarxa de citacions amb els operadors de cerca citedby i refersto. Per exemple, per trobar qui cita hep-th/0201100, podeu escriure:

Per exemple, per trobar quins articles són citados per Klebanov, escriviu:

Per activar una alerta para nous documents que citin l'autor I. Klebanov, escriviu:

Observeu que els operadors de cerca refersto i citedby funcionen en cualsevol cerca regular. Per exemple, per cercar tots els documents que citin documents que contenguinn la paraula clau gravitino, escriviu:

Observeu també que aquests operadors es poden combinar lliurement amb les cerques de metadades habituals. Per exemple, per trobar documents escrits per Klebanov que siguin citats por Papadimitriou pero que ells mateixos no citin cap de los documents de Papadimitriou, escriviu:

Finalmente, puede utilizar las sintaxis para marcar expresiones regulares o de búsqueda por frase para combinar expresiones de búsqueda en el mismo operador refersto/citedby. Por ejemplo, para encontrar documentos que solo citen aquellos documentos de I. Klebanov que mencionen O(N) en el título, escriba:

Finalment, podeu utilitzar les sintaxis per marcar expressions regulars o de cerca per frase per combinar expressions de cerca en el mateix operador refersto/citedby. Per exemple, per trobar documents que només citin aquells documents de I. Klebanov que mencionen O(N) al títol, escriviu:

Combinació de metadades/text complet/referència bibliogràfica

Tota la sintaxi mencionada anteriorment es pot combinar en una mateixa consulta. Per exemple, per recuperar documents que contenen la paraula ellis dins el camp d'autor, i que no contenen paraules com muon, 'muonic', etc., a cap altre camp, i que contenen la frase (o subcadena de paraules, per ser més precisos) ‘dense quark matter' dins el camp de resum, i que han estat publicats dins els anys que comencen pels dígits '200', cal escriure:

Observeu que l'opció d'índex global «qualsevol camp» per defecte conté només els termes de metadades, no del text complet ni de les referències bibliogràfiques. Cal especificar explícitament les opcions de cercar a l'índex text complet o de referència si volem cercar per aquests camps. Per exemple, per recuperar el terme Higgs tant dins les metadades, les referències o el text complet, cal escriure:
Això permet una interessant combinació de metadades, text complet i referències dins una mateixa cerca. Per exemple, per recuperar tots els documents escrits per Lin que en el text complet continguin les paraules Schwarzschild and AdS, que citi la revista Adv. Theor. Math. Phys., cal escriure:

Preguentes freqüents

Escollir correctament els térmes de cerca (per a un bon rendiment)

Com localitzar publicacions a partir de l'autor

La cerca per autor es pot realitzar de diverses formes, cadascuna de les quals presenta els seus avantatges i les seves desavantatges.

  1. En primer lloc, cal notar que el mode de cerca per paraules no és el més adient en aquests casos. Si es selecciona la cerca per paraules Ellis J dins l'índex d'autors, s'interpretarà como a dues consultes (per a les paraules Ellis i J) que es realitzaran en primer lloc, i una booleana I que es realitzarà després.

    La consulta realitzada d'aquesta forma recuperarà també un document que tingui com a primer autor a Ellis, R i com a segon autor a Finch, A J, fet que, probablement, no es el desitjat. La cerca s'ha realitzat amb molta rapidesa i s'han recuperat registres sobre l'autor requerit, ara bé, els resultats obtinguts seguint aquest mètode poden no ser pertinents, tal i com passa a l'exemple citat anteriorment. En lloc de cercar per paraules, la tècnica més convenient que s'ha d'aplicar en aquests casos és la cerca per frase, que permet aconseguir major grau de precisió.

  2. Es habitual trobar-se que els noms d'autors continguin únicament la inicial del nom, com per exemple, Ellis, J. Per obtenir un llistat de les publicacions de tal autor amb el nom escrit exactament d'aquesta manera, cal escriure:

    Aquesta tècnica de cerca confereix major grau de precisió i evita falsos resultats aparentement positius. (La presumpció de que no existeixen altres autores els noms dels quals s'escrigui com Ellis, J, en ocasions pot no ser certa*.) La cerca es realitzarà con amb molta rapidesa.

  3. Algunes vegades, en alguns documents, el nom propi d'un autor s'escriu de forma abreujada, (com Ellis, J) i altres de forma completa (com Ellis, John; i en altres ocasions també amb el nom compost:Ellis, John Rolfe). Per obtenir una llista de publicacions de l'autor amb totes les seves formes en una mateixa cerca, es pot utilitzar l'operador booleà O:

    Aquest mode de cerca ens ofereix encara major grau de precisió i evita falsos resultats positius (o no pertinents). (La presumpció de que no hi ha més autors que s'escriguin com Ellis, J O Ellis, John, en ocasions pot no ser certa *.) La cerca és molt ràpida.

  4. Per localitzar totes les formes introduïdes a l'exemple anterior amb un únic terme de cerca, podem provar d'emprar una cerca amb comodí:

    Això recuperarà tots els noms d'autor que comencen amb el text Ellis, J, no només amb les formes requerides a l'exemple Ellis, J i Ellis, John, sinó també Ellis, Jim, o Ellis, John Rolfe, o Ellis,Jonathan Richard.

    Aquesta cerca retornarà molts més resultats, però pot resultar convenient en el cas que es desconegui la forma d'introducció dels noms a la base de dades. Ara bé, augmenta el risc d'obtenir resultats poc pertinents. La cerca és relativament ràpida.

  5. Apart d'aquesta darrera, l'alternativa general més emprada és la cerca per part de la frase:

    Aquesta cerca recupera no només tots els autors mencionats, sinó també tots aquells els noms dels quals continguin l'expresió Ellis, J a qualsevol part del seu nom, com per exemple De Lellis, Jim. Això augmenta enormement les possibilitats d'obtenir registres amb un alt risc de ser poc pertinents. La cerca és relativament lenta.

    (Observeu que aquest mode de cerca pot resultar molt pràctic per a cognoms compostos, tals com Pepe-Altarelli, M o 't Hooft, G en els que una consulta d'una consulta puntual de usuari per Hooft, G recuperarà l'autor requerit, a diferència dels mètodes mencionats anteriorment.)

  6. Finalment, anotar que es possible emprar la sintaxi de expressió regular per construir consultes complexes per fer cerques per autor. Un exemple senzill és la cerca d'un autor introduït a la base de dades tant per Ellis, J com per Ellis, John:
    Consulteu la guia de cerca per expressions regulars per conèixer més sobre les possibilitats d'aquest mode de cerca.

*NOTA: Si sou responsable de la vostra pròpia llista de publicacions i detecteu que algunes vegades el seu nom s'escriu de forma abreujada i de vegades complet, o si desitgeu identificar les vostres publicacions entre diversos autors amb la mateixa forma abreujada, sis plau, contacteu amb els administradors de que tractaran de treballar-hi conjuntament per implementar una forma consistent i normalitzada d'introducció del vostre nom a tota la base de dades. Només una base de dades amb contingut consistent pot garantir una cerca per autors satisfactòria.

Com ordenar d'acord a cert patró d'ordenació?

És possible seleccionar un camp determinat en funció del tipus d'ordenació dels resultats de la cerca, per exemple per ordenar els resultats pel títol principal. D'aquesta forma, de vegades pot passar que es desitgi ordenar els documents pel codi de referència i que un mateix document en tingui més d'un. Per exemple, els codis hep-ph/0204140, CERN-TH-2002-069 i RM3-TH-02-4 apunten tots al mateix document. Si s'ordena el conjunt de resultats de cerca que conté el document, el sistema tindrà en consideració el primer número d'informe, que pot ser qualsevol dels tres. En ocasions es desitja classificar un document segons un determinat codi de referència hep-ph , o altre CERN> segons si ha estat publicat a una col•lecció de publicacions CERN o hep-ph. Com es pot influir en el motor de cerca per prioritzar un codi abans de l'altre?

En altres paraules, el motor de cerca respon per defecte a una pregunta semblant a «ordena pel primer autor» o «ordena pel primer codi d'informe», però en ocasions es pot desitjar instar al cercador per tal que ordeni pel «primer codi d'informe que comenci pel text CERN-». Aquesta darrera opció és possible a través d'un paràmetre d'ordenació «invisible» denominat sp (per a «ordenar segons un patró») que permet ordenar segons un patró de preferència donat. Aquest paràmetre és «invisible» des del punt de vista que no és present a l'interfície de cerca, sinó que ha d'afegir-se manualment a la URL de cerca. Per exemple, per recuperar totes les publicacions del CERN-TH de l'any 2001 ordenats pel seu codi, cal cercar per CERN-TH-2001* dins l'índex de codi d'informe, i a la pàgina de resultats de cerca, quan s'estigui satisfet amb els resultats obtinguts, afegiu &sp=CERN-TH a la URL per tal d'ordenar els resultats segons els codis d'informe CERN-TH, i aconseguir una correcta ordenació de la llista de totes les publicacions CERN-TH del 2001.

Com obtenir documents d'altres servidors? (Google, SPIRES, KEK)

A la pàgina de resultats de cerca, s'ofereixen automàticament enllaços a altres servidors com Google, SPIRES o KEK sota el nom de «Proveu la vostra cerca a...». Amb un simple clic sobre els enllaços proposats es pot enviar la cerca realitzada en aquests cercadors.

Observeu que els enllaços a altres cercadors no es mostren si el cercador no suporta la cerca. Per exemple, SPIRES o KEK no poden cercar termes dintre del camp «qualsevol camp», de forma que en aquests casos, el sistema no els enllaçarà.

Com cercar a fitxers a text complet

Si un registre de metadades té arxius a text complet associats tractarà de extraure la informació textual dels arxius e indexar-la a un índex de text complet separat. Per recuperar tots els documents que contenen el terme e-al text complet dels seus documents associats, cal escriure:

Recordeu que les paraules del text complet no s'inclouen a l'índex global «qualsevol camp» predeterminat, però és possible realitzar una combinació lliure de text complet i metadades dins una mateixa cerca. Per exemple, per recuperar tots els articles escrits per Ellis que continguin la paraula muon tant a les metadades como all text complet, cal escriure:

Cómo cercar referències bibliogàfiques

Si un registre de metadades conté un fitxer de text associat, tracta de extraure les referències automàticament del fitxer e indexar-les a un índex separat de referències. Para recuperar tots els registres que citen a Ellis en els seus llistats de referències bibliogràfiques, escriurem:

Per recuperar tots els registres que citen el pre-print hep-ph/0103062en els seus llistats de referències bibliogràfiques, escriurem:
Per recuperar tots els documents que citen un article de Giddings i Rosspublicat a Physical Review D volum 61 i a l'any 2000, escriurem:
Recordeu que els termes de les referències no estan inclosos dins l'índex «qualsevol camp» a la cerca global predeterminada, però pot realitzar una combinació lliure entre cerca por referència i per metadades. Per exemple, per recuperar tots els articles sobre standard model que no han estat escrits per Ellis però el citen, escriurem: