miércoles, 19 de septiembre de 2012

Documentación TVG

Por se alguén ten curiosidade, xunto unha descripción das bases de datos e dos operadores de busca empregados no Servizo de Documentación de TVG:

CRTVG
Servicio de Arquivo e Documentación


INFORMACIÓN XERAL E SISTEMA DE BUSCA


BRS non só xestiona bases de datos do Servicio de Documentación, a discoteca da Radio Galega e algúns programas empregan esta ferramenta para almacenar e recuperar información.
O sistema de recuperación de información é o mesmo para tódalas bases de datos, ainda que o seu contido preséntase dun xeito diferente, en parte debido ó diferente tipo de información/documentación que conteñen.
O Servicio de Documentación mantén varias bases de datos:


· BRUT.- Contén a información sobre as cintas que entran diariamente, procedentes dos servicios informativos. Tamén pode conter referencias de cintas procedentes da producción doutro tipo de programas non-informativos. A descripción é sumarial, trátase dun pre-visionado, de polo menos coñece-lo contido audiovisual das cintas que entran diariamente dende as redaccións. Evidentemente é imposible facer unha análise máis fonda de tódala producción a diario.


·CINT.- Contén información de contidos de cintas procedentes das mesmas fontes que na base de datos BRUT (informativos e programas) pero cunha descripción detallada do contido audiovisual e outros datos de interese para a recuperación.


·DEBR.- Contén información das cintas que entran diariamente dende a redacción de deportes. Están pre-visionadas, cunha descripción sumarial.


·DEXE.- Base de datos de deportes con visionados detallados.


·DOPO.- Información sobre os contidos dos distintos programas de producción propia emitidos.

·FIDO.- Información xeral de tódolos programas emitidos (director, realizador, presentadores, cambios, número de programas…..)

·TODO.- Concantena tódalas bases de datos anteriores e internacional.



· PALL.- Base de datos de Documentación de Producción Allea sobre longametraxes.



· PAEP.- Base de datos de Documentación de Producción Allea sobre episodios e series



·PAXE.- Base de datos que agrupa as dúas anteriores (PAEP E PAXE): moi útil para facer buscas de producción allea.



·INTE.- Información sobre o contido das cintas procedentes de axencias estranxeiras (internacional).



1.- BUSCAS DA INFORMACIÓN



1.1.- Buscas mediante operadores lóxicos



Os operadores lóxicos son:



AND: Esixe que as dúas palabras de busca que enlaza , figuren ó tempo no mesmo documento.
NOT: Esixe que o termo ou palabra que lle segue non figure en ningún lugar do documento.
XOR: Esixe que no documento aparezan un dos dous termos da busca pero nunca os dous xuntos.
OR: Esixe que as dúas palabras ou ámbalas dúas aparezan nun mesmo documento.
Exemplos con operadores lóxicos:



1.- Economía OR Política........................................120 docs (resultado, nº de documentos)
2. Economía AND Política........................................50 docs
3.- Economía NOT Política........................................80 docs
4.- Economía XOR Política........................................75 docs
5.- (Economía OR Política) AND (Xosé Vázquez)....10 docs






1.2 Buscas mediante operadores posicionais


Estes operadores serven para recuperar non só termos ou palabras presentes no documento, senón tamén que ocupen unha relación de posición mútua. Neste sentido, os operadores posicionais son moi útiles para recuperar imaxes de persoas, institucións, cidades...


Os operadores posicionais son:


ADJ: Esixe que as palabras de busca aparezan xuntas e na orde especificada.
NEAR: Esixe que os termos aparezan xuntos sen ter en conta a orde.
SAME: Busca termos que estean no mesmo campo.
WITH: Esíxelle ó sistema que as palabras estean situadas na mesma sentencia .


Exemplos con operadores posicionais ou de texto libre:



1.-XOSÉ ADJ VÁZQUEZ
XOSÉ …………………………………………………………………….. 7140 docs
VÁZQUEZ ……………………………………………………………….. 1484 docs
1. XOSÉ ADJ VÁZQUEZ …………………………………………………..19 docs



2.-XOSÉ NEAR VÁZQUEZ ……………………………………………..7149 docs
XOSÉ……………………………………………………………………… 7149 docs
VÁZQUEZ ……………………………………………………...…………1484 docs
2.-XOSÉ NEAR VAZQUEZ ………………………………………………..20docs



3.-DECLARACIÓNS WITH VÁZQUEZ
DECLARACIÓNS ……………………………………………………….19304 docs
VÁZQUEZ ………………………………………………………………. 1484 docs
3.-DECLARACIÓNS WITH VÁZQUEZ …………………………………246 docs



4.- VÁZQUEZ SAME PARLAMENTO
VÁZQUEZ ………………………………………………………………. 1484 docs
PARLAMENTO ………………………………………………………….2377 docs
4.-VÁZQUEZ SAME PARLAMENTO ………………………………...…. 42 docs

Tódolos operadores posicionais poden modificarse cun número calificativo que especifica o cerca que deben está-las palabras. Así, ADJ2 significa que as palabras de busca poden estar separadas por unha palabra ou non. Este recurso é util cando buscamos frases ou termos que conteñan posibles palabras baldeiras ou que o documentalista poidese obviar na descripción ou en caso de dúbida de nomes, etc.

1.-ministerio adj economia
MINISTERIO …………………………………………………………… 555 docs
ECONOMÍA ……………………………………………………………. 631 docs
1.-MINISTERIO ADJ ECONOMÍA ………………………………..…….12 docs

2.- ministerio adj2 economía
MINISTERIO ……………………………………………………………555 docs
ECONOMÍA …………………………………………………………….631 docs
2.- MINISTERIO ADJ2 ECONOMIA …………………………………...40 docs


1.3Funcións especiais de buscas on-line


Son ferramentas para mellora-las estratexias de busca:


1.3.1- Calificación de campos: Como resultado da estructura dos datos (designación e etiquetadodos campos) nas distintas bases de datos, pódese calificar calquera instrucción de busca para centrala en un ou varios campos concretos. A sintaxe é a seguinte:
palabras de busca seguidas inmediatamente pola etiqueta de campo pechada entre puntos e sen espacios.

Este sistema pode interesarnos para casos como o seguinte:


1.- (Tribunal adj Supremo).titu. ----------------------- Buscamos algunha nova ou imaxe sobre o Tribunal.

Os termos “tribunal” e “supremo” aparecerán pois nesta orde no campo “título”


Estas funcións especiais poden combinarse con calquera tipo de busca, ben dun xeito tutelado ou realizando unha estratexia única colocando correctamente os parénteses



1.3.2- Truncamentos: Permite recuperar tódalas palabras que comencen ou rematen pola mesma cadea de caracteres. O símbolo do truncamento é o $ (dólar). Tamén permite resolve-los problemas de palabras que poidan ter grafías non estables ou posibles erros mecanográficos.

-Truncamento pola dereita: Recupera tódalas palabras que empecen coa mesma cadea de caracteres. O símbolo colócase inmediatamente despois da cadea sen ningún espacio intermedio de separación:

1_: drog$

DROG$
DROGA…. ……………………………………………………………631 docs
DROGADICCIÓN ……………………………………………….….…..2 docs
DROGADICTO …………………………………………………..….….7 docs
DROGADICTOS ………………………………………………………19 docs
DROGADITOS ……………………………………………………....…2 docs
DROGADOS …………………………………………………………....1 docs
DROGAS ………………………………………………………………86 docs
DROGODENPENCIAS ………………………………………………...1 docs
DROGODENPENDENTES ………………………………………….....1 docs
DROGODEPENCIAS ………………………………………………..…2 docs
DROGODEPENDENCIA ……………………………………………... 2 docs
DROGODEPENDENCIAS ……………………………………………34 docs
DROGODEPENDENTE ………………………………………….....… 1 docs
DROGODEPENDENTES ……………………………………………. 11 docs
DROGODEPENDIAS ………………………………………………......1 docs
DROGUERIA……. …………………………………………………......2 docs
DROGUERIA-PERFUMERIA ……………………………………….....1 docs
1_: DROG$ …………………………………………………………... 577 docs





-Truncamento pola esquerda. Recupera tódalas palabras que rematan nunha mesma cadea de caracteres:
3_:$sicolox$



$SICOLOXIA (Reverse Index Used)
PSICOLOXIA ………………………………………………………….15 docs
MUSICOLOXIA ………………………………………………...……….1 docs
3_: $SICOLOXIA ……………………………………………..………. 16 docs



-Truncamento bilateral: Permite trunca-los dous extremos dun núcleo común para recuperar palabras con independencia de sufixos e prefixos:


1_:$sicolox$



$SICOLOX” (Reverse Index used)
PSICOLOXICA ……………………………………………………….. 3 docs
PSICOLOXIA ………………………………………………………….15 docs
MUSICOLOXIA ……………………………………………….……….1 docs
PSICOLOXICOS ………………………………………………………1 docs
1_: $SICOLOX$ ………………………………………………..……..20 docs



-Truncamento interno: Pode empregarse para localizar termos nos que o elemento variable (carácter ou caracteres) está situado entre un prefixo e un sufixo común. Basta con sustituí-lo elemento variable por un $. No caso de que poidan ser varios, califícase o símbolo co número posible de caracteres que poden variar.
Poñamo-lo caso de que buscamos imaxes sobre o Premio Nobel de Medicina, Eric Wieschaus, pero non coñecemo-la escritura correcta do seu apelido:


2_: wi$aus



WI$AUS
WIESCHAUS…. …………………………………………………………. 1 docs
WINKHAUS ………………………………………………………………1 docs
2_: WI$AUS ……………………………………………………………….2 docs



Como dixemos, tamén poderíamos limita-lo número de caracteres. Tomando como referencia unha das bases de deportes, vexamos este exemplo:


1_: at$1letic$1



AT$1LETIC$1
ATHLETIC……. ……………………………………………………… 164 docs
ATLETIC ….. …………………………………………………….....……8 docs
ATLETICA…….. ……………………………………………………......24 docs
ATLETICO ……… …………………………………………….………366 docs
1_: $AT$1LETIC$1 …………………………………………….………546 docs



Nesta busca, engadimos un "1" ós dólares ou caracteres "comodín" para que recuperase soamente os termos cun carácter variable no medio e ó final da palabra.


1.3.- Buscas de datos numéricos : No noso caso, trátase de buscas nos campos "data", ben sexa da noticia, de gravación ou de análise.



O formato de entrada de datos é o seguinte: "AAAAMMDD" (19950101).
(ANO MES DÍA)



Podemos proceder do seguinte xeito:


1) Introducir como termo de busca a data completa: o principal inconveniente é que recupera todo tipo de datas (a do documento, a de entrada en arquivo ou mesmo a de visionado...)

1_: 19951017
1_: 19951017. ….. ………………………………………………………….95 docs



2) Coloca-la etiqueta que identifica o campo que contén a data que queremos, precedida do símbolo "arroba" :


2_: @ddoc = 19951017
@DDOC. ….. …………………………………………………………. 39169 docs
2_: @DDOC = “19951017”………………………………………………..32 docs

No hay comentarios:

Publicar un comentario

Comentar es gratis: