Home    Objetivo   Etapas del proyecto   Búsquedas    Utilitarios Cisis    Bibliografía

 

Aquí se detallan los procedimientos seguidos para convertir la base ccpp94 a Relap. Se tomó la base de datos del Catálogo Colectivo de Publicaciones Periódicas del CAICYT del año 1994, dado que ya se encontraban cargados la mayoría de los títulos que posee el IAR y además porque permitía aplicar los utilitarios Cisis. Las líneas de comandos se detallan en una tabla y en un anexo se explica el funcionamiento general de los utilitarios.

Como primer paso se invirtieron los campos que guardaban los identificadores de las bibliotecas cooperantes, éstos estaban representados por tres letras mayúsculas (BRS, en el caso del IAR). La intención fue realizar una búsqueda por archivo invertido con el parámetro bool, pero los hits daban cero, por lo cual se realizó una búsqueda por texto libre mediante el parámetro text. Las líneas de comandos están incluídas también en la tabla de procedimientos, dado que aunque no se recuperaron los registros, pueden servir como guía para otros proyectos.

La búsqueda se guardó en un archivo salida.iso, a partir del cual se creó la base pubper que contenía sólo los registros que correspondían al IAR. Luego se generó otro archivo out.iso donde se excluía al primer registro, dado que éste contenía los datos del Instituto, y no era necesario para la nueva base.

El paso siguiente fue modificar los tags de los campos, desde los números de ccpp94 originales a los que correspondían a la base Relap. Se editó un archivo de texto pptable donde se confrontaban los tags de ccpp94 con Relap , y mediante el parámetro retag se cambiaron los números (véase tabla)

ver tablas FDT y FST

Luego a partir del archivo se genera la base relap importando el archivo out.iso, que contenía los registros con los campos que se habían modoficado con retag.

En el directorio se copió la base Relap completa, para que luego, en el momento de la carga de datos, aparecieran todos los campos.

Una vez que los registros estuvieron en Relap, hubo que comenzar una segunda etapa que consistió en modificar los subcampos de la base, dado que los que estaban cargados en ccpp94, diferían bastante de los de la base Relap (destino).

Los cambios a realizarse eran:

- En el campo 44 cambiar los subcampos ^a^b por ^l^e
- Agregar dos subcampos con datos ^tISSN^n antes del ISSN, en el campo 15
- Borrar un subcampo mal cargado ^a en el campo 35 y en el 37
- Agregar un subcampo ^c antes de los datos del campo que correspondía al código de la biblioteca, en el campo 2, y agregarlo, además al campo 80.

Para modificar los datos del campo 44 se utilizó el parámetro gizmo junto a una tabla de conversión cam, y una base cambio.

 El procedimiento de agregar datos en el campo 15 fue mas complejo, dado que había que agregar caracteres pero a la vez conservar los datos en el campo 15 (el nro. de ISSN). Al aplicar la función alta campo, con el parámetro proc el mx daba de alta a una nueva ocurrencia del campo 15, o agregaba los datos al final del campo existente por lo cual hubo que utilizar una tabla de conversión motable y modificar transitoriamente el  campo 15 por el 100 con un retag; para finalmente incorporar los datos cargados en el campo transitorio haciendo referencia al mismo.(ver tabla)

Luego se debieron borrar datos mal cargados en los campos 35 y 37, para lo que se volvió a utilizar el parámetro gizmo, esta vez creando una tabla que contenía el dato a borrarse y un "espacio". 

Finalmente hubo que agregar en el campo 80 un subcampo ^c donde se debían incorporar los datos del código de la Unidad de información. Como en la base ccpp94 estaban cargados los datos que correspondían a todas las bibliotecas que contenían dicha publicación, se llegó a la conclusión de que eran datos que debían conservarse, por lo cual hubo que incorporar la cadena una vez por cada ocurrencia utilizando la función alta campo (Att) del proc.(ver tabla)

Por último se realizaron cambios globales sobre la base para mejorar la visualización de símbolos y caracteres acentuados.

Todos estos procedimientos permitieron aplicar el utilitario mx con los parámetros proc y seq, y el utilitario retag. Los detalles se explican en la tabla

Para agilizar los procesos se creó un archivo de procesamiento por lotes proce.bat

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Procedimientos


 

Comandos


1. Se crea el directorio cisis en el directorio raiz
C:/cisis
2. Se copian en cisis los utilitarios que se usarán
durante los procesos, los archivos empleados y las bases de datos ccpp94 y Relap
mx, retag, fullinv.bat
3. La base ccpp94 no tiene
invertidos (no están en el diccionario) los campos
donde se encuentran los datos
que corresponden a la Biblioteca
por lo cual, mediante
un archivo de texto se edita una nueva.fst
852 0 v852
910 0 v910
811 0 v811

Se genera un nuevo archivo invertido
mediante la siguiente línea de comandos
fullinv ccpp94 nueva.fst
4. Al no tener éxito, se buscan por texto libre los registros
que pertenecen a la Biblioteca del IAR
mx ccpp94 text=BRS iso=salida.iso -all now
5. A partir de la búsqueda se crea la base pubper mx iso=salida.iso create=pubper -all now
6. Se genera un nuevo archivo out.iso que contiene
los registros desde el nro. 2
mx pubper iso=out.iso from=2 to=40 -all now
7. Para modificar los tags de los campos
se crea un archivo de texto pptable
que contiene los cambios a realizarse con retag
22 15
210 37
222 35
260 44
910 02
8. Se genera la base relap a partir del archivo out.iso la cual reemplaza a la base relap original mx iso=out.iso create=relap -all now
Se aplica el utilitario retag
en la siguiente línea de comandos
retag relap pptable
9. Para utilizar gizmo se edita
un archivo de texto cam
^a|^l
^b|^e
y a partir de éste se crea una base de datos cambio mx seq=cam create=cambio -all now
Donde el registro consta de dos campos
el campo uno contiene el dato a cambiar
y el campo dos el cambio a realizarse
mfn= 1
1:^a
2: ^l
mfn= 2
1:^b
2: ^e
 En el campo 44 se cambian los
subcampos ^a^b por ^l^e utilizando el parámetro gizmo
mx relap gizmo=cambio,44 copy=relap
10. Para agregar dos subcampos ^tISSN^n
antes del ISSN que ya estaba
cargado en la base, en el campo 15:
   Se edita el archivo de texto motable
se cambia transitoriamente el tag del campo 15
con un retag por el campo 100


motable: 15 100

retag relap motable
   Se da alta al campo 15
con la cadena de caracteres ^tISSN
Se da el alta al campo 15 con el contenido
de la primera ocurrencia
del campo 100 que contenía los ISSN
mx relap proc='a15#^tISSN#' copy=relap

mx relap "proc='a15#^n',v100[1],'#'" copy=relap

  Luego se borra el campo "transitorio" 100 mx relap proc='d100' copy=relap
11. Para borrar la siguiente cadena de caracteres ^a en los campos 35 y 37:
   se edita un archivo de texto cam2 que cambia ^a por un espacio en blanco
^a|(espacio)
   a partir de cam2 se crea cambi2 mx seq=cam2 create=cambi2
mfn 1
1: ^a
2:
   se aplica el parámetro gizmo modificando el contenido de los campos 35 y 37 mx relap gizmo=cambi2,35,37 copy=relap
12. Crear un subcampo ^c antes de los datos
cargados en el campo 2, dando de alta campos transitorios. Como es un campo repetible, se debieron generar los cambios campo por campo, también se realizaron los cambios en dos líneas de mx
mx relap "proc='a200#^c',v2[1],'#a210#^c'v2[2]'#a220#^c',v2[3],'#'" copy=relap
mx relap "proc='a230#^c'v2[4],'#a240#^c',v2[5],'#a250#^c'v2[6],'#a260#^c',v2[7],'#'" copy=relap
 se edita un archivo de texto n1table donde se cambian los tags de los campos "transitorios" por los del campo 2 200 80
210 80
220 80
230 80
230 80
240 80
250 80
260 80
 13. se aplica retag retag relap n1table
 14. Se crea el archivo proce.bat mx ccpp94 text=BRS iso=salida.iso -all now
mx iso=salida.iso create=pubper -all now
mx pubper iso=out.iso from=2 to=40 -all now
mx iso=out.iso create=relap -all now
retag relap pptable
mx seq=cam create=cambio -all now
mx relap gizmo=cambio,44 copy=relap
retag relap motable
mx relap proc='a15#^tISSN#' copy=relap
mx relap "proc='a15#^n',v100[1],'#'" copy=relap
mx relap proc='d100' copy=relap
mx seq=cam2 create=cambi2
mx relap gizmo=cambi2,35,37 copy=relap
mx relap proc='a200#^c',v2[1],'#a210#^c'v2[2]'#a220#^c',v2[3],'#'" copy=relap
mx relap "proc='a230#^c'v2[4],'#a240#^c',v2[5],'#a250#^c'v2[6],'#a260#^c',v2[7],'#'" copy=relap
retag relap n1table
mx seq=htmsim create=htms
mx relap gizmo=htms copy=relap
 15. Se edita el archivo htmsim á|&acute
é|&acute
í|&acute
ó|&oacute
ú|&uacute
ñ|&ntilde
Ñ|&Ntilde
 Se crea el archivo maestro htms  mx seq=htmsim create=htms
 Se realizan los cambios globales  mx relap gizmo=htms copy=relap

TOP