Los datos en memoria masiva suelen organizarse en archivos, y por tanto un archivo es un conjunto de información sobre un mismo tema como una unidad de almacenamiento y organizado de forma estructurada para la búsqueda de un dato individual.
Un archivo es una agrupación de datos, cuya estructura interna es la que el usuario, el programador o el sistema operativo, la haya conferido implícitamente. Las estructuras con que se organizan los archivos no son inmanentes de los mismos ni son propias del sistema operativo, por lo que debe se el software el responsable del mantenimiento de dichas estructuras.
Archivo
Es un elemento de información conformado por un conjunto de registros. Estos registros a su vez están compuestos por una seria de caracteres o bytes. Actualmente las organizaciones están utilizando bases de datos para generar resultados o para compartir dicha información con otros sistemas. Sin embargo, los principales componentes de las bases de datos son los archivos.
Las formas en las cuales pueden organizarse los archivos, son archivos secuenciales o archivos directos. En los archivos secuenciales los registros están almacenados en una secuencia que depende de algún criterio definido.
Soporte Secuencial y Direccionables de Archivos
Los soportes secuenciales son aquellos en los que los registros de información están escritos a continuación de otros y para acceder a u determinado registro, n se necesitan pasar por los n-1 registros anteriores.
Los soportes direccionables se estructura de modo que las informaciones registradas se pueden localizar directamente por su dirección y no se requiere pasar por los registros procedentes. En estos soportes los registros deben poseer un campo clave los diferentes del resto de los registros dela archivo. una dirección en un soporte direccionable puede ser numero de pista y numero de sector en un disco.
Los direccionables o aleatorios permiten tanto el acceso directo como el secuencial, se puede acceder a un bloque físico sin más que dar su posición, sin necesidad de recorrer o leer otros bloques, aunque también hacerse de esa manera.
Los soportes direccionables son los discos magnéticos, aunque pueden actuar como soporte secuencial. Según las características del soporte empleado y el modo en que se han organizado los registros, se consideran dos tipos de acceso a los registros de un archivo:
- Acceso Secuencial
- Acceso Directo
Organización de Archivos
Los archivos se organizan lógicamente como secuencias de registro y se guardan en bloques. En las bases de datos relacionadas, las filas de diferentes tablas tienen tamaños diferentes. Los archivos pueden almacenar registros de longitud fija o variable.
Hay diferentes formas de estructurar u organizar los registros que componen un archivo sobre un soporte de información. La eficiencia en la utilización del archivo depende de la organización del mismo, por ello se debe optar por una u otra organización atendiendo a la forma en que se va a usar el archivo.
Secuencial
Los registros se encuentran en cierto orden, consecutivamente y por tanto han de ser leídos, necesariamente, según este orden. En la organización secuencial los registros carecen de un orden especial, estando situados según el orden temporal de su inclusión en el archivo, si se desea que están ordenados según otro criterio, el campo clave por ejemplo, debe hacerse programándolo adecuadamente. Pro lo tanto el archivo secuencial al final del archivo físico, se graba la marca final del fichero.
Los archivos secuenciales es una sucesión de registro almacenados consecutivamente sobre el soporte extremo, de tal modo que para acceder a un registro m dado es obligatorio pasar por todos los n-1 artículos que le preceden.
Los registro se graban consecutivamente cuando el archivo se crea y se debe acceder consecutivamente cuando se leen dichos registro.
Los archivos secuenciales es una sucesión de registro almacenados consecutivamente sobre el soporte extremo, de tal modo que para acceder a un registro m dado es obligatorio pasar por todos los n-1 artículos que le preceden.
Los registro se graban consecutivamente cuando el archivo se crea y se debe acceder consecutivamente cuando se leen dichos registro.
Directa o Aleatoria
Ubicación del registro en el soporte físico, se obtiene directamente a partir de funciones que la obtienen a partir del valor de la clave, mediante un algoritmo de transformación de esta. Un archivo que puede estar dotado de una organización directa tiene que cumplir dos condiciones:
- Que sus registros sean de longitud física.
- Su propio tamaño tiene que estar prefijado, lo que determina la distribución de la información, al tiempo que limita la cantidad de registros que podrá contener.
Un archivo está organizado directo cuando el orden físico no corresponde con el orden lógico. Los datos se sitúan en el archivo y se accede a ellos directa aleatoriamente mediante su posición, es decir, el lugar relativo que ocupan.
Esta organización tiene la ventaja que se pueden leer y escribir registros en cualquier orden y posición. son muy rápidos de acceso a la información que contiene.
La organización directa tiene el inconveniente de que se necesita programar la relación existente entre el contenido de un registro y la posición que ocupa. El acceso a los registros en modo directo implica la posible existencia de huecos libres dentro del soporte, y por consecuencia pueden existir huecos libres entre registros.
Indexada
Se dispone de una tabla de índices adicional, una referencia que permite obtener de forma automática la ubicación de la zona del archivo físico donde se encuentra el registro buscado.
Este permite localizar un registro por medio de su clave sin recorrer previamente todos los que se preceden. Un diccionario sería un ejemplo de archivo secuencial indexado, ya que en cada página tenemos dos niveles, el superior nos dice cuál es la letra inicial de la palabra y el inferior la cabecera de cada página de forma de un ordenador.
Un archivo está organizado en forma secuencial indexada si:
- El tipo de sus registros contienen un campo clave identificador.
- Los registros están situados en un soporte direccionable por el orden de los valores indicados por la clave.
- Un índice por cada posición direccionable, la dirección de la posición y el valor de la clave, en esencia, el índice contiene la clave del último registro y la dirección de acceso al primer registro del bloque.
Operaciones sobre Archivos
Los archivos interesan por que los programas típicamente operan sobre ellos, para leer o escribir en los mismos. El sistema operativo debe mantener ciertas informaciones sobre cada fichero que este manipulando, tales como el soporte en que se encuentran el archivo, el tipo de organización del mismo, el lugar donde este empieza o la posición actual dentro de un archivo.
Todo ello está contenido en un descriptor de fichero asociado a cada archivo que se está utilizando en un momento determinado, los procedimientos básicos que con ayuda del sistema operativo, los programas pueden llevar a cabo los distintos tipos de ficheros.
Creación: esta operación es permitir a los usuarios la creación de nuevos ficheros. Mediante esta operación se indican las propiedades y las características del fichero para que el sistema pueda reconocerlo y procesarlo. El método de acceso debe obtener información sobre el formato y el tamaño de los registros lógicos y físicos, la identificación del fichero, la fecha de creación, su posible tamaño, su organización, aspecto de seguridad, etc.
Consulta: permite al usuario acceder al archivo de datos para conocer el contenido de uno, varios o todos los registros.
Actualización: permite tener actualizado el archivo, de tal modo que sea posible realizar las siguientes operaciones con sus registros:
- Consultas de contenido de un registro.
- Inserción de un registro nuevo en el archivo.
- Supresión de un registro existente.
- Modificación de un registro.
Clasificación: un archivo es la clasificación u ordenación, esta clasificación se realiza de acuerdo con el valor de un campo especifico, pudiendo ser ascendente (creciente) o descendiente (decreciente), alfabético o numérico.
Reorganización: modifican las estructura inicial o la óptica de un archivo. Los índices, enlaces (punteros), zonas sinónimas, zonas de desbordamiento, etc. Se modifican con el paso del tiempo, lo que hace a la operación de acceso al registro cada vez más lenta.
La reorganización suele consistir en la copia de un nuevo archivo a partir del archivo modificado, a fin de obtener una nueva estructura lo más óptima posible,
Apertura: el método de acceso localizado e identifica un fichero existente para que los usuarios o el propio sistema operativo pueda operar con él. En algunos sistemas la operación de creación no existe como tal, y es la operación de apertura de un fichero no existe, lo que implícitamente, crea un nuevo fichero.
Cierre: se utiliza para indicar que se va a dejar de utilizar un fichero determinado. Mediante esta operación el método de acceso se encarga de "romper" la conexión entre el programa de usuario y el fichero, garantizando la integridad de los registros. Al ejecutar esta operación, el sistema se encarga de escribir en el dispositivo de almacenamiento aquella información que contienen los búfer asociados al fichero y se llevan a cabo las operaciones de limpieza necesarias. Tras cerrar el fichero, sus atributos dejan de ser accesibles para el método de acceso.
Borrado: elimina un fichero del directorio o tabla de contenidos correspondiente. El lenguaje de comandos del sistema operativo dispone de un comando para eliminar el identificador del fichero de la tabla de contenidos.
Extensión: permite a los programas de usuarios aumentar el tamaño de un fichero asignándole más espacio en el dispositivo de almacenamiento. Para realizar esta operación el método de acceso necesita conocer el identificador del fichero y el tamaño del espacio adicional que se debe asignar al fichero. En función de la organización del fichero, el método de acceso determinará si el espacio adicional que debe asignar debe ser continuo al fichero o no.
No hay comentarios:
Publicar un comentario