En este tema se presentan los conceptos fundamentales sobre el almacenamiento físico de la base de datos en dispositivos de almacenamiento secundario. Se estudian los discos magnéticos por ser los dispositivos más utilizados para almacenar los ficheros de una base de datos. Los datos se almacenan en el disco en bloques. El acceso a un bloque es costoso debido al tiempo de búsqueda, el tiempo de rotación y el tiempo de transferencia del mismo.
Se presentan tres organizaciones primarias para los ficheros: desordenados, ordenados y dispersos. Los ficheros desordenados requieren una búsqueda lineal para localizar registros, pero la inserción es muy sencilla. La eliminación plantea problemas en el sentido de que se desperdicia espacio, recuperable mediante una reorganización del fichero. Los ficheros ordenados reducen el tiempo requerido para leer registros en orden a través del campo de ordenación. El tiempo necesario para buscar un registro cualquiera, dado el valor de su campo de ordenación, también se reduce, ya que se puede realizar una búsqueda binaria. Sin embargo, la necesidad de mantener los registros en orden hace muy costosa la inserción. La dispersión ofrece acceso muy rápido a un registro cualquiera dado el valor de su campo de dispersión. El acceso a un registro a través de un campo que no es el campo de dispersión, es lento, y lo mismo sucede con el acceso secuencial a los registros a través de cualquier campo. Hay varias técnicas que permiten al fichero expandirse y contraerse dinámicamente: la dispersión dinámica, la extensible y la lineal. El agrupamiento es otro modo de organizar los registros que se estudia en este tema, cuyo resultado es un fichero ordenado de un modo especial. Mediante el agrupamiento se implementan físicamente las relaciones entre los registros de varios ficheros, almacenándolos consecutivos en un mismo fichero.
Por último, se presentan los índices, que son estructuras de acceso adicionales con las que se mejora la eficiencia en la obtención de registros de un fichero de datos. Dichas estructuras de acceso pueden usarse junto con las organizaciones de ficheros vistas anteriormente. Hay tres tipos de índices ordenados de un solo nivel: primarios, secundarios y de agrupamiento. Los índices de un solo nivel son ficheros ordenados y se examinan mediante búsqueda binaria. Se pueden construir índices de varios niveles (multinivel) para mejorar la eficiencia en las búsquedas. Los árboles B y los árboles B+ son índices de varios niveles cuya estructura permite al índice expandirse y contraerse dinámicamente. También es posible construir índices mediante estructuras de datos que utilizan la técnica de la dispersión.