En este tema se presenta un análisis de los modelos de datos y se definen los conceptos de esquema y estado de una base de datos. Hay tres categorías principales de modelos de datos: modelos conceptuales, modelos lógicos y modelos físicos. Es importante distinguir entre el esquema (descripción de una base de datos) y la base de datos en sí misma. El esquema no cambia a menudo, en tanto que la base de datos cambia cada vez que se insertan, eliminan o modifican datos.
También se presenta la arquitectura de los sistemas de bases de datos y la independencia respecto a los datos. La arquitectura de los sistemas de bases de datos establecida por el comité ANSI-SPARC utiliza tres niveles de abstracción: externo, conceptual e interno. En el nivel externo, el esquema consta de las distintas visiones que tienen los usuarios de la base de datos. En el nivel conceptual, el esquema es la visión común de la base de datos: especifica el contenido de información de la base de datos independientemente de las consideraciones de almacenamiento. En el nivel interno, el esquema es la visión que el ordenador tiene de la base de datos: especifica cómo se representan los datos, en qué orden se almacenan los registros, qué índices y punteros se han creado y qué esquema de dispersión se ha utilizado, si es el caso. Todo sistema de gestión de bases de datos que separe los tres niveles deberá tener correspondencias entre los esquemas para transformar las peticiones de los usuarios y los resultados, de un nivel al siguiente. La mayoría de los sistemas de gestión de bases de datos no separan los tres niveles por completo. La independencia de datos hace que cada nivel de la arquitectura sea inmune a los cambios en los niveles de debajo. La independencia de datos lógica se refiere a la inmunidad de los esquemas externos frente a los cambios en el esquema conceptual. La independencia de datos física se refiere a la inmunidad del esquema conceptual frente a los cambios en el esquema interno.
También se definen los distintos lenguajes que proporcionan los sistemas de gestión de bases de datos y se estudian varias clasificaciones de estos sistemas. Un lenguaje de base de datos consta de dos partes: un lenguaje de definición de datos y un lenguaje de manejo de datos. El lenguaje de definición de datos se utiliza para especificar el esquema de la base de datos, las vistas de los usuarios y las estructuras de almacenamiento, mientras que el lenguaje de manejo de datos se utiliza para leer y actualizar los datos de la base de datos. Los sistemas de gestión de bases de datos se pueden clasificar según varios criterios: el modelo lógico que soportan, el número de usuarios, el número de puestos, el coste y la generalidad. La clasificación más importante es la que se basa en el modelo lógico, siendo los principales modelos que se utilizan en el mercado el modelo relacional, el de red, el jerárquico y el orientado a objetos.
Se comentan, por último, las funciones de los sistemas de gestión de bases de datos y los módulos que los componen. Los sistemas de gestión de bases de datos son sistemas informáticos muy complejos formados por una serie de componentes, cada uno de ellos con una función específica: gestión del diccionario de datos, gestión de las transacciones, control de la seguridad, control de la concurrencia, optimización de consultas, control de la integridad y gestión de la recuperación ante fallos. Además de estos módulos, los sistemas de gestión de bases de datos cuentan con una serie de herramientas que ayudan al administrador de la base de datos a manejar el sistema.