1. Los URL
La World Wide Web es básicamente un conjunto de documentos electrónicos enlazados unos con otros, gracias al hipertexto. El primer detalle que tenemos que tener en cuenta, es como se localiza un documento. Esto se realiza mediante las URL (Localizadores Uniformes de Recursos) que son un subconjunto de las URIs (Identificadores Universales de Recursos). Las URIs que hagan referencia a documentos o objetos accediendo mediante protocolos existentes los denominaremos como URLs. En el curso cuando queramos indicar la dirección y la forma de acceso a un determinado recurso utilizaremos su URL.
Los URL contienen la forma de acceder a un recurso: el protocolo de acceso (http, ftp, news, etc.), el servidor en el que se encuentra el recurso (y el puerto) y el camino o ruta dónde se encuentra el recurso.
URL:<esquema>:<sección-específica-del-esquema>
<esquema>: http, ftp, news, mailto, etc.
<sección especifica del esquema>: //<usuario>:<password>@<anfitrión>:<puerto>/<ruta>?<consulta>#fragmento
Ejemplos
ftp://usuario:clave@ftp.servidor.es/pub/loquesea.zip
http://www3.uji.es/~dgonzale/cdw08/
Codificación que puede aparecer en los URL:
- % - para caracteres especiales (ojo con los espacios)
- / - para la el acceso a los distintos niveles determinados en la ruta. Jerarquización
- # - identificación de fragmentos
- ? - normalmente para parámetros de consulta
Más información: http://www.tejedoresdelweb.com/307/article-5671.html
Rutas absolutas y relativas
Un URL absoluto es una referencia que contiene al menos el esquema seguido de dos puntos y una sección específica del esquema ( http://www.uji.es ). Una URL relativa es una referencia URI que comprende sólo la sección específica del esquema de una URL y que puede ser:
- relativa a la raíz de sitio: /cdw08/
- o a un documento concreto: cdw08/ ../cdw08/
Cuidado con las mayúsculas y las minúsculas.
2. El protocolo HTTP
El protocolo de transferencia de hipertexto (HTTP, HyperText Transfer Protocol) es el protocolo que permite la comunicación entre servidores y clientes en la WWW. Básicamente consiste en una conexión del cliente con el servidor, un envío de petición del cliente al servidor, una respuesta por parte del servido (un documento u objeto, o un error) y el cierre de la conexión.
Referencia: http://www.uv.es/~biblios/mei3/Web022.html#http
3. El lenguaje HTML
Origen del HTML. SGML
SGML es un sistema para definir lenguajes de marcas descriptivos. Este tipo de lenguaje nos permitirá crear documentos con una representación de la información de forma estructural. Un ejemplo de lenguaje derivado de SGML es el HTML. Un lenguaje de marcas definido con SGML se llama aplicación SGML y ésta se caracteriza por tener:
- Una declaración SGML (caracteres y delimitadores que pueden aparecer en la aplicación)
- Una DTD (Definición de tipo de documento)
- La especificación que describe la semántica a la hora de confeccionar el documento
- Los documentos que contienen las marcas y el contenido con una referencia a la DTD
Así pues HTML es un lenguaje de marcas que nos permitirá confeccionar las páginas que publiquemos en la Web.
Algunas definiciones
- Autor: quien genera los documentos HTML
- Usuario: Interactúa con un agente de usuario para usar los documentos HTML
- Agente de usuario HTML: cualquier dispositivo que interprete los documentos HTML (Netscape, Explorer, etc.)
- Elemento Desaprobado: Elemento que a quedado anticuado por la existencia de estructuras nuevas. Para evitar incompatibilidades los AU deben seguir dando soporte a estos elementos.
- Elemento Obsoleto: Puede que el AU ya no de soporte a estos elementos.
Conjunto de caracteres
El conjunto de caracteres ASCII no es suficiente para un sistema de información global como es la Web, de modo que HTML utilizará un conjunto de caracteres más completo denominado Conjunto Universal de Caracteres definido en ISO 10646, en el que se define un repertorio de miles de caracteres usados por las comunidades de todo el mundo.
Las codificaciones de caracteres usadas normalmente en la Web incluyen la ISO 8859-1 (ISO Latin-1), utilizable para la mayor parte de los idiomas de Europa occidental.
Observar en los documentos HTML que:
- Los documentos HTML son simplemente documentos de texto
- No importan los tabuladores, ni los saltos de línea
- Hay tres caracteres especiales: <, >, &
Trabajando con documentos HTML