Introducción a XML II

Share if you like...Share on Facebook0Tweet about this on TwitterShare on Google+0Share on LinkedIn0

Después de 2 semanas de ausencia simia (por motivos laborales el mono ha tenido que ausentarse), volvemos a publicar una nueva entrada en el blog, continuando la introducción a XML que se quedó a medias.

Esta vez vamos a explicar sus características, reglas de construcción de un documento XML, sus atributos y levemente lo que es un validador XML.

Características:

  • El documento xml se genera a través de un software, no se genera a mano. Se puede utilizar para hacer un intercambio de datos entre distintos programas (es su principal fin), que utilizan distintos lenguajes, ganando así compatibilidad entre ellos. Sólo transporta información (contiene los datos en texto plano).
  • Reglas de nomenclatura de las etiquetas, los nombres, atributos, etc. deben cumplir:
    • No pueden empezar por número o símbolo.
    • Pueden contener letras, números u otros caracteres.
    • No pueden empezar por ninguna de las combinaciones xml (xml, Xml, xMl, etc.)
    • No pueden contener espacios en blanco.
    • Se puede usar cualquier nombre, no hay palabras reservadas excepto xml.
    • Se recomienda:
      • Que los nombres no lleven “ñ”.
      • Que no lleven letras con tilde.
      • Que no lleve guión en medio.
      • Elegir nombres lo más descriptivos posible.
      • Seguir un criterio de mayus. minus. (todo mayúscula, todo minúscula).
      • Nombres lo más cortos posible.
      • No poner “:” ni “.”
  • Sus elementos son extensibles. Debe permitir añadir información sin alterar su funcionamiento. Ejemplo:
<mensaje>
	<para>Marcello</para>
	<de>Susana</de>
	<cabecera>Fecha de la cita</cabecera>
	<contenido>Te confirmo el 10/1/12 17:50h. <contenido>
</mensaje>
<mensaje>
	<para>Marcello</para>
	<de>Susana</de>
	<cabecera>Fecha de la cita</cabecera>
	<contenido>Te confirmo el 10/1/12 17:50h. <contenido>
	<contenido>Más contenido <contenido>
</mensaje>

Atributos:

  • Las etiquetas o los elementos de xml pueden tener atributos. Se ponen en la etiqueta de inicio igual que en html.
  • Proporcionan información extra a un elemento o etiqueta.
  • - Suelen contener información que no es parte esencial de los datos. Ejemplo:
<img src=”foto.jpg”/> o <alumno numeroexp=“1001”/>
  • No es bueno utilizar demasiados atributos según el W3C.
  • No aparecen en la estructura jerárquica del documento xml.
  • Los valores de los atributos tienen que ir entre comillas, dobles o simples.
  • Se pueden utilizar entidades para representar las comillas.
  • Podría ser sustituido (si con ello se mejora el rendimiento) por un elemento.
  • Se utilizan a modo de metadatos.

Por lo tanto la información se podría representar de diferentes maneras, usando etiquetas o atributos.
Por qué evitar el abuso de atributos:

  • Porque un atributo no puede contener varios valores, la etiqueta sí.
  • Los atributos no aparecen en la estructura del árbol.
  • Los atributos no son fácilmente ampliables (extensibles).

Los documentos xml pueden llevar una sección que se llama CDATA:

<![CDATA[
	…
	…
	…
	]]>
 

Un documento xml es validado por un software que lo analiza. CDATA es un bloque que se incluye en el documento y que el analizador no comprueba. Por lo tanto puede contener cualquier símbolo que inicialmente no permita xml. Se hace para especificar datos, pudiendo utilizar cualquier carácter sin que se interprete como un marcado xml (no se analiza). ***No confundir CDATA con PCDATA*** (parser char data, analizador, ).

Un documento xml es autodescriptivo. Se utilizan etiquetas para identificar los elementos. Ejemplo:

<datosfamiliares>
	<nombre>Pepe<!nombre>
	<apellido>…<!apellido>
	…
</datosfamiliares>

Es un metalenguaje. Mediante la hoja de estilo de transformación XSLT podemos portar los datos a otros lenguajes (por ejemplo xhtml).
Para que un documento xml sea correcto debe cumplir 2 requisitos:

  • Debe estar bien formado (debe cumplir las reglas de xml) Recordatorio:
    • Debe tener una primera línea que identifica versión y codificación de xml.
    • Todo elemento tiene cierre. (Toda etiqueta se cierra).
    • Sólo tiene una raíz.
    • Los nombres de los elementos (etiquetas) deben ser válidos.
    • Si está bien formado, puedo visualizarlo en un explorador, si no está bien formado en la línea que contiene error se para el explorador, así se puede ver dónde está el fallo.
  • Debe ser válido, si es válido implica que esté bien formado.
    • Cumple las normas especificadas en otro fichero (DTD o xml schema(XSD)). El consorcio dice que es mejor utilizar XSD.

Ejemplo:

<?xml versión = "1.0" encoding = "utf.8">
<!DOCTYPE libros SYSTEM "libros.dtd">  libros.dtd = nombre del archivo y ruta (relativa o completa).
<libros>
	<libro>
		<titulo>Prog C#</titulo>
		<autor>F.Charte</autor>
		...
		...
	</libro>
</libros>

Continúa en Introducción a XML III

Share if you like...Share on Facebook0Tweet about this on TwitterShare on Google+0Share on LinkedIn0
The following two tabs change content below.
Reborn as IT Developer. Desarrollador Android y fundador de Proyecto Simio. "En realidad, yo no puedo enseñar nada a nadie, sólo puedo hacerles pensar." - Sócrates.

Deja un comentario