Da HTML a XML: estensione del linguaggio Markup
La grande maggioranza delle persone che fanno parte dell'industria informatica sanno cos'è l'HTML (Hypertext Markup Language). È in circolazione da molto tempo ed è stato ampiamente utilizzato nella progettazione di pagine Web che, sebbene sia già raro vedere pagine Web scritte esclusivamente in HTML, è considerato una conoscenza di base dell'intero processo di creazione di pagine Web.
XML (Extensible Markup Language), d'altra parte è una tecnologia più recente e molto meno conosciuta rispetto all'HTML. XML è stato creato nel 1996 da un gruppo di 11 persone come adattamento di SGML (Standard Generalized Markup Language) per l'uso nel World Wide Web. XML è un linguaggio di markup più strutturato e rigoroso rispetto all'HTML che consente agli utenti di creare le proprie definizioni e il codice modularizzato. È stato creato per creare specifiche standardizzate per la creazione di linguaggi di markup personalizzati ora noti come dialetti XML. Potrebbe non essere immediatamente evidente ma i linguaggi di markup personalizzati come HTML, RSS e Atom sono stati tutti creati da XML come metodo per aumentare l'usabilità di Internet.
Dal momento che XML è stato adattato da SGML contiene un sacco di codice e tecniche che originariamente provenivano da SGML come il suo rigore e una cosiddetta ben formata. Caratteristiche che si estendono anche ai discendenti di XML. Alcune regole dovrebbero essere sempre considerate quando si crea codice basato su XML. Esiste persino una dichiarazione ben strutturata con ogni documento per indicare quale tipo di documento è e su quali regole deve essere basato il processo. Questo è molto diverso rispetto alla codifica molto rilassata che viene utilizzata in HTML.
Quando si elabora una pagina HTML, si otterrebbe una sorta di risultato indipendentemente dall'input. Il processore HTML cerca di dare un senso a ciò che era nel documento e crea un output che ritenga migliore dei dati di input. Questo non è vero arriva a XML. XML utilizza un meccanismo di gestione degli errori considerato "draconian". Ogni volta che il processore XML incontra qualcosa che non può comprendere, crea semplicemente un rapporto di errore e termina l'elaborazione del file. Questo ti lascia con una finestra di errore e nessun risultato a differenza di HTML.
Per dirla in prospettiva, HTML è un linguaggio di markup usato per mostrare in modo rapido e semplice un certo tipo di output. Non si occupa della correttezza dell'input e cerca semplicemente di creare un output basato sul file di input. L'XML, d'altra parte, è un linguaggio di marcatura molto severo che di solito non viene utilizzato per creare contenuti. Il suo uso principale è uno strumento per creare altri linguaggi di marcatura che creano il contenuto necessario.