XML vs. XHTML
Extensible Markup Language (noto anche come XML) è un insieme di regole. Queste regole sono specifiche per i documenti che codificano elettronicamente. L'obiettivo principale di XML è enfatizzare semplicità, generalità e usabilità su Internet. XML è indicato come un formato di dati testuali supportato da Unicode per essere letto facilmente in tutte le lingue. Sebbene l'obiettivo principale del progetto XML sia quello di focalizzare l'attenzione sui documenti in modo specifico, viene spesso utilizzato anche per rappresentare strutture dati arbitrarie (servizi web, ad esempio). Così com'è, c'è una pletora di interfacce di programmazione che gli sviluppatori sono in grado di utilizzare per l'accesso ai dati XML. Esistono anche una varietà di sistemi di schemi progettati specificamente per aiutare a definire i linguaggi basati su XML.
Extensible Hypertext Markup Language (noto anche come XHTML) fa parte della famiglia di linguaggio di markup XML. In realtà simula, o semplicemente agisce come un'estensione del Hypertext Markup Language (o HTML). XHTML funge da applicazione dalla famiglia XML ed è un sottoinsieme più restrittivo di SGML. Come risultato della natura ben strutturata dei documenti XHTML, è possibile che vengano analizzati utilizzando un parser XML, che distingue ulteriormente XHTML da HTML.
Un documento XML è composto interamente da caratteri trovati in Unicode. Ci sono alcuni caratteri di controllo che sono esclusi da Unicode; tuttavia, quelli che si trovano in Unicode sono in grado di diventare contenuti in un documento XML. Vi è una pletora di strutture che identificano la codifica dei caratteri Unicode all'interno di un documento XML. Ci sono anche strutture che esprimono quei personaggi che sono incapaci di essere usati. Unicode è codificato in byte per essere memorizzato o trasmesso - queste espressioni Unicode tradotte sono note come codifiche. XML utilizza qualsiasi, se non tutte, codifiche Unicode definite, nonché un numero di diverse codifiche i cui caratteri appaiono in Unicode. Fornisce un meccanismo che consente a un processore XML di determinare quale codifica è in uso.
Esistono tre versioni specifiche di XHTML: XHTML 1.0 Strict, che include elementi e caratteristiche non contrassegnate come deprecate in HTML 4.01; XHTML 1.0 Transitional, che include elementi particolari per le presentazioni ('font' e 'strike', per esempio); e XHTML 1.0 Frameset, che consente di definire i documenti del set di frame. XHTML può anche essere modularizzato, che fornisce una raccolta astratta di attributi che XHTML è in grado di gestire e ampliare. Questo è semplicemente un mezzo per aiutare XHTML ad estendere il suo ambito ad altre piattaforme eminenti (dispositivi mobili e televisione abilitata al web, per esempio).
Sommario:
1. XML è un insieme di regole che sono impostate per la codifica di documenti; XHTML è l'equivalente XML di HTML che è un sottoinsieme più restrittivo di SGML.
2. XML è composto interamente da Unicode; XHTML è disponibile in tre versioni: XHTML 1.0 Strict, XHTML 1.0 Transitional e XHTML 1.0 Frameset.