Esaminare documenti con namespace con LINQ e XDocument

di Andrea Zani, in LINQ, LINQ To XML,

XMl è diventato uno standard di fatto. Da questo formato sono nati mille dialetti per la memorizzazione e la rappresentazione di qualsiasi dato. Per identificare in modo univoco i tag all'interno di un documento XML è possibile definire dei namespace. La loro presenza comporta dei problemi nell'utilizzo della sintassi XPath con le classi del .NET framework o con LINQ To XML. La normale sintassi XPath deve essere modificata e devono essere usate tecniche particolati per la lettura dei documenti.

Prendendo un esempio reale, in Excel è possibile salvare i propri documenti in formato XML. Il documento prodotto ha questa struttura:

<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
  xmlns:o="urn:schemas-microsoft-com:office:office"
  xmlns:x="urn:schemas-microsoft-com:office:excel"
  xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
  xmlns:html="http://www.w3.org/TR/REC-html40">
  <DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">
    <Author>AZ</Author>
    <LastAuthor>AZ</LastAuthor>
    <Created>2008-10-25T18:55:59Z</Created>
    <Company>Home</Company>
    <Version>12.00</Version>
  </DocumentProperties>
...

Nel tag WorkBook sono definiti tutti i namespace utilizzati. Per poter eseguire delle ricerche all'interno di questo documento abbiamo a disposizione varie tecniche, vediamone una che sfrutta LINQ To XML. Prima di tutto si includono i namespace:

var xmlDoc = XDocument.Load(Path.Combine(
        AppDomain.CurrentDomain.BaseDirectory,
        "test.xls")
        );
XNamespace az = "urn:schemas-microsoft-com:office:spreadsheet";
XNamespace html ="http://www.w3.org/TR/REC-html40";
XNamespace o = "urn:schemas-microsoft-com:office:office";
XNamespace xsi = "http://www.w3.org/2001/XMLSchema-instance";
XNamespace x2 = "http://schemas.microsoft.com/office/excel/2003/xml";
XNamespace ss = "urn:schemas-microsoft-com:office:spreadsheet";
XNamespace x = "urn:schemas-microsoft-com:office:excel";

I namespace sono presenti dopo la stringa "xmlns". Solo nel primo caso abbiamo creato una fittizia ("az") perché non presente. In questo modo possiamo eseguire ricerche XPath nel seguente modo, specificando il namespace utilizzato:

var obj = from s in xmlDoc.Descendants(az + "Workbook") select s;

Commenti

Visualizza/aggiungi commenti

| Condividi su: Twitter, Facebook, LinkedIn

Per inserire un commento, devi avere un account.

Fai il login e torna a questa pagina, oppure registrati alla nostra community.

Approfondimenti

I più letti di oggi