2 Replies Latest reply: Oct 30, 2006 1:40 AM by 807607 RSS

    read specified content of a xml file

    807607
      How to get specified part of a xml file

      This is the content of the xml file, I just want the content in the <body>...</body> without the
      <p></p>
      tag. How can I do that?
      <?xml version="1.0" encoding="UTF-8"?>
      <TEI.2>
      <teiHeader>
      <fileDesc>
      <titleStmt>
      <title>Pastikan kita terus bebas -- PM: Kekalkan perpaduan, jangan terpengaruh dakyah asing di alaf baru
      
      </title>
      <author>MOHD. NOR AB. SAMAD
      </author>
      </titleStmt>
      <publicationStmt>
      <publisher/>
      </publicationStmt>
      <sourceDesc>
      <!-- ... -->
      </sourceDesc>
      </fileDesc>
      <profileDesc>
      <textClass>
      <catRef target="Muka_Hadapan"/>
      </textClass>
      </profileDesc>
      </teiHeader>
      <text>
      <front>
      <!--
                        front matter ...
                   -->
      </front>
      <body>
      <p>- Datuk Seri Dr. Mahathir Mohamad mengajak rakyat supaya mengekalkan perpaduan dan belajar daripada sejarah negara serta tidak terpedaya dengan dakyah asing bagi memastikan Malaysia terus bebas, merdeka dan maju pada alaf akan datang.</p>
      <p>Sambil mengingatkan mereka usaha menjajah semula negara masih diteruskan oleh bekas penjajah, Perdana Menteri berkata, kemerdekaan negara tidak akan kekal selama-lamanya jika rakyat mengabaikan perkara tersebut.</p>
      <p/>
      <p/>
      <p/>
      </body>
      <back>
      <!--
                        back matter ...
                   -->
      </back>
      </text>
      </TEI.2>
        • 1. Re: read specified content of a xml file
          807607
          Use XML parser then.

          SAX and DOM are common.

          :D
          • 2. Re: read specified content of a xml file
            807607
            I can get the first <p> tag only. How to get others
            <p>
            tag content?
            How I know how many
            <p>
            node that it have if i use while loop?

                 
            public static String ParserWord(String pathname, String tag) {
                        
                        Text result = null;
                        
                        try{
                        
                          DOMParser parser = new DOMParser();
                
                            parser.parse(pathname);
                 
                            Document doc = parser.getDocument();
                            NodeList doubles = doc.getElementsByTagName(tag);
                            Node datum = doubles.item(0);
                            result = (Text) datum.getFirstChild();
                     }
                
                         catch (Exception e) {
                          System.err.println(e + "cannot parse"); 
                     }
                     
                     return result.getNodeValue();
                   }