2004-11-09から1日間の記事一覧

-Kariyushi

oss

私的ローカルR&Dプロジェクト「Kariyushi」。「Kariyushi」は以下を目的としたパーサー&ユーティリティです。 ランタイムは普通のDOM3 or SAX2パーサー デザインタイムでは文法エラーがおきているXMLおよびHTMLでも指定Offsetまで欠如した文法を補いながら…

-NekoHTMLのSAX

oss

NekoHTMLのSAXパースを試しましたが、GOODです。DOMと同様に動きます。S2JSF、SAXパースに変更希望です。なぜならKijimunaのコード補完エンジンがほとんどそのまま使えるから。というか、まずKijimuna的に都合よいのを作ってみます。結局スキャナを作らない…

-XMLのエンコーディング

XMLで使えるエンコーディングは、Xercesの実装に限ると、org.apache.xerces.util.EncodingMapに定義されていて、MS932のIANAマッピングは、WINDOWS-31Jでした。ちなみに、EUCJISがEUC-JP。SJISがSHIFT_JIS。JISがISO-2022-JP。それぞれケースは無視です。

-SAXで子タグ

oss

<html> <body> <form> <input type="text"> <test attr="hoge">test</test> </input> </form> </body> </html> こういうのを子タグというのであれば、取れているみたいです。 package test.org.seasar.kariyushi; import java.io.InputStream; import junit.framework.TestCase; import org.xml.sax.Attributes; import org.xml.sax.ContentHandler; impo…

-Xercesの構造

Xerces2の構造は実はCoccon2に似ています。Xerces2もCocoon2もどちらも基本はスキャナ-フィルタ-フィルタ-フィルタ...と続くつくりです。スキャナがストリームよりバイト配列を読み出し、テキストパースを行い、イベントを発火します。発火したイベントがフ…