Entry

XML のバイナリ表現の話はどこに行っちゃったんだっけ

2007年09月06日

こちらを読ませていただいて。

XML Binaryと聞くと、バイナリデータをXMLで記述する方法と想像する人が多いのではないか。実は、その逆で「XMLをバイナリ化する」 という議論である。

XML Binary

XML にバイナリなデータを埋め込むという話は,W3C にも話があるんだけれど,XML をバイナリで表現するという話はどこに行っちゃったんだっけ。いつの間にか立ち消えてる?(あたしが知らないだけか)。

XML を内部的にそのまま使うケースはまずないわけで,バイナリの形で保持しておくことがほとんどだったりします。単純な文字列だけのデータ(住所録とか)だったら,バイナリにしても圧縮率が変わるくらいなんだろうけれど(多分),数値や配列のような文字列以外の型を持っている場合は,その型に置き替えなくちゃいけません。このパースにかかるコストが結構大きい。

例えば,Apache FOP なんかを使って XML を PDF にしたいと思ったりするとしますよね。この時,XSL-FO にあるデータは,ほとんど数値だったりします。もちろん,1枚や2枚の変換だったらその都度パースしてもそれ程問題はありません。けど,数万枚の帳票を明日までに作りたい!なんてことになると,オーバーヘッドが大きすぎてバカバカしくなってきます。こゆのは,あらかじめパースしておいて,使いやすいようにコンパイルしておいた方がいいはず。

で,XML バイナリです。プログラムの制作者がそれぞれのフォーマットを持つのも悪くはないと思うんですけれど(標準化すると,どっちにしろオーバーヘッドがかさむから),共通のバイナリ表現があれば,データの互換性が生まれます。現にそれを考えている人もいるはずです。HTTP 上を流れてるだけだったあの頃ならまだしも,ここまで汎用的になったらね……。

誰か作ってくれないかな,XML コンパイラ。多分,XML DB とも相性がいいはず(てか,むしろそっちに向かってるのかな)。

Trackback
Trackback URL:
Ads
About
Search This Site
Ads
Categories
Recent Entries
Log Archive
Syndicate This Site
Info.
クリエイティブ・コモンズ・ライセンス
Movable Type 3.36
Valid XHTML 1.1!
Valid CSS!
ブログタイムズ

© 2003-2012 AIAN