ekhtmlMod

オープンソースのHTMLパーサライブラリを探していると、El-Kabong HTMLなるものを発見。軽量でなかなかいい。

しかし、残念ながら<script>タグの中身をあまりロバストにパースできない。また、XHTMLの空要素を識別できない。

仕方ないので、突貫で改造してみた。Web Scrapingに便利かも。
http://www.void.in/wiki/ekhtmlMod


| | 2006-04-09 00:48

Commenting is closed for this article.