オープンソースのHTMLパーサライブラリを探していると、El-Kabong HTMLなるものを発見。軽量でなかなかいい。
しかし、残念ながら<script>タグの中身をあまりロバストにパースできない。また、XHTMLの空要素を識別できない。
仕方ないので、突貫で改造してみた。Web Scrapingに便利かも。
http://www.void.in/wiki/ekhtmlMod
| | 2006-04-09 00:48
オープンソースのHTMLパーサライブラリを探していると、El-Kabong HTMLなるものを発見。軽量でなかなかいい。
しかし、残念ながら<script>タグの中身をあまりロバストにパースできない。また、XHTMLの空要素を識別できない。
仕方ないので、突貫で改造してみた。Web Scrapingに便利かも。
http://www.void.in/wiki/ekhtmlMod
Commenting is closed for this article.