メモ2

準備

export GETAROOT=/home/geta/geta2
export LANG=ja_JP.EUC-JP
cd $GETAROOT
mkdir data
mkdir data/manyo.geta.void.in

ci.conf

handle: manyo.geta.void.in
short-name: manyo

WAM作成

sbin/mkw manyo frqs/manyo/manyo.frq

WAM内容確認

bin/dumpwam manyo xr_row

cw.rは文書名と文書IDとの対応表。cw.cはタームとタームIDの対応表。xr.rは、文書ごとにタームベクトルが記録された表(文書-単語連想に使用)。xr.cは、単語ごとに文書ベクトルが記録された表(単語-文書連想に使用)。いわゆる転置ファイルはxr.cにあたる。


| | 2008-03-13 01:47

Comment

Commenting is closed for this article.