準備
export GETAROOT=/home/geta/geta2
export LANG=ja_JP.EUC-JP
cd $GETAROOT
mkdir data
mkdir data/manyo.geta.void.in
ci.conf
handle: manyo.geta.void.in
short-name: manyo
WAM作成
sbin/mkw manyo frqs/manyo/manyo.frq
WAM内容確認
bin/dumpwam manyo xr_row
cw.rは文書名と文書IDとの対応表。cw.cはタームとタームIDの対応表。xr.rは、文書ごとにタームベクトルが記録された表(文書-単語連想に使用)。xr.cは、単語ごとに文書ベクトルが記録された表(単語-文書連想に使用)。いわゆる転置ファイルはxr.cにあたる。
| | 2008-03-13 01:47