日本語農業文書20万件超を対象にした概念検索システム
農業・森林・水産関連の大規模文書集合を対象に、Semi-Discrete Matrix Decompositionを利用した検索システムを研究・実装。単純なキーワード一致では拾えない関連文書を探すため、ベクトル空間モデル、LSI、SVD比較、SDDによる省メモリ化を扱いました。
- 公開できる成果
- 論文PDF、発表資料、検索精度改善資料、SDD概念検索資料
- 技術要素
- 情報検索、VSM、LSI、SVD、SDD、Java、Web検索、農業コーパス
- 現在への応用
- 研究所・大学・企業向けのAI検索、RAG、社内ナレッジ検索、専門文書検索