開啟主選單

求真百科

全文檢索

於 2021年8月9日 (一) 20:03 由 HLY對話 | 貢獻 所做的修訂 (创建页面,内容为“{| class="wikitable" style="float:right; margin: -10px 0px 10px 20px; text-align:left" ! <p style="background: #D6A4AB; color: #000000; margin:auto; padding:5px 0; "…”)
(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

全文檢索

圖片來自tcc

全文檢索從文本或資料庫中,不限定資料欄位,自由地萃取出訊息的技術。[1]

執行全文檢索任務的程式,一般稱作搜尋引擎,它將使用者隨意輸入的文字,試圖從資料庫中,找到符合的內容。

目錄

全文索引的相關議題

演算法、搜尋策略之模型

  • 布林式 boolean
  • 統計模型 Probabilistic model
  • 向量空間模型 vector base model
  • 隱性語義模型 Latent semantic model

評量之準則

  • 查全率(recall rate),查準率(precision)

開放原始碼之全文檢索系統

和中文有關的議題

  • 斷詞
  • 語法解析
  • 古籍議題
  • 多語言混合

優化

  • 剔除字(Stopwords)
  • 詞性標註
  • -規範文件;權威檔-(authority file)
  • 知識體系,本體論(ontology)
  • 超連結分析(page rank)技術

歷史及未來之趨勢

  • 自由語句搜尋

參考文獻