河南新鄉知名網站建設、網站優化、網絡推廣服務公司 TEL:0373-3685823

談談反向索引壓縮算法的評估指標

作者 企翔網絡 來源 企翔網絡 瀏覽 發布時間 19/05/29

  目前有很多種倒排列表壓縮算法可供選樣,但是評判算法的優劣需要定量指標。般來說,評價例排列表壓縮算法會考慮3方面的指標1壓縮率、壓縮速度和解壓速度。
  所謂壓縮率,是數據壓縮前大小和壓縮后大小的比例關系,很明顯,莊縮率越高越節省磁盤空間,同時也節省了倒排列表從磁盤讀入到內存的I/O 時間。
  壓縮速度是指用縮定的數據所花費的時間,相劉而言,這個指標不如其他兩個標重要,因為壓縮往社是在建立索引過程中進行的,而建立索引是個后臺運行過程, 需要即時響應用戶查詢,即使速度慢些也沒有太大關系。另外,建立索引的次數相對也不算多,所以從兒個方面考慮,壓縮速度不是個重要指標。
談談反向索引壓縮算法的評估指標
   解壓速度在3個指標中是重要的,其含義是將壓縮數據再次恢復為原始數據所用的時間。因為搜索引擎在響應用戶查詢時,從磁盤讀入的是壓縮后的數據,需要實時解壓數據以快速響應用戶,所以解壓速度自接關系到系統的用戶體驗,其重要性不言而喻。