一個經典的頁面數據采集工具RoadRunner.其關鍵思想是通過處理頁面比較得到的mismatch來不斷地修改當前的模板,最終推導出能夠覆蓋例子頁面的模板,然后根據模板來實現對類似 頁面的信息抽取。
標簽: RoadRunner mismatch 頁 數據采集
上傳時間: 2016-06-16
上傳用戶:wangchong
蟲蟲下載站版權所有 京ICP備2021023401號-1