PDF格式網(wǎng)絡(luò)中文學(xué)術(shù)文獻(xiàn)的識別與檢索|百度學(xué)術(shù)如何檢索文獻(xiàn)
發(fā)布時(shí)間:2020-03-10 來源: 歷史回眸 點(diǎn)擊:
[摘要]學(xué)術(shù)文獻(xiàn)具有鮮明的文體特征,且部分特征能夠用于PDF格式網(wǎng)絡(luò)中文學(xué)術(shù)文獻(xiàn)的自動(dòng)識別與檢索。提取學(xué)術(shù)文獻(xiàn)在特有表述、句子平均長度、中西文比例等方面存在的特征,用來識別PDF格式的中文學(xué)術(shù)文獻(xiàn),對Google通用搜索引擎的搜索結(jié)果進(jìn)行重新排序。結(jié)果顯示文體特征的運(yùn)用能夠在一定程度上提高網(wǎng)絡(luò)PDF學(xué)術(shù)文獻(xiàn)的檢準(zhǔn)率。
[關(guān)鍵詞]網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn) 文體特征 PDF文件 信息檢索
[分類號]G252.7
相關(guān)熱詞搜索:中文 文獻(xiàn) 識別 PDF格式網(wǎng)絡(luò)中文學(xué)術(shù)文獻(xiàn)的識別與檢索 的學(xué)術(shù)資源檢索利用pdf 常用的中文學(xué)術(shù)資源
熱點(diǎn)文章閱讀