Folksonomy及其國外研究進(jìn)展:國外白發(fā)研究進(jìn)展
發(fā)布時間:2020-03-07 來源: 散文精選 點擊:
〔摘要〕闡述了folksonomy的概念與分類原理,指出了其與傳統(tǒng)分類法的不同。分析了folksonomy在類目結(jié)構(gòu)、信息組織、信息資源揭示等方面的優(yōu)勢以及在語義表達(dá)、語法控制、語義普遍認(rèn)知方面的劣勢。從存在價值、基于tag的定量分析、用戶定量分析、系統(tǒng)設(shè)計與應(yīng)用、缺陷解決措施以及檢索等六個方面系統(tǒng)介紹了folksonomy的國外研究進(jìn)展。
〔關(guān)鍵詞〕folksonomy 網(wǎng)絡(luò)信息分類法 tag
〔分類號〕G254.11 TP393
Folksonomy and Related Research Progress in Some Advanced Countries
Yu Jinxiang
School of Economics and Management, South China Normal University, Guangzhou510006
〔Abstract〕This paper firstly expounds the conception and the classification principles of folksonomy, and points out the differences between folksonomy and the traditional classification methods. Then, it analyzes folksonomy"s advantages on its category structure, information organization, information resources disclosure and disadvantages on semantics expression, grammar controlling and semantics cognition. At last, the paper introduces foreign research progress of folksonomy systematically from the aspects of the value of existing, the quantitative analysis based on tag, user quantitative analysis, system design and application, flaw solution measures and retrieval technologies.
〔Keywords〕folksonomy internet information classification tag
1引言
Folksonomy是由folks和taxonomy組合而來,folks在英文中是比較口語化的詞,表示一群人、一伙人的意思,taxonomy是指分類法,它是信息架構(gòu)中的重要部分。Folksonomy是指一種社群參與人運用自由定義tag(標(biāo)簽)的方式進(jìn)行協(xié)作分類的活動,主要機制是基于開放性元數(shù)據(jù)標(biāo)準(zhǔn)和自然語言的社群聚類,現(xiàn)有“分眾分類法”、“通俗分類法”、“大眾分類法”、“民眾分類法”等不同翻譯。分類的原理為向社群參與者提供一種協(xié)同構(gòu)建與共享各自網(wǎng)絡(luò)資源標(biāo)簽的開放式平臺,用戶通過自己制定的分類標(biāo)準(zhǔn)來提交tag,由用戶群體定義tag的頻率來決定信息的組織方式。這種標(biāo)簽包括網(wǎng)絡(luò)內(nèi)容的分類、大意與鏈接地址等,tag對每個人都是完全開放的,用戶可以自由查看并修改自己提交的標(biāo)簽。
Folksonomy與傳統(tǒng)網(wǎng)絡(luò)信息分類法最大的不同在于它并不采用嚴(yán)格的分類標(biāo)準(zhǔn),其分類全部由用戶直接提交,分類的形成過程完全是自發(fā)的。這種分類是平面化的,沒有等級層次的劃分,雖然它相對不夠嚴(yán)謹(jǐn),缺乏準(zhǔn)確度,但是在社會性軟件中,這種平面延伸的分類方法卻在無形之中成為了方便、靈活、不受條件限制地溝通渠道。所以以自定義標(biāo)簽形式的大眾分類在現(xiàn)下流行的社會性網(wǎng)絡(luò)服務(wù)中得到了廣泛的應(yīng)用,如:Flickr、Furl、Del.icio.us、Frassle、Simpy、Spurl、Technorati、FotoFlix、Simpy、OpenBM等。應(yīng)該說,國內(nèi)對于folksonomy的研究還處于初步階段,因此,了解國外的研究對于國內(nèi)的研究和實踐具有非常重要的意義。
2Folksonomy的優(yōu)劣勢分析
2.1Folksonomy的優(yōu)勢
2.1.1平面化、非等級結(jié)構(gòu)的類目結(jié)構(gòu)傳統(tǒng)分類法具有嚴(yán)密的等級結(jié)構(gòu)和邏輯體系,folksonomy則是平面的、非等級的。一些門戶網(wǎng)站和搜索引擎對信息的組織一般采用類目細(xì)分的方式來進(jìn)行分類,如果分類體系過多,會增加網(wǎng)民的認(rèn)識負(fù)擔(dān)、影響檢索效率;如果分類體系過少,則會影響分類體系的清晰度,增加網(wǎng)民瀏覽選擇的負(fù)擔(dān)[1]。而folksonomy通過tag的字號大小以及顏色的不同來表示其“受歡迎”的程度,能夠?qū)崿F(xiàn)快速而自動的信息聚類,生成系列加權(quán)列表和標(biāo)簽總圖(TagCloud),具有較強的大眾趨同性,直觀性和易用性強。
2.1.2低成本的信息組織方式Adam提出網(wǎng)絡(luò)信息資源的組織有三種方式:由圖書館ICP服務(wù)商和其他信息機構(gòu)提供的檢索目錄、作者創(chuàng)建元數(shù)據(jù)、用戶交流和共享產(chǎn)生的信息描述。folksonomy通過用戶共享元數(shù)據(jù)來實現(xiàn)合作分類和交流,相對于前兩種信息組織方式而言,無需預(yù)先編制、維護(hù)和學(xué)習(xí)龐大的分類體系表,也無需掌握專門的圖書館領(lǐng)域?qū)I(yè)技術(shù)方法和專業(yè)培訓(xùn),能夠節(jié)省用戶的時間和精力[2]。
2.1.3多維度揭示信息資源 作為folksonomy類目的tag,它既不同于關(guān)鍵詞、也不同于目錄和主題詞。Tag是對文章概括和理解基礎(chǔ)上產(chǎn)生的,是對內(nèi)容的個人理解上的私人標(biāo)注,未必針對主題,可能是時間、內(nèi)容或與文章主題無關(guān)的詞匯,因此標(biāo)簽的設(shè)定要比關(guān)鍵詞自由和方便,它可以從多個維度來揭示信息內(nèi)容。在以目錄為基礎(chǔ)的存儲體系中,目錄結(jié)構(gòu)必須要事前規(guī)劃,而tag可以不考慮目錄結(jié)構(gòu)并以較少的代價細(xì)化分類。folksonomy的類目是由用戶定義一個或幾個tag組成,沒有明確定義tag之間的關(guān)系,各個tag之間的關(guān)系是平等的,但是又可以根據(jù)相關(guān)性分析,將經(jīng)常一起出現(xiàn)的tag關(guān)聯(lián)起來,而產(chǎn)生一種相關(guān)性的分類,它不像傳統(tǒng)分類法和分類表,有多重明確的關(guān)系。此外,它還能解決傳統(tǒng)分類法更新慢,不能及時面對新出現(xiàn)的學(xué)科和專業(yè)術(shù)語的問題。
2.2Folksonomy的劣勢研究
狹義的分類是以嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)邏輯為線索,以學(xué)術(shù)信息的匯集、樹立和查詢?yōu)槟康模詫W(xué)術(shù)為軸心,而tag是以個人的感性邏輯即個人的知識、情感、意志、記憶、素養(yǎng)等綜合素質(zhì)的反應(yīng)為線索,以個人所需信息的匯集、梳理和查詢?yōu)槟康,以個人的經(jīng)驗為基礎(chǔ)[3]。但是,對于他人或是整個分類體系而言,folksonomy是模糊的,不精確的,隨意的。此外,同名異義的問題也導(dǎo)致了它的模糊性:①一詞多義產(chǎn)生的意義分歧。②縮略詞產(chǎn)生的問題:例如在一些社會性書簽網(wǎng)站中,“ANT”是社會學(xué)領(lǐng)域“Actor Network Theory”的縮寫,但是在del.icio.us中,它卻是Java編程語言中的一種工具。
Folksonomy缺乏同義詞、英文單復(fù)數(shù)控制以及標(biāo)題、詞語順序等語法控制。同時,folksonomy的中文運用問題上還存在著分詞結(jié)構(gòu)模糊;在不同的語言環(huán)境下,對語義的普遍認(rèn)知存在明顯差異的問題;垃圾標(biāo)簽的出現(xiàn)使宏觀標(biāo)簽總圖的準(zhǔn)確性下降,對垃圾信息和標(biāo)簽的合理使用還沒有行之有效的解決方法[4]。
目前,folksonomy的使用范圍有限,這種分類法的組織對象基本上是非學(xué)術(shù)的、面向生活的、公眾的,目前僅限于blog等社會性網(wǎng)站的組織和管理,而這部分信息在網(wǎng)絡(luò)信息空間中僅是微量部分。由于受語言、風(fēng)俗習(xí)慣、文化背景等的影響,在跨國界、跨時空、跨文化的信息組織和交流中仍然存在很多障礙,作為一種基于自然語言產(chǎn)生的新的網(wǎng)絡(luò)信息組織方式,folksonomy仍然存在許多的問題。
3國外folksonomy研究進(jìn)展
國外對folksonomy理論方面的研究始于2005年,通過對國外文獻(xiàn)的閱讀和分析,筆者認(rèn)為國外對folksonomy的研究主要集中在以下6個方面:
3.1Folksonomy存在價值的研究
自由分類法這一概念的產(chǎn)生晚于它的應(yīng)用,最初的討論集中在其存在價值的研究:Admam認(rèn)為folksonomy將取代以往由專家控制的元數(shù)據(jù)編輯管理;Clay認(rèn)為folksonomy是有勝于無的方案;Shelly認(rèn)為傳統(tǒng)分類法過于復(fù)雜,維護(hù)成本高;Louis認(rèn)為folksonomy缺乏檢索功能、精確性不強。
3.2基于tag的定量分析
Lambiotte采用了概率論和數(shù)學(xué)建模的方法對專業(yè)音樂網(wǎng)站數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)使用tag描述在線合作性分類產(chǎn)成了由不同結(jié)點即用戶、款目和標(biāo)簽構(gòu)成的三重網(wǎng)絡(luò)。其次,通過分析用戶使用款目和tag之間的關(guān)系分析了這三個要素構(gòu)成的無序網(wǎng)絡(luò)。再次,采用過濾技術(shù)來分析用戶的合作性行為,認(rèn)為網(wǎng)絡(luò)的等級結(jié)構(gòu)產(chǎn)生了對用戶類型的統(tǒng)計定義,提取了合作性過濾和分類之間的直接連接關(guān)系并提出了合作性社群中測量用戶多樣性的方法[5]。
Christopher通過對Technorati中排名前350的tag以及分享同一tag文章的相似性進(jìn)行定量研究,分析了blog標(biāo)簽分類的有效性。發(fā)現(xiàn)tag在粗略的分類體系中是有效的,但是在表明特殊的文章內(nèi)容時是無效的,tag與自動抽詞高度相關(guān),可以高度聚焦分類文章。討論了未來tag成為信息組織和檢索工具更加有效的方法:更具表達(dá)力和簡潔性、易用tag的形成;用戶對tag分群,tag間特定關(guān)系的闡釋,tag與特定的人或物相關(guān);產(chǎn)生幫助用戶自動形成文章tag的工具;標(biāo)簽發(fā)展為社會現(xiàn)象的興趣研究等[6]。
3.3基于用戶的定量分析
Ciro采用統(tǒng)計學(xué)和概率論的方法對del.icio.us和Connotea中的tag進(jìn)行了統(tǒng)計分析,構(gòu)架了用戶使用合作性標(biāo)簽的隨機模型,該模型包含兩個要素:對于他人標(biāo)記活動感知的用戶偏好機制以及系統(tǒng)中tag的時效性。盡管用戶個體的認(rèn)知過程是復(fù)雜的,個體的分類、標(biāo)記標(biāo)簽的行為是錯綜復(fù)雜的,但是在合作性標(biāo)簽系統(tǒng)內(nèi),用戶普遍的標(biāo)記行為卻遵循著簡單的活動模式[7]。
Scott采用模型和圖表研究了用戶使用合作性標(biāo)簽系統(tǒng)的規(guī)律以及合作性標(biāo)簽系統(tǒng)的結(jié)構(gòu)、使用標(biāo)簽的頻率、各種標(biāo)簽的應(yīng)用、相關(guān)標(biāo)簽使用的穩(wěn)定性的分析,認(rèn)為tag反映了用戶興趣的發(fā)展變化[8]。
3.4系統(tǒng)的設(shè)計及應(yīng)用研究
Cameron建立了基于資源、用戶和標(biāo)簽的網(wǎng)絡(luò)標(biāo)簽?zāi)P停缓笠?2個標(biāo)簽系統(tǒng)為例,設(shè)計了標(biāo)簽系統(tǒng)的模塊和系統(tǒng)屬性,這些模塊為:使用標(biāo)簽的權(quán)限、標(biāo)簽的聚集、標(biāo)簽支持/供給、資源的類型、來源、資源的鏈接、群體在系統(tǒng)中的連通性。分析了用戶添加tag時的7種動機即未來檢索、貢獻(xiàn)和分享、注意力的吸引、競爭、自我表現(xiàn)、觀點表達(dá)等以及這7種動機對標(biāo)簽系統(tǒng)的不同影響,并在flicker中進(jìn)行了實驗。該標(biāo)簽系統(tǒng)為開發(fā)者和設(shè)計者提供了基于tag的模型設(shè)計和基本思路[9]。
Satoshi Niwa認(rèn)為,由于難以收集用戶偏愛網(wǎng)頁的數(shù)據(jù)、因特網(wǎng)上的網(wǎng)頁數(shù)量龐大,通過協(xié)作性過濾來構(gòu)建網(wǎng)頁評價體系的嘗試存在一定困難,提出了通過正在流行的folksonomy和社會性書簽工具來構(gòu)建覆蓋整個網(wǎng)絡(luò)網(wǎng)頁評價系統(tǒng)的方法[10]。
多倫多大學(xué)Jennifer和美國丹佛藝術(shù)博物館Bruce提出博物館的收藏支持社會性書簽,并且提供基于folksonomy的檢索,這給開放的博物館一種新的闡釋[11]。
Darlene指出對于內(nèi)部網(wǎng)而言,通過標(biāo)簽可以自由分享未曾發(fā)現(xiàn)的數(shù)字資源。通過賓夕法尼亞大學(xué)圖書館的Penn Tags的社會性書簽服務(wù)項目和哈佛大學(xué)Berkman互聯(lián)網(wǎng)社會研究中心的H20 Playlist項目以及IBM引入folksonomy理念開發(fā)的企業(yè)社會性書簽工具dogear來說明站點管理員可以試著使用多種社會性軟件來支持標(biāo)簽活動并指出標(biāo)簽活動可以消除信息分類者和員工對信息理解的分歧[12]。
3.5Folksonomy缺陷解決措施研究
日本學(xué)者從認(rèn)知學(xué)雙循環(huán)滿意原則即及時滿意和延時滿意的角度來解決folksonomy信息質(zhì)量、信息分享問題,并且針對分類法的非連續(xù)性和同名義意的問題提出了解決辦法,并且提出了基于元數(shù)據(jù)的個人本體框架[13]。
Louis提出元數(shù)據(jù)生態(tài)學(xué)的概念,基本思想為:設(shè)計合理的元數(shù)據(jù),建立可控的、動態(tài)發(fā)展的元數(shù)據(jù)詞匯表,同時鼓勵作者和用戶創(chuàng)造folksonomy詞匯,并作為受控詞表收詞的備選,與受控詞表一起構(gòu)建和諧的網(wǎng)絡(luò)信息組織環(huán)境[14]。
3.省略網(wǎng)站和美味書簽中進(jìn)行了URLCount和URLRank、TagCount以及TagRank和UserRank檢索結(jié)果的比較和分析[15]。
Andreas研究了folksonomy的信息檢索問題,構(gòu)建了folksonomy的模型和FolkRank檢索機制,并采用這種新的檢索運算法則來研究folksonomy的結(jié)構(gòu)。采用FolkRank運算法則計算了特定主題的排序,并且比較了FolkRank和PageRank間的不同[16]。
Al-KhalifaScott通過測量folksonomy和yahoo關(guān)鍵詞設(shè)置的重疊率以及索引者主觀評價兩種系統(tǒng)產(chǎn)生的關(guān)鍵詞的質(zhì)量,來對基于相同網(wǎng)站的yahoo API文本語詞抽取技術(shù)和folkson-omy進(jìn)行評價[17]。
4結(jié)語
Folksonomy作為一種出現(xiàn)不久的網(wǎng)絡(luò)信息組織方法,缺乏重量級的應(yīng)用,對其研究還需進(jìn)一步加強。了解國外folksonomy的最新研究概況,汲取國外構(gòu)建各種模型、tag系統(tǒng)時的經(jīng)驗和研究方法,對促進(jìn)我國folksonomy的研究將有積極的促進(jìn)意義。
2005年5月10日國內(nèi)博客網(wǎng)站blogbus首次推出tag功能并與專業(yè)搜索引擎Technorati整合,標(biāo)志著folksonomy理念進(jìn)入中國并逐步被采用。雖然目前使用或知道tag的網(wǎng)民還主要限于網(wǎng)上博客,標(biāo)簽軟件的應(yīng)用標(biāo)準(zhǔn)等尚待完善,folksonomy尚需后受控手段與受控語言的融合,但網(wǎng)民卻接受了這種“有勝于無”的方案。在Web2.0時代,每個人都有權(quán)自由獲取、組織和使用信息,而folksonomy作為反映草根文化和民間力量的信息組織方式,為用戶提供了一個契機,它將促進(jìn)全球信息的分享、交流乃至文化融合、世界大同的共有理念的形成。
參考文獻(xiàn):
[1] 周榮庭,鄭彬.分眾分類:網(wǎng)絡(luò)時代的新型信息分類法.現(xiàn)代圖書情報術(shù),2006(3):72-75.
[2] 梁桂英,李記旭.folksonomy初探.圖書館雜志,2006(4):46-49.
[3] tag-我分類.[2006-6-25].http://www.省略/maozixi-ansheng/.
[4] Folksonomy與語言的關(guān)系以及中文應(yīng)用的問題.[2006-06-25].http://blog.省略.
[5] Lambiotte R, Ausloos M. Collaborative tagging as a tripartite network.[2006-08-15].省略/abs/cs.DS/0512090.
[6] Brooks C H, Montanez N. An analysis of the effectiveness of tagging in blog.[2006-08-15].http://www.cs.usfca.edu.
[7] Cattuto C, Loreto V,Pietronero L. Collaborative tagging and semiotic dynamics.[2006-08-15].省略/.
[8] Golder S A, Huberman B A. The structure of collaborative tagging systems.[2006-08-15].省略/
[9] Marlow C. Tagging paper, taxonomy, flickr, academic article,to read.[2006-08-15].http://www.省略.
[10] Niwa S, Doi T, Honiden S. Web page recommender system based on folksonomy mining for ITNG?6 Submissions.[2006-08-15].http://ieeexplore.省略/.
[11] Trant J, Wyman B. Investigating social tagging and folksonomy in art museums withsteve.museum.[2006-08-15].http://www.省略.
[12] Fichte D. Intranet applications for tagging and folksonomies.[2006-08-20].http://www.省略.
[13] Ikki Ohmukai, Masahiro Hamasaki, Hideaki Takeda. A Proposal of Community-based Folk-sonomy with RDF Metadata.[2006-08-15].http://www.ifi.unizh.ch/.
[14] Rosenfeld L. Folksonomies? How about metadata eco1ogies7.[2006-08-15].http://www.省略.
[15] Szekely B, Torres E. Ranking bookmarks and bistros:Intelligent community and folksonomy development.[2006-08-15].http:/ /torrez.us/.
[16] Hotho A, Jaschke R, Schmitz C, et al. Information retrieval in folksonomies:search and ranking.[2006-08-15].http://www.kde.cs.
[17] Al-Khalifa H S, Davis H C. Folksonomy versus autionmatic keywaord extraction: an empirical study.[2006-08-15].http://eprints.ecs.soton.ac.uk/.
〔作者簡介〕 余金香,女,1983年生,碩士研究生。
相關(guān)熱詞搜索:研究進(jìn)展 國外 Folksonomy Folksonomy及其國外研究進(jìn)展 國外自由基研究進(jìn)展 國外基坑研究新進(jìn)展
熱點文章閱讀