亚洲裸男gv网站,国产精品毛片无码,亚洲国产精品无码久久久秋霞1,人妻 日韩 欧美 综合 制服

切換城市 [ 北京 武漢 ]24小時聯(lián)系電話:
24小時聯(lián)系電話: 15201609116
切換城市 [ 北京 武漢 ]

有事點這里 有事點這里  有事點這里 有事點這里

新聞資訊NEWS

垂直搜索引擎發(fā)展策略探討日期:2009/11/13 11:38:50  

垂直搜索引擎發(fā)展現(xiàn)狀

  互聯(lián)網(wǎng)最基礎(chǔ)的功能即提供信息。2008年1月,中國互聯(lián)網(wǎng)絡(luò)信息中心在北京發(fā)布《第21次國際互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》,調(diào)查結(jié)果顯示,目前2.1億網(wǎng)民中使用搜索引擎的比例是72.4%,即已有1.52億人從搜索引擎獲益,半年凈增加3086萬人。位列網(wǎng)絡(luò)應(yīng)用中網(wǎng)絡(luò)音樂、即時通信、網(wǎng)絡(luò)影視和網(wǎng)絡(luò)新聞之后的第五位,高于電子郵件。與其他國家相比,由于中國互聯(lián)網(wǎng)仍舊是娛樂功能占主體,總體網(wǎng)民的搜索引擎使用率偏低。

  垂直搜索引擎是搜索引擎行業(yè)保持高增長的重要力量。據(jù)調(diào)查,目前中國互聯(lián)網(wǎng)中的垂直搜索引擎日益發(fā)展壯大,不斷有面向新行業(yè)的垂直搜索引擎網(wǎng)站出現(xiàn),例如,有面向房子的搜房網(wǎng),有面向求職的職業(yè)搜索,有面向?qū)W術(shù)的學術(shù)搜索等。

  目前垂直搜索引擎所用的技術(shù)模式和通用搜索引擎的技術(shù)基本相同。首先通過網(wǎng)絡(luò)蜘蛛對互聯(lián)網(wǎng)的網(wǎng)頁進行抓取,進而獲得元數(shù)據(jù),然后對元數(shù)據(jù)進行分析處理,根據(jù)關(guān)鍵詞的權(quán)重和其鏈接的關(guān)系,計算出該網(wǎng)頁的重要度,存入數(shù)據(jù)庫。當用戶提交關(guān)鍵詞的時候,針對該關(guān)鍵詞進行查詢,進而將結(jié)果返回給用戶,這就是垂直搜索引擎的一般工作流程。

  目前垂直搜索引擎的主要盈利模式是基于競價排名的廣告模式,具體廣告主在向垂直搜索引擎購買該項服務(wù)后,通過注冊一定數(shù)量的關(guān)鍵詞,按照付費最高者排名靠前的原則,購買了同一關(guān)鍵詞的網(wǎng)站按不同的順序進行排名,出現(xiàn)在網(wǎng)民相應(yīng)的搜索結(jié)果中。

  垂直搜索引擎的優(yōu)勢分析 

  互聯(lián)網(wǎng)迅速發(fā)展。依賴搜索引擎是避免信息爆炸的快捷方式,而對于一個行業(yè),信息量也是越來越大,準確抓住需要的信息,過濾無用信息是每個行業(yè)的從業(yè)者必須面對的課題,垂直搜索引擎為他們提供了好工具,幫助他們把握住行業(yè)發(fā)展的方向,并為想了解該行業(yè)的人提供一個便利方式。

  商業(yè)公司對其日益重視。搜索引擎是人們登陸互聯(lián)網(wǎng)的門戶,垂直搜索引擎則是它所面向行業(yè)的門戶,在這里進行廣告投資,獲得巨大收益的概率大,所以每個商業(yè)公司都會重視對其相關(guān)行業(yè)的垂直搜索引擎投資。

  擁有巨大價值的用戶搜索數(shù)據(jù)。垂直搜索引擎是面向行業(yè)、專注行業(yè)的搜索引擎,而使用垂直搜索引擎的人也都是和該行業(yè)有著密切關(guān)系的人,垂直搜索引擎記錄著這些人的搜索數(shù)據(jù),這些數(shù)據(jù)經(jīng)過整理之后將會對該行業(yè)的發(fā)展有巨大的指導作用和巨大的價值。  

  垂直搜索引擎面臨的問題  

  (一)搜索排名與搜索結(jié)果的用戶滿意度不一致

  垂直搜索引擎廣告收入是其收入的巨大來源,而競價排名方案是其廣告的主要模式,但是競價排名模式是根據(jù)廣告客戶購買關(guān)鍵詞的出價多少來決定該關(guān)鍵詞的查詢結(jié)果的排列順序,這就帶來了一系列問題。出價高的網(wǎng)頁就排列在前,出價少或沒有出價的網(wǎng)頁就必然會被排列在后。根據(jù)統(tǒng)計研究表明,一般用戶使用搜索引擎的習慣是只看到第三頁,后面的搜索結(jié)果對用戶來說是沒有意義的,這就可能導致用戶搜索后無法得到他想要的結(jié)果,或者要經(jīng)過更多次的翻頁才能找到需要的網(wǎng)頁,而排列在前面的那些出價很高的網(wǎng)頁對他的價值不一定高于那些出價少排列在后的網(wǎng)頁。這就極大地破壞了用戶體驗,干擾了用戶的信息獲取。如果無法在廣告和信息準確度做出均衡,一味地根據(jù)廣告費用來決定頁面的排列方式,這將會帶來用戶的不信任,進而用戶會大量流失,失去用戶的互聯(lián)網(wǎng)企業(yè),是沒有生存空間的,但是沒有廣告收入,對垂直搜索行業(yè)也是無法承受的。所以,如何對廣告和用戶體驗綜合調(diào)整,盡可能讓廣告客戶獲得廣告效益,又使得用戶獲得滿意的搜索結(jié)果是亟待解決的問題。

  (二)與相關(guān)行業(yè)聯(lián)系度低

  垂直搜索引擎發(fā)展至今,對通用搜索引擎的模式進行了大量克隆。但是,因為通用搜索引擎面向的是所有行業(yè),各種行業(yè)在通用搜索引擎看來,沒有高下之分,而對于垂直搜索引擎,這方面就完全不同于通用搜索引擎。如果垂直搜索引擎不能和所面向的行業(yè)進行緊密結(jié)合,就無法獲得與通用搜索引擎的差異化優(yōu)勢。目前垂直搜索引擎的數(shù)據(jù)采集還是通過網(wǎng)絡(luò)蜘蛛在互聯(lián)網(wǎng)上進行爬行,抓取頁面,進而分析關(guān)鍵詞,獲取行業(yè)數(shù)據(jù),還是停留在傳統(tǒng)的搜索引擎抓取數(shù)據(jù)的方式,這就導致最后的用戶查詢和在通用搜索引擎上的查詢效果并無二致,這種情況肯定無法吸引用戶,也無法發(fā)揮自己專業(yè)查詢的優(yōu)勢。而且由于對該行業(yè)的了解無法深入,和該行業(yè)的從業(yè)人員也不能進行有效的溝通,自然無法了解該行業(yè)的真正需求。雖然表面看來有模有樣,但只是一個披著行業(yè)外皮的通用搜索引擎,無法設(shè)計出行業(yè)需求的功能模塊,自然無法吸引行業(yè)客戶投入廣告或者分享數(shù)據(jù)!

  促進垂直搜索引擎發(fā)展的對策  

  (一)優(yōu)化采集策略和數(shù)據(jù)來源

  對于垂直搜索引擎的采集策略來說,必須不同于通用搜索引擎的采集策略。從互聯(lián)網(wǎng)中準確快速提取出本行業(yè)的數(shù)據(jù),關(guān)鍵詞是一個很關(guān)鍵的因素,所以必須和該行業(yè)的專業(yè)人士進行溝通,由他們提供基于本行業(yè)的關(guān)鍵詞。另外,用戶也可以向搜索引擎提交關(guān)鍵詞,在管理員審核通過的情況下,也添加進入關(guān)鍵詞序列,定期對關(guān)鍵詞整理,去除使用頻率低的關(guān)鍵詞,并添加新近出來的新詞。在有一個維護良好的新詞表的基礎(chǔ)上,優(yōu)化策略就有了一個好的開始。由于現(xiàn)在網(wǎng)頁html語言越來越規(guī)范化,這也給采集帶來了方便。根據(jù)研究發(fā)現(xiàn),一個網(wǎng)頁的主題決定了一個網(wǎng)頁的內(nèi)容,也就是在之間的部分,只要通過網(wǎng)絡(luò)蜘蛛先抓部分的內(nèi)容,之后再將抓取的部分和關(guān)鍵詞列表進行對比,如果主題里含有關(guān)鍵詞超過規(guī)定的閾值,就繼續(xù)抓取,否則,就放棄抓取。這種改進的抓取策略可以有效地改善抓取的效率和準確度。

  在數(shù)據(jù)來源方面,如果只從互聯(lián)網(wǎng)上獲取數(shù)據(jù),那就無法體現(xiàn)垂直搜索引擎專業(yè)化的優(yōu)勢,必須從別的渠道獲取行業(yè)數(shù)據(jù),這樣才能充分發(fā)揮垂直搜索引擎的特點。可以采用激勵制度,鼓勵用戶提供數(shù)據(jù),如果提供的數(shù)據(jù)很有價值,而且本身搜索引擎沒有收錄,可以給予用戶獎勵。購買一些收費資料,可以采取廣告分成或收費檢索的方式進行收錄?傊,行業(yè)資料要盡可能地全面。

  (二)進行有效的數(shù)據(jù)挖掘

  數(shù)據(jù)挖掘,就是對用戶在查詢結(jié)果出現(xiàn)后的瀏覽行為和關(guān)鍵詞輸入記錄,并進行有效整理統(tǒng)計分析,進而根據(jù)所獲得的相關(guān)數(shù)據(jù)進行二次應(yīng)用。可以據(jù)此對查詢結(jié)果進行重新排序,把和用戶興趣相似度高的排列在前面,以此來緩解競價排名帶來的負面影響?梢詫⒋藬(shù)據(jù)提供給行業(yè)用戶進行商業(yè)決策。具體措施如下:

  第一,挖掘用戶瀏覽習慣。獲取用戶的瀏覽習慣是對用戶對搜索結(jié)果滿意度反饋的獲取,有如下行為可以判斷用戶對某一鏈接興趣度高:點擊鏈接網(wǎng)頁后鏈接的層次,打開鏈接網(wǎng)頁后網(wǎng)站的持續(xù)打開時間,用戶打開網(wǎng)站后有無復制文本,保存鏈接進入收藏夾等行為。如果產(chǎn)生上述行為,可以認為此鏈接用戶興趣度高,此鏈接相比其他搜索結(jié)果更有價值,同時,由于網(wǎng)頁瀏覽并發(fā)性高,時間短,理論上通過客戶端記錄用戶行為效果最好,但是用戶對后臺監(jiān)控自己行為的軟件內(nèi)心是一種反感態(tài)度,軟件本身也無法使用戶相信不會泄露用戶的隱私,所以不宜采用,在當前條件下,由于電腦日益普及,個人電腦的保有量大大增加,所以采用ip和cookies可以近似地保證用戶數(shù)據(jù)的單一性和獨立性,具體操作的流程如下:

  啟動垂直搜索引擎,搜索引擎獲得cookies和ip,在數(shù)據(jù)庫查找該用戶的信息,如果沒有信息,則新建一個用戶,如果存在該用戶,則在數(shù)據(jù)庫中調(diào)用該用戶已經(jīng)存在的瀏覽興趣數(shù)據(jù)。

  提交關(guān)鍵詞,搜索引擎接收關(guān)鍵詞,獲得搜索結(jié)果,并根據(jù)用戶的瀏覽興趣表,將瀏覽興趣表和原始搜索結(jié)果進行相關(guān)性計算,之后將結(jié)果返回給用戶瀏覽器。

  通過每次用戶瀏覽該結(jié)果的過程進行記錄,并將此記錄迭代更新到用戶興趣表,反復進行,隨著用戶搜索的持續(xù)進行,則用戶的搜索結(jié)果的排序越來越接近他自己想要的結(jié)果,并且用戶興趣表對用戶的愛好的反映也和用戶本身的愛好相似度越來越高,從而抽象出用戶的興趣模型,使用戶的滿意度提高。

  第二,挖掘行業(yè)關(guān)注點。作為關(guān)注點在所面向行業(yè)的垂直搜索引擎,可以在用戶查詢時對其所輸入的關(guān)鍵詞進行記錄,之后在一個時間間隔內(nèi)(3個月或半年)對這些關(guān)鍵詞進行統(tǒng)計分析一次,就能夠獲取這個時間區(qū)間內(nèi)用戶對這個行業(yè)的各方面關(guān)注情況,這些資料對于從事該行業(yè)的企業(yè)來說很有價值,并將帶來生產(chǎn)、營銷收益。這些數(shù)據(jù)都是來源于用戶的搜索記錄,不存在修改、偽造,反映出的數(shù)據(jù)是真實可靠的,因此可以用作決策參考。企業(yè)根據(jù)資料所反映的情況,調(diào)整自己的生產(chǎn),營銷策略,去適應(yīng)用戶和市場的需求,以在市場上獲得先機。同時通過給企業(yè)用戶提供搜索報告,可以和他們交換一些互聯(lián)網(wǎng)沒有的行業(yè)資料,實現(xiàn)雙贏的效果。

  第三,廣告推薦。作為競價排名廣告的有益補充,數(shù)據(jù)挖掘技術(shù)在推薦廣告方面也可以發(fā)揮出它的作用,使得企業(yè)所投放的廣告獲得更好的收益。當獲得一系列用戶的興趣模型,即可對這些用戶進行相應(yīng)的聚類分析,得出有相同愛好的一類用戶。這時,就可以根據(jù)用戶的愛好和興趣度,進行相應(yīng)的廣告投放和產(chǎn)品推薦,所投放的廣告由于是基于用戶的愛好,二者之間有很高的相似度,用戶一般也樂于接受,不會造成反感,認可度更高,效果也要比沒有選擇性的廣告好很多。

  (三)集成行業(yè)優(yōu)勢并發(fā)展成為該行業(yè)的門戶

  通過和該行業(yè)的從業(yè)人員進行有效溝通,以及對該行業(yè)進行充分調(diào)研了解,對垂直搜索引擎進行不斷改造、更新,使其在該行業(yè)發(fā)揮出越來越重要的作用,進而成為該行業(yè)的門戶,這時就可以依托門戶優(yōu)勢,成為電子商務(wù)的中介平臺。比如一個面向玩具的垂直搜索引擎,就可以采用如下模式進行中介,用戶搜索某一玩具,搜索引擎利用自己整合優(yōu)勢,通過運算比較,返回給用戶最合適的購買方案,如果用戶對該玩具只有模糊的印象,搜索引擎也可以根據(jù)用戶提供的信息在龐大的資料庫內(nèi)進行有效的查詢,返回用戶最滿意的結(jié)果,進而用戶就可以根據(jù)返回的結(jié)果選擇購買。由此可以看出,搜索引擎通過龐大、準確的行業(yè)庫可以提供買賣方的有效信息互動,減少買賣方的成本。

  (四)發(fā)展移動搜索

  隨著手機的逐漸普及,以及3G技術(shù)的迅速鋪開,移動搜索也已經(jīng)提到議事日程來,未來的互聯(lián)網(wǎng)將逐步轉(zhuǎn)移到移動平臺上,抓住移動平臺,也就抓住了商機。在移動平臺,垂直搜索引擎將發(fā)揮更加重要的作用,由于移動平臺自身的局限性,通用搜索引擎檢索信息在速度、準確度上都不適用于移動平臺,垂直搜索引擎自身的小、快、靈的特點與移動平臺相適合,二者相得益彰。手機通信是通過基站進行傳遞中轉(zhuǎn),如果和通信服務(wù)商進行合作,就可以在用戶提交查詢時獲取用戶的基站信息,通過基站信息就可以對用戶的位置進行大致定位,獲取用戶位置,從而進行一系列的針對性服務(wù)。(編選:中國搜索研究中心陳奇)

heet://haidanet.cn

咨詢電話:15201609116

地 址:北京市海淀區(qū)建材城中路12號院17號樓1層119室
武漢分公司地址:湖北省武漢市洪山區(qū)南國雄楚廣場A4棟2011室
鄭州分公司地址:河南鄭州金水區(qū)東風路科技市場對面米蘭陽光6號樓917室
郵 箱:haidanet@163.com
24小時聯(lián)系電話: 15201609116 13651084380