<ins id="jxy61"><option id="jxy61"><menu id="jxy61"></menu></option></ins>
          1. 煉數成金 門戶 大數據 查看內容

            打破 Google 破壞性的搜索壟斷

            2021-2-23 13:25| 發布者: 煉數成金_小數| 查看: 28429| 評論: 0|原作者: Sambodhi 譯|來自: 人工智能學家

            摘要: 近來,Google 在搜索算法方面的壟斷地位,頻繁引起美國和歐洲的反壟斷關注。Google 在網絡搜索方面有絕對的優勢。近來,Google 在搜索算法方面的壟斷地位,也就是搜索引擎將 Google 自己的內容放在搜索結果的首位, ...
            近來,Google 在搜索算法方面的壟斷地位,頻繁引起美國和歐洲的反壟斷關注。

            Google 在網絡搜索方面有的優勢。近來,Google 在搜索算法方面的壟斷地位,也就是搜索引擎將 Google 自己的內容放在搜索結果的首位,自然引起了美國和歐洲的反壟斷關注。

            但是,Google 搜索業務的壟斷并非。由于擁有目前為止較大較好的在線索引,Google 的地位受到了保護。

            Daisuke Wakabayashi 在《紐約時報》(The New York Times)上寫道,軟件工程師 Zack Maril 成立了一個名為 “Knucklehead Club”(傻瓜俱樂部)的組織(因為只有傻瓜才會挑戰如此有錢有勢的公司)來研究并喚起人們對這一事實的關注。

            基于結構上的原因,我將在下面解釋,為了建立這樣一個索引而 “抓取”網絡的行為是自然的壟斷行為,而且由于 Google 的低調行為,沒有人會對其主導地位提出真正的挑戰!耙话銇碚f,人們不會談論這個問題,因為人們對它知之甚少! Maril 在接受采訪時告訴《周刊報道》(The Week)。世界各國政府都應該從公共利益的角度出發,對這家公司進行監管,或者干脆接管。

            首先,讓我解釋一下機制。在經濟學術語中,自然壟斷指的是高固定成本和低邊際成本的市場。電力就是一個典型的例子,它需要巨大的初始投資來建造發電廠,并將電線拉到每家每戶,此后,每增加 1 度電的成本幾乎為零。一家公司一旦建立了這樣的網絡,剛剛起步的新公司就幾乎不可能與之競爭了。

            Google 的網絡爬蟲也基本上處于相似的位置。原因如下:要運行搜索引擎,你需要對互聯網建立一個索引,這樣就可以搜索到東西了(就像圖書館里的卡片目錄一樣)。這樣的話,就必須定期抓取互聯網,盡可能多地復制網頁,這樣索引就能盡可能地廣泛和。

            這就給競爭設置了兩個障礙。第一點,也是最明顯的,互聯網是巨大的,因此要建立一個能看到其中哪怕一小部分的爬蟲,都需要巨大的投資。很長時間以來,Google 一直遙遙領先,以至于另一個科技巨頭微軟才開始參與競爭。

            第二點,更為微妙的是,網站所有者有限制所有非 Google 爬蟲的動機。創建一種互聯網規模的爬蟲可能很昂貴,但是創建一種只會抓取少量網站的爬蟲是很便宜的,人們之所以這樣做是有很多原因的。網站帶寬是要花錢的,而爬蟲的自動操作會消耗大量的帶寬。

            因此,很多管理員禁止所有類似爬蟲的活動,但 Google 卻獲得了豁免,因為 Google 的搜索結果顯示對流量有很大影響。(Knucklehead Club 的研究還表明,Google 從許多網站 獲得的利益甚至比這更多)。

            以上兩點意味著,任何新公司都不可能對 Google 網絡索引的統治地位構成嚴重威脅。大多數網站都會禁止任何新的主要爬蟲,因為它占用了網站的流量,并且帶來的回報很小,但是新的搜索引擎也不能增加流量,正因為它不能開發合適的索引來吸引用戶。

            甚至微軟,在它的搜索引擎必應花了幾年時間,耗費了幾十億美元,但還是遠遠落后于他們。正因為它不能開發合適的索引來吸引用戶。甚至微軟,在它的搜索引擎 Bing(必應)花了幾年時間,花了幾十億美元,但還是遠遠落后于他們。

            對于外行人來說,這也許沒什么大不了的。畢竟,Google 很不錯,所以我們大概不需要創建更多的網絡索引,或者迫使 Google 讓其他人使用它的索引,對嗎?甚至在搜索方面,人們對此也不太清楚。

            舉例來說,Google 在某些領域變得極端糟糕,如產品評論,其 搜索結果常常被大量腐敗的、算法博弈的垃圾內容或其自身的廣告弄得亂七八糟。假如其它公司也能參與競爭,我們就可以看到它們在一些特定的任務,甚至僅僅是在普通搜索方面打敗 Google 的搜索引擎。

            但更深層次的問題是,控制優秀的互聯網索引有很大的優勢。Maril 告訴《周刊報道》,這個龐大的數據寶庫讓 Google “在機器學習人工智能方面難以置信的優勢”。舉例來說,機器翻譯,“只有當你達到數據的臨界點時,它才會起作用”。

            同樣的道理,從其他網站的角度來考慮,確保能夠被 Google 抓取,看起來不像是某種恩惠,而更像是必須繳納的 “Google 稅”,他說。任何擁有網站的人,只需花點時間和金錢,就可以讓 Google 索引他們的網頁,以免他們無法被網民發現。這些數據將給公司帶來越來越難以逾越的競爭優勢。

            正如我 之前所論述 的那樣,Google 之所以如此強大,如此有利可圖,很大程度上是因為先發優勢和網絡效應。它在正確的時間,出現在正確的地方,用一個比其他人更好的搜索引擎,這種優勢滾雪球般地成為了對存在的,或者說能夠存在的(至少在目前的現狀下)良好的網絡索引的私有控制。

            只有 Google 才有權使用這些數據,這是不公平的,但是也不清楚有多少商業和研究想法會因為沒人能得到他們的數據而被扼殺在萌芽狀態。壟斷企業容易變得肥胖和懶惰。

            那么該怎么辦呢?傳統的處理自然壟斷的方法不是國有化就是管制。但是,這些方法 可能并不適合,因為與過去所有的自然壟斷不同,互聯網覆蓋了全球。

            舉例來說,如果 Google 的網絡索引由聯邦政府擁有,他們可能會試圖將其用作某種瘋狂的帝國主義活動的一部分。比如,美國和歐盟同意一項國際條約,該條約要求 Google 支付象征性費用許可其索引內容,或許更為明智。另一種方法是,各國只需建立自己的公共互聯網索引,供所有人免費使用。

            但是,在有人提出解決方案之前,我們必須仔細研究一下這個問題。幸好,眾議院一直在關注這一問題,甚至特朗普的司法部也提出訴訟,指控 Google 違反反壟斷法。那只是國家努力的開始,需要建立一個人人平等的互聯網。

            作者介紹:
            Ryan Cooper,《周刊報道》(The Week)的全國記者。他在《華盛頓月刊》(Washington Monthly)、《新共和》(The New Republic)和《華盛頓郵報》(Washington Post)發表文章。

            原文鏈接:
            https://theweek.com/articles/955074/bust-googles-destructive-search-monopoly

            聲明:文章收集于網絡,版權歸原作者所有,為傳播信息而發,如有侵權,請聯系小編刪除,謝謝!

            歡迎加入本站公開興趣群
            軟件開發技術群
            興趣范圍包括:Java,C/C++,Python,PHP,Ruby,shell等各種語言開發經驗交流,各種框架使用,外包項目機會,學習、培訓、跳槽等交流
            QQ群:26931708

            Hadoop源代碼研究群
            興趣范圍包括:Hadoop源代碼解讀,改進,優化,分布式系統場景定制,與Hadoop有關的各種開源項目,總之就是玩轉Hadoop
            QQ群:288410967 

            鮮花

            握手

            雷人

            路過

            雞蛋

            相關閱讀

            最新評論

            熱門頻道

            • 大數據

            即將開課

             

            GMT+8, 2021-4-13 09:18 , Processed in 0.203841 second(s), 25 queries .

            年轻人手机在线观看