最近大熱的“夸克搜索”什么來頭?要招攬最頂級AI技術人才(夸克搜索百度百科)
曉查 發(fā)自 凹非寺
量子位 編輯 | 公眾號 QbitAI
最近中文搜索引擎市場又突然熱了起來,一家巨頭的入場讓外界充滿期待。
6月9日,阿里向外界確認成立智能搜索業(yè)務部,隸屬阿里創(chuàng)新業(yè)務事業(yè)群,由UC事業(yè)部總經(jīng)理、書旗事業(yè)部總經(jīng)理吳嘉擔任負責人。
阿里人事變動,莫非要進軍搜索引擎市場?其實阿里的產品早已先行。
今年4月,一款名為“夸克”的智能搜索App首次在蘋果應用商店排名超越百度,并首次躋身前20。
其實早在2018年,夸克就開始發(fā)力智能搜索,2019年1月,夸克發(fā)布3.0版,在自主訂制的AI搜索引擎、搜索直達、指令控制等方面實現(xiàn)了重要升級。
搜索引擎誕生已有20余年,無論國內外,市場似乎早已塵埃落定,阿里為何如此“頭鐵”,夸克為何近兩年來越來越進擊智能搜索?
這恐怕與近年來AI成熟落地密不可分,也不得不從搜索行業(yè)的變化開始說起。
多模態(tài)搜索的變革
PC時代,我們以文字作為主要的搜索形式。移動互聯(lián)網(wǎng)興起后,手機端的搜索引擎App依然如此。
后來,智能手機開始普及,說一段話、拍一張圖變得容易起來,各大搜索引擎公司又加入了語音、圖片搜索。
如果我們仔細思考就會發(fā)現(xiàn),現(xiàn)階段大多數(shù)語音、圖片搜索,其實本質上還是把多媒體信息轉變成文字,然后再進行搜索。
這類搜索只是理解用戶輸入的信息,實際上對另一端抓取的信息是沒有理解的??淇艘龅木褪翘鲞@種機械文本檢索的圍墻,改變搜索引擎。
在吳嘉看來,這次的轉變是一場搜索引擎的真正變革。
吳嘉認為,今天的內容生態(tài)有很大的變化,搜索技術也應該擁抱相應的變化。
至少在語音、圖像理解的搜索上,夸克背后的阿里已經(jīng)擁抱變化。淘寶的圖片搜索技術早已在移動端得到應用,天貓精靈也是國內智能音箱領域的頭部玩家。
在夸克的產品中,也有這兩類智能搜索技術的體現(xiàn)。
那么未來的多模態(tài)搜索又會怎樣?
夸克的判斷是,未來搜索很大程度上會是視頻內容檢索。注意不是對標題的搜索標題,而是對視頻內容本身。
隨著短視頻這種娛樂、學習方式的興起,傳統(tǒng)的搜索方式變得無效,因為它不能對視頻內容做出理解。
而這正是夸克在今天做的工作。
據(jù)夸克搜索技術負責人介紹,他們正在做視頻理解——深入到視頻每一幀畫面、每一句語音里,去分析這個視頻的主題和質量,然后在分析的結果上建設一個視頻庫。
將來用戶只要一搜,就能把現(xiàn)在最好最熱門的視頻內容返回給用戶,提升用戶在視頻搜索上的體驗。
這項技術離我們不會太遙遠??淇水a品負責人鄭嗣壽透露,夸克將在不久后就會這樣的視頻搜索產品。
夸克為何要做搜索
通過搜索框和AI,我們初步了解了夸克產品??墒窃谛畔⒐聧u化的今天,有人認為通用搜索已死,夸克為何還要做搜索?
因為在夸克團隊看來,通用搜索不但不會死,未來的價值還會越來越重要。
而且,直到今天,搜索引擎一直是互聯(lián)網(wǎng)的基礎服務之一,每天國內就有數(shù)億用戶在用。
只要用戶有需求,通用搜索就會一直存在。
吳嘉在接受采訪時說,過去我們的搜索內容在鏈接里、在H5里,但是今天想做好一個內容,已經(jīng)沒有現(xiàn)成的鏈接和H5可供抓取了。
只有把要把內容生態(tài)做起來,同時提高技術,搜索引擎才有出路。
生態(tài)方面,夸克不必擔心,有阿里的電商和大文娛內容有阿里的生態(tài)內容作為支持。
而更重要的是有AI搜索還有對內容的理解,從海量化信息中把有價值的信息呈現(xiàn)給用戶。在這方面,夸克有自然語言理解AI技術幫助提取有效信息。
夸克為何有底氣做好搜索
無疑,阿里的中臺架構幫助夸克在一年內快速實現(xiàn)智能搜索的愿景。
產品負責人嗣壽自豪地說:“阿里的基礎設施建設是非常完善的,算力也有很大的優(yōu)勢,在這里可以實現(xiàn)更先進的算法?!?/p>
在技術方面,夸克搜索技術負責人向我們介紹,夸克在自然語言理解、知識圖譜、多模內容理解方面都有大量投入:
- 在過去一年多的時間里,夸克構建了超大規(guī)模的基礎的閱讀理解的數(shù)據(jù)集,為網(wǎng)頁搜索提供了段落級、句子級、單詞級別不同粒度的閱讀理解技術。
- 抽取網(wǎng)頁文本的知識,將其與結構化的知識做融合,構建知識體系。目前已經(jīng)在醫(yī)療類搜索中得到應用。
- 最后就是之前提到的對視頻內容的理解。
除了搜索的基礎技術外,夸克還在AR、VR圍繞這些交互方式上有非常多的探索。
作為阿里前沿技術的大腦,達摩院也為夸克輸送了大量的技術。
前不久達摩院提出的StructBERT,在通用語言理解評估基準GLUE上超過了谷歌、微軟,排名第一。
這篇研究成果也被國際頂級AI學術會議ICLR 2020收錄,夸克團隊也很快將這項技術用到自己的搜索產品當中來。
去年谷歌將BERT用于文字搜索,大大提高搜索結果的準確性,夸克在方面緊跟國外前沿公司的潮流。
技術以人為本,以上的技術離不開夸克團隊內部人才的吸引和培養(yǎng)機制。
現(xiàn)在的團隊中也有很多搜索行業(yè)的老兵,他們分別來自各大互聯(lián)網(wǎng)頂級公司。
據(jù)夸克搜索技術負責人介紹,現(xiàn)在的搜索技術團隊,最初來自于阿里的多個業(yè)務領域的技術團隊,之前研究過聊天機器人、智能問答等技術場景,后來還參加過智能音箱相關技術的研發(fā)。
技術團隊不是天生為搜索,但是卻與現(xiàn)在的智能搜索技術緊密關聯(lián)。
面對瞬息萬變的搜索市場,夸克也在及時獲取新鮮血液,有很多入職不到兩三年的新阿里人漸漸加入到當中來,不斷壯大團隊。
雖然夸克的完成度已經(jīng)很高,但是未來還有很大的提升空間,尤其是視頻搜索、交互模式等方面。這離不開更多新人的加入。
嗣壽希望,能夠更多年輕人加入夸克,夸克的AI研發(fā)崗位會一直向頂尖技術人才敞開,為做出更好中文搜索引擎的愿景一起努力。
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態(tài)