大資料+AI Meetup 2021 首站！9位大佬解讀向量搜尋技術在多維場景下的應用

如今，社會生產資料正以指數增長的速度從白紙印刷向萬物互聯的網路中遷徙，人們面臨著更高的資料處理需求：語音、圖片、影片，語言文字、行為……資料本身是沒有生命力的，唯有發現與用才賦予它們生機。在 AI 的賦能下，這些形態各異的非結構化資料得以透過向量化的形式被直接檢索，向量檢索技術成為愈加重要的一環。

3月20日，阿里雲開發者社群聯合阿里雲計算平臺事業部、達摩院共同舉辦的BIGDATA + AI Meetup · 北京站向量檢索專場即將重磅開啟！來自阿里雲、淘寶、愛奇藝、Zilliz、雲從科技、搜狐、Jina。AI 的九位重量級講師將在現場分享關最前沿的向量檢索技術思考與實踐，解讀向量檢索與人臉識別、推薦系統、圖片搜尋、影片指紋、自然語音處理、檔案搜尋等各類應用場景交織融合的技術邏輯；更有阿里雲達摩院自主研發，並廣泛應用於阿里集團各個業務場景的 Proxima 向量檢索引擎的對外首次揭秘！無論你是熱衷於鑽研開源技術的開發者，還是“大資料+AI”的資深愛好者，都能這些前沿的案例從中獲得全新的靈感。

本次 Meetup 將採取線上線下雙線聯動的方式，除線下參與外，還將進行同步直播，您可實時觀看活動精彩分享。此外，現場還準備了精美社群禮物以及免費茶歇甜點。到場名額有限，不容錯過！快快報名吧！

▼ 會議亮點 ▼

阿里雲達摩院自主研發的向量檢索引擎 Proxima 首次對外揭秘——賦能阿里集團拍立淘、搜尋個性化、優酷影片指紋、猜你喜歡、圖搜雲等多業務場；整合在 Ads、Hologres、Elasticsearch 等雲上業務……阿里雲達摩院 Proxima 技術負責人將現場帶來硬核詳解。

阿里巴巴高階演算法專家為你展示淘系推薦團隊 MIND 召回演算法的系統架構設計及應用；阿里雲團隊基於 PAI 可以幫助客戶快速搭建個性化推薦解決方案。

國內開源向量搜尋引擎——Milvus 所屬公司 Zilliz 合夥人現身解析應用於各大企業的經典案例。

“AI四小龍”之一——雲從科技資料研究院技術總監分享十年沉澱開發經驗，帶你領略雲從科技大規模人臉比對技術，共話向量計算的未來。

還有開源神經搜尋公司 Jina AI 創始人兼 CTO 親自展示 Jina 的設計理念及使用其搭建搭建神經搜尋系統的原理；愛奇藝在廣告、搜尋、影片推薦等業務的向量檢索技術最佳實踐；搜狐應用 Mlivus 基於語義向量的內容召回和短文字分類的文字標註實戰……

《向量檢索的過去，現在，和未來》

議題簡介

：

淺談向量檢索的技術背景和應用，揭秘向量檢索的核心挑戰和未來發展趨勢。

出品人簡介

：

王紹翾（大沙），達摩院機器智慧實驗室，資深技術專家。畢業於北京大學，在加州大學獲得計算機工程博士學位。畢業後曾在 Facebook 開發分散式圖關係資料庫 TAO。2015 年加入阿里巴巴集團，先後就職於搜尋事業部，計算平臺事業部，目前是達摩院機器智慧系統AI實驗室的負責人，主要負責達摩院的 AI Engineering 的體系建設，包括高效能訓練，推理，向量檢索等等核心引擎的研發，以及視覺，NLP，決策等演算法能力的開放平臺建設和商業化落地。在搜尋和計算平臺事業部，王紹翾主要負責阿里新一代實時計算平臺 Blink/Flink 的研發工作，他是國內最早期的 Apache Flink 的 committer 和 PMC。

《 MIND - 基於動態路由的使用者多向量召回》

議題簡介：

手淘首頁的推薦面臨著兩個極具挑戰性的問題。一是業務資料量巨大，包括十億級的使用者和商品；二是首頁開屏即現，對演算法的響應時間有嚴格要求。在實際實踐中，我們將推薦系統拆分為召回與排序兩個子系統。其中，召回系統從海量的候選商品中挑選出與使用者興趣相關的商品集合，排序系統對該商品集合中的每一個商品依據業務目標進行打分，打分較高的商品作為推薦結果展示給使用者。推薦演算法的效果同時受到兩個子系統的影響，召回作為演算法的前置環節，更是決定了整個系統的效果上限。本次分享中，我們將分享 MIND 召回演算法及其系統架構設計

講師簡介：

睿德，淘系技術部，高階演算法專家。從事推薦技術召回，排序演算法的開發。

《達摩院 Proxima 向量檢索技術揭秘》

議題簡介：

淘寶搜尋推薦、影片搜尋支付背後的檢索技術，達摩院向量檢索引擎 Proxima 揭秘。Proxima 是阿里巴巴達摩院系統 AI 實驗室自研的向量檢索核心，廣泛應用於阿里巴巴和螞蟻集團內，為淘寶搜尋和推薦、螞蟻人臉支付、優酷影片搜尋、阿里媽媽廣告檢索等核心業務提供核心檢索能力。並深度整合在阿里雲 Hologres、搜尋引擎 Elastic Search 和 ZSearch、離線引擎 MaxCompute （ODPS）等大資料和資料庫產品中。

講師簡介：

肖允鋒（鶴衝），達摩院資深技術專家。畢業於中山大學物理系。曾就職於電信研究院和騰訊科技，從事大資料搜尋技術相關研究和應用十餘載，是阿里巴巴達摩院 Proxima AI 檢索引擎的總設計者和技術帶頭人。目前，Proxima 相關技術廣泛應用於阿里巴巴和螞蟻金服各大業務，演算法和工程在業內具有一定的領先性。

《愛奇藝在推薦領域的向量檢索技術實踐》

議題簡介：

在推薦演算法領域，召回-粗排-精排是成熟穩定的系統方案。而傳統過濾/模式匹配的召回演算法在個性化、實時、智慧推薦的需求上力不從心，對快速增加的各種非數值類特性和海量資料的處理無能為力，同時線上的推理過程對效能又提出了嚴苛的要求。我們結合 Youtube DNN 等多種向量召回模型與重排序的需求，探索了數種向量檢索的服務的技術與產品，結合這些技術和 Tensorflow Serving，完成廣告、搜尋、影片推薦等業務在愛奇藝的召回基礎服務。

講師簡介：

張吉，愛奇藝深度學習雲研發工程師。

《Jina ：雲原生開源神經搜尋框架》

議題簡介：

隨著資訊規模的爆炸式增長和資料型別的日益豐富，基於符號的傳統搜尋逐漸無法滿足使用者的需求。得益於深度學習技術的發展，神經搜尋系統應運而生。但是，在搭建和維護神經搜尋系統的過程中，工程團隊不僅需要具備分散式架構的經驗，更需要熟悉多個軟體框架和理解不同 AI 演算法。針對這個痛點，Jina 提供覆蓋搜尋全鏈路的一站式雲原生開源解決方案。在本次報告中，我們將分享 Jina 的設計思想和主要特點，並展示如何使用 Jina 搭建神經搜尋系統。

講師簡介：

王楠，博士，Jina AI 聯合創始人兼 CTO。專注於機器學習和深度學習演算法在 NLP 和搜尋領域的實際應用。作為開源神經搜尋框架 jina 的核心貢獻者，熱衷於開源軟體和雲原生技術。

《高效能高維向量計算》

議題簡介：

在深度學習流行的當下，向量計算已經成為 AI 工程的基石，無論是人臉比對、影象搜尋、推薦、智慧問答都涉及到海量高維向量的計算。檢索和聚類是其中兩個典型的計算場景，面向海量向量的檢索通常採用 ANN 一簇演算法解決，無監督聚類演算法也正在蓬勃發展；除開演算法，工程架構上的挑戰也是巨大的，比如怎樣適配端側裝置、國產晶片等異構計算環境。本次演講，我們會分享雲從在大規模人臉比對領域上的實踐心得，探討向量計算未來的發展方向。

講師簡介：

楊傑，雲從科技資料研究院技術總監。在雲從主要負責 KaaS 平臺（向量計算、知識圖譜、搜尋等技術方向）研發，在 AI 工程化方面有深厚的積累。網際網路行業歷練技術十餘年，有豐富的搜尋、推薦系統研發經驗。

《Milvus ——開源向量搜尋引擎》

議題簡介：

隨著深度學習技術的成熟，人們嘗試利用 AI 技術挖掘非結構化資料（圖片，影片，自然語言文字等）中潛藏的價值。由此，人們對特徵向量資料的分析處理需求大幅增長。然而透過現有的資料庫元件和大資料技術來支撐這樣的新型應用場景，卻面臨開發困難、執行成本高昂的挑戰。為了幫助克服現有技術的侷限性，我們發起了 Milvus 開源向量資料庫專案。作為一個開源AI基礎元件，Milvus 加快了企業開發 AI 應用的速度、大幅降了 AI 應用的部署成本。

講師簡介：

顧鈞，Zilliz 高階架構師&合夥人。北大畢業 16 年以來始終專注於資料庫、大資料技術，尤其對 OLTP 平臺與場景有著豐富的經驗。顧鈞現後任職於工商銀行，IBM，摩根士丹利，華為等企業。加入 Zilliz 以後，顧鈞的工作重心在於開源社群的構建與推廣。同時，顧鈞代表 Zilliz 出席 LF AI & Data 基金會中的技術諮詢委員會。

《雲上個性化推薦——

基於 PAI 和 Hologres 的個性化推薦最佳實踐》

議題簡介：

常見的個性化推薦系統包括日誌收集，資料加工，召回，排序，離線上效果評估等諸多環節，對於中小客戶存在技術門檻高，搭建週期長等問題。計算平臺基於 PAI，Hologres，MaxCompute，DataWorks 平臺產品，可以幫助客戶快速搭建個性化推薦解決方案。本次分享，主要從計算平臺的推薦系統整體解決方案出發，重點介紹基於 PAI 的向量召回演算法和 Hologres 向量檢索的整體架構，以及該架構在米連科技的落地案例和效果分享。

講師簡介：

天邑，阿里雲計算平臺高階演算法工程師。主要從事基於 PAI 平臺的召回和排序演算法研發，及基於雲產品的推薦系統解決方案研發，賦能客戶個性化推薦解決方案落地。

《基於語義向量的內容召回和短文字分類的

文字標註

——搜狐的 Mlivus 實戰》

議題簡介：

得益於 Mlivus 向量搜尋工具的高效部署，在處理海量資料時準確快速，本次演講中，我們將分享利用 Milvus 向量搜尋工具解決語義向量召回時的向量搜尋問題和短新聞文字分類時文字的標註問題。

講師簡介：

王婷婷，搜狐自然語言處理工程師。在搜狐主要從事基於內容的語義向量召回，文字分類，文字摘要，新聞聚類，新聞關鍵詞提取等相關工作。

如何參加？

■ 活動議程