首頁(yè) 要聞 中國(guó) 經(jīng)濟(jì) 財(cái)經(jīng) 品牌 點(diǎn)評(píng) 會(huì)展 綜合 | 設(shè)為首頁(yè)
中國(guó)品牌要聞網(wǎng)-傳遞資訊的價(jià)值打造品牌的影響
您現(xiàn)在的位置:首頁(yè)/IT互聯(lián)網(wǎng)/ 正文
【2023云棲】郭瑞杰:阿里云搜索產(chǎn)品智能化升級(jí)
來(lái)源:
編輯:
時(shí)間:2023-11-16

 

本文根據(jù) 2023 云棲大會(huì)演講實(shí)錄整理而成,演講信息如下:

演講人:郭瑞杰 | 阿里云資深技術(shù)專家、搜索負(fù)責(zé)人

演講主題:阿里云搜索產(chǎn)品智能化升級(jí)發(fā)布

近日在2023云棲大會(huì)上,阿里云搜索負(fù)責(zé)人郭瑞杰對(duì)阿里云搜索產(chǎn)品智能化升級(jí)發(fā)布,在全場(chǎng)景的搜索細(xì)分領(lǐng)域,提供智能化產(chǎn)品能力,包括基于大模型的開(kāi)放搜索(OpenSearch)LLM智能問(wèn)答版和向量檢索版,以及面向日志和文本分析場(chǎng)景的Elasticsearch Serverless版等。
 

基于企業(yè)專屬大模型的對(duì)話式搜索

開(kāi)放搜索(OpenSearch)LLM智能問(wèn)答版是一站式SaaS化對(duì)話式搜索解決方案,內(nèi)置通義千問(wèn)以及第三方開(kāi)源大語(yǔ)言模型,用戶可基于業(yè)務(wù)數(shù)據(jù)搭建企業(yè)專屬模型。產(chǎn)品內(nèi)部集成了段落切分、向量化模型、向量引擎、檢索增強(qiáng)大模型等對(duì)話式搜索的全鏈路能力,并可以做到分鐘級(jí)PoC,小時(shí)級(jí)正式上線。與開(kāi)源大模型相比,有更高的準(zhǔn)確率基線,答案準(zhǔn)確率提升大概20%,幻覺(jué)減少40%。開(kāi)放搜索做了大量的推理優(yōu)化,token生成速度提升2-3倍,GPU資源使用量減少50%。

識(shí)林是一個(gè)專注在制藥合規(guī)領(lǐng)域進(jìn)行知識(shí)收集整理的平臺(tái),為藥企提供從藥物研發(fā)、生產(chǎn)到變更等全生命周期的法律法規(guī)檢索、咨詢服務(wù)。在今年上半年,識(shí)林基于OpenSearch構(gòu)建了大語(yǔ)言模型的智能問(wèn)答體系,現(xiàn)在已經(jīng)無(wú)需用戶通過(guò)關(guān)鍵詞反復(fù)的檢索,通過(guò)瀏覽法律法規(guī)原文獲取答案,而是以自然語(yǔ)言的方式向提問(wèn),識(shí)林平臺(tái)理解問(wèn)題意圖,通過(guò)大模型快速的到最終答案,并清晰的展示參考依據(jù)。

同時(shí),阿里云推出了基于開(kāi)放搜索問(wèn)答版構(gòu)建的智能學(xué)術(shù)論文助手SmartArxiv,支持學(xué)術(shù)調(diào)研、速讀論文、方法對(duì)比、文獻(xiàn)綜述等功能,幫助解決學(xué)術(shù)界“信息過(guò)載”的問(wèn)題。目前已在ModelScope官網(wǎng)創(chuàng)空間上線,用戶可免費(fèi)使用。

https://modelscope.cn/studios/smart_arxiv_opensearch/SmartArXiv

相比開(kāi)源引擎,向量檢索性能提升3倍

開(kāi)放搜索向量檢索版在本次的全新升級(jí)中,從原來(lái)的PaaS形態(tài)演化成了Serverless形態(tài),易用性顯著改善。核心引擎升級(jí)到新引擎VectorStore,性能大幅提升,支持千億數(shù)據(jù)毫秒級(jí)響應(yīng),實(shí)時(shí)數(shù)據(jù)秒級(jí)更新,與業(yè)界主流開(kāi)源向量引擎相比檢索性能提升3倍以上,內(nèi)存占用降低到50%。并支持標(biāo)簽+向量混合檢索等能力,提供從圖像向量化到向量存儲(chǔ)查詢的端到端圖搜場(chǎng)景解決方案。

VectorStore差異化特點(diǎn)是高性能,做了大量的向量檢索算法的性能優(yōu)化,千億級(jí)別向量數(shù)據(jù)毫秒級(jí)查詢響應(yīng),向量更新秒級(jí)可見(jiàn)。做了大量數(shù)據(jù)壓縮優(yōu)化,支持非全內(nèi)存加載,更低的成本。作為阿里自研的向量引擎,在淘寶個(gè)性化搜索、推薦、多模態(tài)搜索,以及近期的各種大模型應(yīng)用中廣泛應(yīng)用。VectorStore的執(zhí)行框架基于Havenask引擎,后面也將在Havenask中完整開(kāi)源。

成本降低70%的Elasticsearch Serverless版

阿里云檢索分析服務(wù) Elasticsearch 正式推出兼容開(kāi)源、按需使用的Serverless產(chǎn)品,用戶不再需要手動(dòng)分配資源,平臺(tái)會(huì)根據(jù)業(yè)務(wù)流量波動(dòng),自動(dòng)調(diào)度決定資源的增加或縮減,秒級(jí)彈性擴(kuò)縮,真正實(shí)現(xiàn)負(fù)載與資源動(dòng)態(tài)匹配的按量付費(fèi),減少閑置資源冗余成本支出。基于Indexing Service索引構(gòu)建服務(wù)以及OpenStore存儲(chǔ)服務(wù),阿里云從硬件選型、集群架構(gòu)、內(nèi)核性能進(jìn)行了全方位優(yōu)化,實(shí)現(xiàn)寫入性能提升150%,單位數(shù)據(jù)存儲(chǔ)成本降低70%。同時(shí),阿里云Easticsearch已集成最新的8.9版本,并基于ESRE組件(Elasticsearch Relevance Engine)提供AI增強(qiáng)能力,包括RRF混合排序算法,第三方模型集成、部署和管理等。

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí), 對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾, 請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。當(dāng)事人(單位)如有異議,請(qǐng)參閱《刪帖說(shuō)明》辦理。
中國(guó)品牌要聞網(wǎng)-傳遞資訊的價(jià)值打造品牌的影響
編輯:綜合整理
2024-06-11
評(píng)論(0)
  • CopyRight@ 2005-2022 中國(guó)品牌要聞網(wǎng)
  • 工商注冊(cè)號(hào) 430122000189097
  • ICP備案許證:渝ICP備2022012785號(hào)