近日,由天翼云數(shù)據(jù)庫(kù)團(tuán)隊(duì)、中國(guó)電信云計(jì)算研究院和深圳北理莫斯科大學(xué)合作完成的《Taste: Towards Practical Deep Learning-based Approaches for Semantic Type Detection in the Cloud》(構(gòu)建云上基于深度學(xué)習(xí)的大規(guī)模語(yǔ)義類(lèi)型識(shí)別系統(tǒng))論文被28th International Conference on Extending Database Technology(EDBT)長(zhǎng)文收錄。
EDBT是數(shù)據(jù)庫(kù)領(lǐng)域的知名國(guó)際會(huì)議,也是中國(guó)計(jì)算機(jī)學(xué)會(huì)CCF推薦的重點(diǎn)學(xué)術(shù)會(huì)議,已連續(xù)舉辦27屆,近五年平均錄取率僅為20.8%。此次天翼云數(shù)據(jù)庫(kù)產(chǎn)品線所著論文被EDBT收錄,代表著天翼云的科技創(chuàng)新能力再次獲得數(shù)據(jù)庫(kù)工業(yè)界和學(xué)術(shù)界的權(quán)威認(rèn)可。
該論文專(zhuān)注于數(shù)據(jù)管理系統(tǒng)中的語(yǔ)義類(lèi)型檢測(cè)(Semantic Type Detection)問(wèn)題的研究,并在檢測(cè)性能和安全性方面實(shí)現(xiàn)了突破。語(yǔ)義類(lèi)型可以顯示出復(fù)雜數(shù)據(jù)的語(yǔ)義含義,如人名、地址、身份證號(hào)等,不僅能夠幫助人類(lèi)更好地理解數(shù)據(jù),還能輔助數(shù)據(jù)管理系統(tǒng)提供搜索、轉(zhuǎn)換和清洗等一系列關(guān)鍵服務(wù),例如:數(shù)據(jù)管理系統(tǒng)識(shí)別出“身份證號(hào)”這一語(yǔ)義類(lèi)型后,可將該數(shù)據(jù)標(biāo)記為敏感信息,進(jìn)而智能地提供數(shù)據(jù)脫敏服務(wù)。