成人网18视频网站,qvod激情视频在线观看,色国产精品一区在线观看,久久99热国产这有精品,天天舔天天爽,国产日韩视频,伊人久久精品成人网


首頁(yè)
產(chǎn)品系列
行業(yè)應用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng )澤
| En
 
  當前位置:首頁(yè) > 新聞資訊 > 機器人開(kāi)發(fā) > 如何更高效地壓縮時(shí)序數據?基于深度強化學(xué)習的探索  
 

如何更高效地壓縮時(shí)序數據?基于深度強化學(xué)習的探索

來(lái)源:阿里機器智能      編輯:創(chuàng )澤      時(shí)間:2020/6/4      主題:其他   [加盟]

隨著(zhù)移動(dòng)互聯(lián)網(wǎng)、IoT、5G 等的應用和普及,一步一步地我們走進(jìn)了數字經(jīng)濟時(shí)代。隨之而來(lái)的海量數據將是一種客觀(guān)的存在,并發(fā)揮出越來(lái)越重要的作用。時(shí)序數據是海量數據中的一個(gè)重要組成部分,除了挖掘分析預測等,如何G效的壓縮存儲是一個(gè)基礎且重要的課題。同時(shí),我們也正處在人工智能時(shí)代,深度學(xué)習已經(jīng)有了很多很好的應用,如何在更多更廣的層面發(fā)揮作用?本文總結了當前學(xué)術(shù)界和工業(yè)界數據壓縮的方法,分析了大型商用時(shí)序數據壓縮的特性,提出了一種新的算法,分享用深度強化學(xué)習進(jìn)行數據壓縮的研究探索及取得的成果。

深度學(xué)習的本質(zhì)是做決策,用它解決具體的問(wèn)題時(shí)很重要的是找到契合點(diǎn),合理建模,然后整理數據優(yōu)化 loss 等終較好地解決問(wèn)題。在過(guò)去的一段時(shí)間,我們在用深度強化學(xué)習進(jìn)行數據壓縮上做了一些研究探索并取得了一些成績(jì),已經(jīng)在 ICDE 2020 research track 發(fā)表(Two-level Data Compression using Machine Learning in Time Series Database)并做了口頭匯報。在這里做一個(gè)整體粗略介紹,希望對其它的場(chǎng)景,至少是其它數據的壓縮等,帶來(lái)一點(diǎn)借鑒作用。

背景描述

1 時(shí)序數據

時(shí)序數據顧名思義指的是和時(shí)間序列相關(guān)的數據,是日常隨處可見(jiàn)的一種數據形式。下圖羅列了三個(gè)示例:a)心電圖,b)股票指數,c)具體股票交易數據。

關(guān)于時(shí)序數據庫的工作內容,簡(jiǎn)略地,在用戶(hù)的使用層面它需要響應海量的查詢(xún),分析,預測等;而在底層它則需要處理海量的讀寫(xiě),壓縮解壓縮,采用聚合等操作,而這些的基本操作單元就是時(shí)序數據 <timestamp, value>,一般(也可以簡(jiǎn)化)用兩個(gè) 8 byte 的值進(jìn)行統一描述。

可以想象,任何電子設備每天都在產(chǎn)生各種各樣海量的時(shí)序數據,需要海量的存儲空間等,對它進(jìn)行壓縮存儲及處理是一個(gè)自然而然的方法。而這里的著(zhù)重點(diǎn)就是如何進(jìn)行更G效的壓縮。

2  強化學(xué)習

機器學(xué)習按照樣本是否有 groundTruth 可分為有監督學(xué)習,無(wú)監督學(xué)習,以及強化學(xué)習等。強化學(xué)習顧名思義是不停地努力地去學(xué)習,不需要 groundTruth,真實(shí)世界很多時(shí)候也沒(méi)有 groundTruth,譬如人的認知很多時(shí)候就是不斷迭代學(xué)習的過(guò)程。從這個(gè)意義上來(lái)說(shuō),強化學(xué)習是更符合或更多面普遍的一種處理現實(shí)世界問(wèn)題的過(guò)程和方法,所以有個(gè)說(shuō)法是:如果深度學(xué)習慢慢地會(huì )像 C/Python/Java 那樣成為解決具體問(wèn)題的一個(gè)基礎工具的話(huà),那么強化學(xué)習是深度學(xué)習的一個(gè)基礎工具。

強化學(xué)習的經(jīng)典示意圖如下,基本要素為 State,Action,和 Environment;具^(guò)程為:Environment 給出 State,Agent 根據 state 做 Action 決策,Action 作用在 Environment 上產(chǎn)生新的 State 及 reward,其中 reward 用來(lái)指導 Agent 做出更好的 Action 決策,循環(huán)往復….

而常見(jiàn)的有監督學(xué)習則簡(jiǎn)單很多,可以認為是強化學(xué)習的一種特殊情況,目標很清晰就是 groudTruth,因此對應的 reward 也比較清晰。

強化學(xué)習按照個(gè)人理解可以歸納為以下三大類(lèi):

1)DQN

Deep Q network,比較符合人的直觀(guān)感受邏輯的一種類(lèi)型,它會(huì )訓練一個(gè)評估 Q-value 的網(wǎng)絡(luò ),對任一 state 能給出各個(gè) Action 的 reward,然后終選擇 reward 大的那個(gè) action 進(jìn)行操作即可。訓練過(guò)程通過(guò)評估 “估計的 Q-value” 和 “真正得到的 Q-value” 的結果進(jìn)行反向傳遞,終讓網(wǎng)絡(luò )估計 Q-value 越來(lái)越準。

2)Policy Gradient

是更加端到端的一種類(lèi)型,訓練一個(gè)網(wǎng)絡(luò ),對任一 state 直接給出終的 action。DQN 的適用范圍需要連續 state 的 Q-value 也比較連續(下圍棋等不適用這種情況),而 Policy Gradient 由于忽略?xún)炔窟^(guò)程直接給出 action,具有更大的普適性。但它的缺點(diǎn)是更難以評價(jià)及收斂。一般的訓練過(guò)程是:對某一 state,同時(shí)隨機的采取多種 action,評價(jià)各種 action 的結果進(jìn)行反向傳遞,終讓網(wǎng)絡(luò )輸出效果更好的 action。

3)Actor-Critic

試著(zhù)糅合前面兩種網(wǎng)絡(luò ),取長(cháng)補短,一方面用 policy Gradient 網(wǎng)絡(luò )進(jìn)行任一 state 的 action 輸出,另外一方面用 DQN 網(wǎng)絡(luò )對 policy gradient 的 action 輸出進(jìn)行較好的量化評價(jià)并以之來(lái)指導 policy gradient 的更新。如名字所示,就像表演者和評論家的關(guān)系。訓練過(guò)程需要同時(shí)訓練 actor(policy Graident)和 critic(QN)網(wǎng)絡(luò ),但 actor 的訓練只需要 follow critic 的指引就好。它有很多的變種,也是當前 DRL 理論研究上不停發(fā)展的主要方向。

時(shí)序數據的壓縮

對海量的時(shí)序數據進(jìn)行壓縮是顯而易見(jiàn)的一個(gè)事情,因此在學(xué)術(shù)界和工業(yè)界也有很多的研究和探索,一些方法有:

Snappy:對整數或字符串進(jìn)行壓縮,主要用了長(cháng)距離預測和游程編碼(RLE),廣泛的應用包括 Infuxdb。

Simple8b:先對數據進(jìn)行前后 delta 處理,如果相同用RLE編碼;否則根據一張有 16 個(gè) entry 的碼表把 1 到 240 個(gè)數(每個(gè)數的 bits 根據碼表)pack 到 8B 為單位的數據中,有廣泛的應用包括 Infuxdb。

Compression planner:引入了一些 general 的壓縮 tool 如 scale, delta, dictionary, huffman, run length 和 patched constant 等,然后提出了用靜態(tài)的或動(dòng)態(tài)辦法組合嘗試這些工具來(lái)進(jìn)行壓縮;想法挺新穎但實(shí)際性能會(huì )是個(gè)問(wèn)題。

ModelarDB:側重在有損壓縮,基于用戶(hù)給定的可容忍損失進(jìn)行壓縮;舅枷胧前丫S護一個(gè)小 buff,探測單前數據是否符合某種模式(斜率的直線(xiàn)擬合),如果不成功,切換模式重新開(kāi)始buff等;對支持有損的 IoT L域比較合適。

Sprintz:也是在 IoT L域效果會(huì )比較好,側重在 8/16 bit 的整數處理;主要用了 scale 進(jìn)行預測然后用 RLC 進(jìn)行差值編碼并做 bit-level 的 packing。

Gorilla:應用在 Facebook G吞吐實(shí)時(shí)系統中的當時(shí) sofa 的壓縮算法,進(jìn)行無(wú)損壓縮,廣泛適用于 IoT 和云端服務(wù)等各個(gè)L域。它引入 delta-of-delta 對時(shí)間戳進(jìn)行處理,用 xor 對數據進(jìn)行變換然后用 Huffman 編碼及 bit-packing。示例圖如下所示。

MO:類(lèi)似 Gorilla,但去掉了 bit-packing,所有的數據操作基本都是字節對齊,降低了壓縮率但提供了處理性能。











基于深度學(xué)習目標檢測模型優(yōu)缺點(diǎn)對比

深度學(xué)習模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

傳統目標檢測算法對比

SIFT、PCA-SIFT、SURF 、ORB、 VJ 等目標檢測算法優(yōu)缺點(diǎn)對比及使用場(chǎng)合比較

基于深度學(xué)習和傳統算法的人體姿態(tài)估計,技術(shù)細節都講清楚了

人體姿態(tài)估計便是計算機視覺(jué)領(lǐng)域現有的熱點(diǎn)問(wèn)題,其主要任務(wù)是讓機器自動(dòng)地檢測場(chǎng)景中的人“在哪里”和理解人在“干什么”

讓大規模深度學(xué)習訓練線(xiàn)性加速、性能無(wú)損,基于BMUF的Adam優(yōu)化器并行化實(shí)踐

Adam 算法便以其卓越的性能風(fēng)靡深度學(xué)習領(lǐng)域,該算法通常與同步隨機梯度技術(shù)相結合,采用數據并行的方式在多臺機器上執行

音樂(lè )人工智能、計算機聽(tīng)覺(jué)及音樂(lè )科技

音樂(lè )科技、音樂(lè )人工智能與計算機聽(tīng)覺(jué)以數字音樂(lè )和聲音為研究對象,是聲學(xué)、心理學(xué)、信號處理、人工智能、多媒體、音樂(lè )學(xué)及各行業(yè)領(lǐng)域知識相結合的重要交叉學(xué)科,具有重要的學(xué)術(shù)研究和產(chǎn)業(yè)開(kāi)發(fā)價(jià)值

【深度】未來(lái)5-10年計算機視覺(jué)發(fā)展趨勢為何?

專(zhuān)家(查紅彬,陳熙霖,盧湖川,劉燁斌,章國鋒)從計算機視覺(jué)發(fā)展歷程、現有研究局限性、未來(lái)研究方向以及視覺(jué)研究范式等多方面展開(kāi)了深入的探討

華南理工大學(xué)羅晶博士和楊辰光教授團隊發(fā)文提出遙操作機器人交互感知與學(xué)習算法

羅晶博士和楊辰光教授團隊提出,遙操作機器人系統可以自然地與外界環(huán)境進(jìn)行交互、編碼人機協(xié)作任務(wù)和生成任務(wù)模型,從而提升系統的類(lèi)人化操作行為和智能化程度

實(shí)時(shí)識別卡扣成功裝配的機器學(xué)習框架

卡扣式裝配廣泛應用于多種產(chǎn)品類(lèi)型的制造中,卡扣裝配是結構性的鎖定機制,通過(guò)一個(gè)機器學(xué)習框架將人類(lèi)識別成功快速裝配的能力遷移到自主機器人裝配上。

基于多任務(wù)學(xué)習和負反饋的深度召回模型

基于行為序列的深度學(xué)習推薦模型搭配高性能的近似檢索算法可以實(shí)現既準又快的召回性能,如何利用這些豐富的反饋信息改進(jìn)召回模型的性能

張帆博士與Yiannis Demiris教授團隊提出高效的機器人學(xué)習抓取衣服方法

機器人輔助穿衣通常人工的將衣服附在機器人末端執行器上,忽略機器人識別衣服抓取點(diǎn)并進(jìn)行抓取的過(guò)程,從而將問(wèn)題簡(jiǎn)化

百度算法大牛35頁(yè)PPT講解基于EasyDL訓練并部署企業(yè)級高精度AI模型

百度AI開(kāi)發(fā)平臺高級研發(fā)工程師餅干老師,為大家系統講解企業(yè)在A(yíng)I模型開(kāi)發(fā)中的難點(diǎn),以及針對這些難點(diǎn),百度EasyDL專(zhuān)業(yè)版又是如何解決的

Technica公司發(fā)布智能霧計算平臺技術(shù)白皮書(shū)

SmartFog可以輕松地將人工智能分析微服務(wù)部署到云、霧和物聯(lián)網(wǎng)設備上,其架構支持與現有系統的靈活集成,提供了大量的實(shí)現方案,要用下一代人工智能算法來(lái)彌補現有解決方案的不足。
 
資料獲取
新聞資訊
== 資訊 ==
» 智能服務(wù)機器人的足式移動(dòng)方案的優(yōu)勢和適用
» 智能服務(wù)機器人的輪式移動(dòng)方案的優(yōu)勢和適用
» 多技術(shù)棧驅動(dòng)的具身智能:移動(dòng)+操作+交互
» 選擇合適的機器人形態(tài):3自由度、300自
» 通用具身智能機器人的多元形態(tài):專(zhuān)用+類(lèi)人
» 服務(wù)機器人商業(yè)模式變革:產(chǎn)品矩陣助力全棧
» DeepSeek等大模型工具使用手冊-實(shí)
» 艾瑞《中國人工智能產(chǎn)業(yè)研究報告》-AI產(chǎn)
» 2025中國人工智能行業(yè)大模型應用實(shí)踐與
» 2025人工智能+行業(yè)發(fā)展藍皮書(shū)-典型應
» 疾控工作者應該怎么利用DeepSeek等
» 從DeepSeek爆火看2025年AI的
» 2025人工智能賦能新型工業(yè)化范式變革與
» 人形機器人大規模量產(chǎn)在即,關(guān)注核心環(huán)節投
» 智能具身機器人的交互的四個(gè)層級:HCI,
 
== 機器人推薦 ==
 
迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人底盤(pán)

機器人底盤(pán)

 

商用機器人  Disinfection Robot   展廳機器人  智能垃圾站  輪式機器人底盤(pán)  迎賓機器人  移動(dòng)機器人底盤(pán)  講解機器人  紫外線(xiàn)消毒機器人  大屏機器人  霧化消毒機器人  服務(wù)機器人底盤(pán)  智能送餐機器人  霧化消毒機  機器人OEM代工廠(chǎng)  消毒機器人排名  智能配送機器人  圖書(shū)館機器人  導引機器人  移動(dòng)消毒機器人  導診機器人  迎賓接待機器人  前臺機器人  導覽機器人  酒店送物機器人  云跡科技潤機器人  云跡酒店機器人  智能導診機器人 
版權所有 © 創(chuàng )澤智能機器人集團股份有限公司     中國運營(yíng)中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷(xiāo)售1:4006-935-088    銷(xiāo)售2:4006-937-088   客服電話(huà): 4008-128-728