看板 Gossiping
作者 ohmylove347 (米特巴爾)
標題 [新聞] Google靠128維深度學習網絡打造新版音樂1
時間 Tue Sep 18 20:27:02 2018


※ 例如蘋果日報、奇摩新聞


2.完整新聞標題:
※ 標題沒有寫出來 ---> 依照板規刪除文章


3.完整新聞內文:
※ 社論特稿都不能貼! 違者刪除(政治類水桶3個月),貼廣告也會被刪除喔!


4.完整新聞連結 (或短網址):
※ 當新聞連結過長時,需提供短網址方便網友點擊


5.備註:
※ 一個人一天只能張貼一則新聞,被刪或自刪也算額度內超貼者水桶,請注意

新聞來源:iThome

Google靠128維深度學習網絡打造新版音樂搜尋,辨識超大量音樂也不會變慢

聲音搜尋要比對的音樂資料庫非常龐大,因而增加了錯誤預測機率,Google用伺服器端不受限制的運算以及儲存資源,增加卷積神經網路大小以彌補這個缺點。

新聞

Google靠128維深度學習網絡打造新版音樂搜尋,辨識超大量音樂也不會變慢

聲音搜尋要比對的音樂資料庫非常龐大,因而增加了錯誤預測機率,Google用伺服器端不受限制的運算以及儲存資源,增加卷積神經網路大小以彌補這個缺點。

按讚加入iThome粉絲團


文/李建興018-09-17發表





現在Android手機上的Google搜尋或是Google助理,內建了最新一代的音樂辨識功能,這源自2017年上線的Now Playing功能,但採了4倍大的深度學習神經網絡來訓練,嵌入(Embedding )的維度從96維成長到了128維,Google宣稱,不影響辨識速度下,幾乎無限制增加可辨識的音樂資料庫數量。

2017年Google在其Pixel 2上推出Now Playing功能,這是基於深度學習神經網路的低功耗音樂辨識服務。Google在打造Now Playing時,目標朝向滿足小型且高效的訴求,資料庫只需要存放非常小的音樂特徵,可以讓裝置在沒有網際網路連線的狀態下,提供音樂辨識服務,而手機端Now Playing應用的準確度和速度,超越了當時以伺服器端系統提供的聲音搜尋(Sound Search)服務。

也因此,Google採用Now Playing相同的技術,來打造新版聲音搜尋功能,並內建到Android手機上,成為Google搜尋或是Google智慧助理的基本功能,只要使用者啟用語音查詢,聲音搜尋服務會自動偵測背景的聲音,當發現裝置附近有音樂撥放,介面便會出現相關提問,引導使用者查詢歌曲名稱,使用者也可以直接使用Hey,Google指令查詢。

http://i.imgur.com/NSCS18G.jpg
 
新聞

Google靠128維深度學習網絡打造新版音樂搜尋,辨識超大量音樂也不會變慢

聲音搜尋要比對的音樂資料庫非常龐大,因而增加了錯誤預測機率,Google用伺服器端不受限制的運算以及儲存資源,增加卷積神經網路大小以彌補這個缺點。

按讚加入iThome粉絲團


文/李建興018-09-17發表





現在Android手機上的Google搜尋或是Google助理,內建了最新一代的音樂辨識功能,這源自2017年上線的Now Playing功能,但採了4倍大的深度學習神經網絡來訓練,嵌入(Embedding )的維度從96維成長到了128維,Google宣稱,不影響辨識速度下,幾乎無限制增加可辨識的音樂資料庫數量。

2017年Google在其Pixel 2上推出Now Playing功能,這是基於深度學習神經網路的低功耗音樂辨識服務。Google在打造Now Playing時,目標朝向滿足小型且高效的訴求,資料庫只需要存放非常小的音樂特徵,可以讓裝置在沒有網際網路連線的狀態下,提供音樂辨識服務,而手機端Now Playing應用的準確度和速度,超越了當時以伺服器端系統提供的聲音搜尋(Sound Search)服務。

也因此,Google採用Now Playing相同的技術,來打造新版聲音搜尋功能,並內建到Android手機上,成為Google搜尋或是Google智慧助理的基本功能,只要使用者啟用語音查詢,聲音搜尋服務會自動偵測背景的聲音,當發現裝置附近有音樂撥放,介面便會出現相關提問,引導使用者查詢歌曲名稱,使用者也可以直接使用Hey,Google指令查詢。



原本的Now Playing功能系統非常小巧,用於手機上的搜尋,持續執行也不會明顯影響電力。因為Now Playing會將偵測到的音訊擷取8秒,使用卷積神經網路將數秒鐘的音訊檔案轉成獨特的指紋特徵,投影到一個由7段2秒片段組成的低維度嵌入空間,再以此特徵與手機上的定期更新的離線歌曲資料庫進行比對。搜尋裝置上的歌曲資料庫,來辨識該資料庫內的特徵資料。系統會使用兩階段來搜尋歌曲,第一階段使用快速但不精確的演算法,搜尋整個資料庫以找出可能的候選歌曲,第二階段再對候選者進行詳細分析,進一步找出正確的歌曲。

伺服器端的聲音搜尋系統運作方式和Now Playing大不相同,必須比對的資料庫是Now Playing規模的1千倍,這對搜尋的準確度和速度都是很大的挑戰。雖然Google使用Now Playing技術來改進伺服器端的聲音搜尋,但是極大的歌曲資料庫,讓錯誤預測產生的機率上升。為了降低這些錯誤,Google必須要增加辨識閾值,而這代表著必須要增加比對音訊的長度。Google認為,新的服務應該要比舊的更快,使用超過10秒的音訊不符合期待。

不過,由於聲音搜尋服務建立在伺服器端,因此可以用不受限制的運算以及儲存資源來彌補這些缺點。Google打造比原本還要大4倍的卷積神經網路,並且增加每一嵌入維度,從96維提高到了128維,減少了卷積神經網路將高維度音訊打包成低維嵌入所需要的工作量,這對於進行詳細分析的第二階段搜尋的品質至關重要。另外,Google還根據歌曲流行的程度,對索引進行加權,越流行的音樂設定越低的權重,並增加模糊朦朧的音樂權重,整體來說,比對資料庫可以幾乎沒有限制的增加歌曲,且不會過度影響資料辨識的速度。

Google仍繼續提升辨識音樂的準度和速度,特別是在背景音的處理,因為使用者辨識音樂的環境可能很安靜也可能很吵雜,這也都會直接影響辨識品質。

https://www.ithome.com.tw/news/125943
Google靠128維深度學習網絡打造新版音樂搜尋,辨識超大量音樂也不會變慢 | iThome
[圖]
聲音搜尋要比對的音樂資料庫非常龐大,因而增加了錯誤預測機率,Google用伺服器端不受限制的運算以及儲存資源,增加卷積神經網路大小以彌補這個缺點。 ...

 

心得:google現在這麼強,怎麼輸?

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.15.155.33
※ 文章代碼(AID): #1ReEySpS (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1537273628.A.CDC.html
theeht: 記住,Google就是天網1F 1.174.26.21 台灣 09/18 20:28
henrycc: …2F 223.136.181.242 台灣 09/18 20:28
DreamTaiKeDa: 完惹= = 以後版權要抓很嚴3F 140.118.135.223 台灣 09/18 20:30
a71085: 以後就不用靠人神歌了嗎 直接哼給谷歌找4F 118.166.53.108 台灣 09/18 20:30
basketkdash: 以後直播不小心哼個版權歌就被BAN了5F 220.136.91.195 台灣 09/18 20:33
VIGUTA: 噱頭 假新聞先搞好再說6F 82.102.24.55 瑞士 09/18 20:33
ccufcc: 那是噗浪的通知標誌嗎?7F 49.159.217.17 台灣 09/18 21:04
wadeabc: 天網真的來了,以後大講什麼話會被收錄8F 111.246.12.56 台灣 09/18 21:26
ptta: 聽女優呻吟幾聲,番號就出來了9F 180.217.179.242 台灣 09/18 21:41
s860134: 這題目很多人做 要做到好很難10F 123.192.25.174 台灣 09/18 22:05

--
--
(ohmylove347.): [新聞] Google靠128維深度學習網絡打造新版音樂1 - Gossiping板