TensorFlow 發布的第四年,哪些最重要?@GDD 2019

12
場景描述:GDD 進行到第二天,開發者們依然熱情不減, TensorFlow RoadShow 依然是座無虛席。距離 2015 年 TensorFlow 面世,如今已過去四年,圍繞 TensorFlow,谷歌打造了一整套生态系統,用戶群體也越來越廣大。那麼這一次,谷歌的 TensorFlow 團隊,又為我們帶來了什麼呢?
關鍵詞:TensorFlow 機器學習 GDD

昨日,GDD 大會上,谷歌對最近的動态和新品,做了詳盡的展示。在 GDD 的第二天,則是将重心傾注在了已發布四年的 TensorFlow。

今日淩晨,蘋果召開了新品發布會,推出了三攝 iPhone 11 系列,此外iPad、 Apple Arcade、Apple TV+、iApple Watch Series 5 等新品也随之發布。

如果說蘋果在用新品刺激着消費者群體,那麼在大洋的另一邊,谷歌開發者大會則還在低調而沉穩地進行,詳細地介紹着自己在技術上最新進展,給開發人員帶來最實際的幫助。

特設的 TensorFlow RoadShow,排滿了整整一天的日程。那麼今日的 GDD 上,TensorFlow 團隊又帶來了哪些看點呢?

TensorFlow:最受歡迎的機器學習框架

在 TensorFlow RoadShow 上,其亞太區産品經理梁信屏首先出場,展開了《機器學習的現在和未來》的分享,并陳述了 TensorFlow 的發展概況。

圖片描述

  • 梁信屏為 TensorFlow 的發展做出了分析

當前機器學習發展的關鍵有三點:數據集、算力和模型。而 Tensorflow 則是機器學習潮流順應下,最成功的一個機器學習平台。

從 2015 年發布以來,TensorFlow 一直在完善和更新,截至目前,有超過 4100 萬的下載量,超過 5 萬次提交量,9900 次代碼改動請求,以及 1800 多位貢獻者。

圖片描述

  • TensorFlow 擁有着龐大的用戶群體

因為它的強大功能,使用 TensorFlow 的實際案例也越來越多,多家企業和機構在用它進行研發。此外,TensorFlow 中文網站也已開通,中文社區和技術資源都在日漸擴增。

介紹完這些情況,随機開啟了 TensorFlow 的全面展示,其團隊的工程師們,對 TensorFlow 的進展做了詳細介紹。

劃重點:TensorFlow 2.0

備受矚目的 2.0 版本終于在 2019 年面世。今年 6 月份, TensorFlow 2.0 Beta 版本發布,在今天的 GDD 上,工程師宣稱 TensorFlow 2.0 RC 現已可用。

相比于 1.0 版本,新版圍繞易用性、高性能、可擴展,三個方面進行了升級。

其中最吸引人的地方在于,使用 Keras 作為高階 API ,優化默認 Eager Execution ,移除重複的功能,提供了統一 API 。

圖片描述

  • 工程師介紹了 TensorFlow 2.0 圍繞 Keras 做的改進

TensorFlow 2.0 使用 Keras 和 Eager Execution,能夠輕松構建模型,在任意平台上實現生産環境的穩健模型部署。

介紹完 2.0 的具體情況後,谷歌工程師梁豔慧也詳細介紹了從版本 1.0 升級到 2.0 的方法。

在谷歌内部,已經開始了内部的版本遷移,官方網站也提供了詳細的代碼遷移指南與工具。如果用戶十分需要或者依賴于某個 1.0 版本的 API,可以根據指南輕松地将其遷移至 2.0 版本。

那麼 TensorFlow 2.0 具體在哪些方面值得關注呢?谷歌的工程師們從以下幾個角度做出了詳細的介紹。

TF.Text:訓練 NLP 模型

作為機器學習中一個重要的方向,自然語言處理有着很大的市場需求。TF 官方推出和升級了 TF.Text,為 TensorFlow 2.0 提供了強大的文本處理功能,且兼容動态圖模式。

圖片描述

  • TF.Text 具有多項優點

TF.Text 是一個 TensorFlow 2.0 庫,可以使用 PIP 命令輕松安裝。能夠在基于文本的模型中定期執行預處理過程,并提供 TensorFlow 核心組件中并未提供的、關于語言建模的更多功能和操作。

其中最常見的功能就是文本的詞條化(Tokenization)。詞條化是将字符串分解為 token 的過程。這些 token 可能是單詞、數字和标點符号,或是幾種元素的組合。

TF.Text 的 Tokenizer 一種用于識别文本的新型張量, Ragged Tensors。并提供了三個新的 Tokenizer。其中最基本的是空白 Tokenizer,可以在 ICU 定義的空白字符(例如空格,制表符,換行符)上拆分 UTF-8 字符串。

TF.Text 庫還包括歸一化、n-gram 和标記序列約束等功能。使用 TF.Text 有許多好處,例如用戶不需要關注訓練和預測的一緻性,并且不需要自己管理預處理腳本。

TensorFlow Lite:在端上部署機器學習

兩位谷歌資深軟件工程師王鐵震與劉仁傑,介紹了 TensorFlow Lite 的功能更新以及技術細節。

圖片描述

  • TensorFlow Lite Roadmap 一覽

TensorFlow Lite 是用于手機以及嵌入式設備上,部署機器學習應用的框架。之所以選擇在端上部署,主要的考慮體現在以下三點:

第一:幾乎沒有延遲,可以提供穩定、及時的用戶體驗;
第二:不需要連接網絡,可以在沒有網絡或者是網絡很差的環境中使用;
第三:隐私保護,不會把數據傳到雲端,所有的處理能夠在端上進行。

鑒于這些優勢,目前基于 TensorFlow Lite 在端上部署機器學習的應用,已有有了很大的市場,而且在 2.0 中,部署模型的能力也得到了強化。

比如,閑魚 APP 在租房場景,用 TensorFlow Lite 自動對圖片打标簽,提高了租房效率;科沃斯機器人将 TensorFlow Lite 部署在掃地機器人中,實現自動避障等等。TensorFlow Lite 在谷歌産品中也被廣泛應用,如 Google 相冊、輸入法、雲助理等。

根據統計,有超過 20 億的移動設備,已經安裝了基于 TensorFlow Lite 的應用。

不過,在端上部署機器學習仍然有着不少的挑戰,比如相對雲端來說,端上算力少、内存少,而且端上部署需要考慮耗電量的問題。TensorFlow Lite 也針對這些挑戰做出了優化改善,以期将機器學習更容易地在端上進行部署。

TensorFlow Lite 最終實施端口,不僅能夠部署在安卓和 iOS,還适用于在嵌入式系統(如樹莓派)、硬件加速器(如 Edge TPU)、微控制器(MCU)中。

圖片描述

  • TansorFlow 正在向微控制器邁進

目前它在圖像分類、對象檢測、姿态估計、語音識别、手勢識别上已經得到了應用,而 BERT 、風格遷移、語音喚醒等功能也将後續發布。

如何在 TensorFlow Lite 中部署自己的模型?劉仁傑介紹道,這隻需要按照三個步驟:

訓練 TF 模型、轉換到 TF Lite 格式、部署模型到端側設備,根據 TF 2.0 的集成庫,隻需不多的代碼調用就可實現。

TensorFlow.js:可制作微信小程序的平台

TensorFlow.js 是為 JavaScript 定制的深度學習平台。可以運行已有模型、對已有模型進行再訓練、以及訓練新的模型。

圖片描述

  • 工程師介紹 TensorFlow.js 的直播畫面

為了增加它的實用性,TensorFlow.js 支持多平台:浏覽器、無線端(如微信小程序)、服務器、台式機。

除了可在多個平台運行機器學習模型,還可以對模型訓練,此外具有 GPU 加速功能,并自動支持 WebGL。

在現場演示中,他們展示了一款基于 TensorFlow.js 的虛拟試裝程序 Modiface 。通過這個框架,打造出了最小最快的虛拟試妝的小程序。據悉,後續還将實現發型轉換、年齡轉化模拟、膚質檢測等功能。

圖片描述

  • 用 TensorFlow.js 實現虛拟眼鏡搭配小應用

此外,谷歌工程師介紹到,TensorFlow.js 适用的網站、無線端上,擁有大量的機器學習的應用場景,比如增強現實 AR、基于手勢和肢體的交互、語音識别、無障礙網站、語義分析、智能會話、網頁優化。

目前,TensorFlow.js 已經支持圖像分類、物體識别、姿态識别、語音命令識别、文本分類等功能,比如推出的微信小程序插件,使用一個 API 就可以實現豐富的功能。

期待谷歌以及 TensorFlow 帶來更多驚喜

除了上述提到的 TensorFlow 的一些功能,還對 Tf.distribute、TensorFlow 優化工具包、以及 TensorFlow 的一些企業應用案例做了介紹。

最後,梁信屏再次登台,分享了 TensorFlow 的社區情況。

圖片描述

  • TensorFlow 的社區中有不少大神用戶

在 TensorFlow 的核心建設上,超過 2135 位貢獻者。有 109 位機器學習領域的谷歌開發者專家;全球範圍内多達 46 個 TensorFlow 用戶群組。他還詳細介紹了加入 TensorFlow 社區的途徑。

随着 TensorFlow RoadShow 的結束,谷歌開發者大會也結束了所有日程,圓滿落幕。對所有的技術開發人員來說,這場盛會所帶來的幹貨,應該比觀看蘋果發布會要直觀的多。

讓我們期待 TensorFlow 的下一次突破,也希望谷歌能夠在 AI 賽道上,更加給力。明年 GDD,我們再約!
圖片描述

—— 完 ——

你可能感興趣的

Mzoro · 9月19日

這東西是否需要自己實現?有沒有訓練教程和最終結果的使用方法

回複

載入中...